Wer prüft eigentlich die Prüfer? Diese Frage klingt philosophisch, ist aber inzwischen eine der drängendsten Governance-Debatten rund um den EU AI Act. Denn während Unternehmen ihre KI-Systeme auf Hochrisiko-Konformität vorbereiten, baut die EU gerade eine zweistufige Kontrollarchitektur auf – und die entscheidende Ebene, die Akkreditierung der Konformitätsbewertungsstellen selbst, läuft weitgehend unter dem öffentlichen Radar.

Das zweistufige Kontrollsystem: Wer steckt hinter der KI-Zertifizierung?

Der EU AI Act etabliert keine einfache Prüf-und-Stempel-Logik. Er baut auf einem bereits existierenden europäischen Konformitätsbewertungssystem auf und erweitert es um KI-spezifische Anforderungen. Die Grundstruktur ist: KI-Anbieter von Hochrisiko-Systemen müssen nachweisen, dass ihre Systeme die gesetzlichen Anforderungen erfüllen. In bestimmten Fällen – nämlich wenn das KI-System Teil eines Produkts ist, das ohnehin unter sektorale EU-Richtlinien fällt, etwa Medizinprodukte oder Maschinen – ist dafür eine externe Konformitätsbewertung durch eine sogenannte Notified Body verpflichtend.

Diese Konformitätsbewertungsstellen sind keine frei schwebenden Prüfinstitute. Sie werden von nationalen Akkreditierungsstellen nach harmonisierten Normen akkreditiert. In Deutschland ist das die DAkkS – die Deutsche Akkreditierungsstelle. Die DAkkS hat auf ihrer Konferenz AKKKO 2025 den EU AI Act explizit als Schwerpunktthema benannt und stellt klar, dass der Act für eine Reihe von KI-Produktklassen eine Konformitätsbewertung erfordert.

Die nationalen Akkreditierungsstellen selbst unterliegen ihrerseits EU-rechtlichen Anforderungen aus der Verordnung (EG) Nr. 765/2008 und einer europäischen Peer-Review-Aufsicht durch das Netzwerk European co-operation for Accreditation (EA). Auf der obersten Ebene stehen EU-Kommission und Mitgliedstaaten, die benannte Stellen im NANDO-Verzeichnis veröffentlichen und überwachen. Das klingt robust. Die Frage ist, ob diese Architektur für KI-spezifische Prüfanforderungen tatsächlich gerüstet ist.

Was der AI Act tatsächlich vorschreibt – und was er offen lässt

Hier ist Nüchternheit gefragt. Die Grundstruktur des AI Act – Risikoklassen, Pflichten, Konformitätsbewertung – ist politisch beschlossen. Aber die technischen Details, also die harmonisierten Normen, die konkreten Auditleitfäden, die genauen Anforderungen an Konformitätsbewertungsstellen für KI, sind Stand heute noch in Arbeit. Eine Fraunhofer-Analyse zur KI-Zertifizierung im AI-Act-Kontext stellt das explizit klar: Normen und Prüfverfahren seien noch auszuarbeiten.

Wichtig ist auch: Nicht jedes KI-System muss durch eine externe Stelle. Für viele Hochrisiko-KI-Systeme außerhalb regulierter Produktsektoren sieht der AI Act ein Self-Assessment vor – also eine interne Konformitätsbewertung durch den Anbieter selbst. Das ist kein Freifahrtschein. Self-Assessment ist ein formalisierter, gesetzlich geregelter Prozess, der dem Anbieter die volle Verantwortung überträgt. Wer dabei schludert und später bei einer Marktüberwachungsbehörde auffliegt, riskiert empfindliche Konsequenzen.

Ein häufiges Missverständnis in der Beratungsbranche: Einige Anbieter kommunizieren, Unternehmen müssten ISO/IEC 42001, ISO 27001 oder ISO 9001 zwingend besitzen, um AI-Act-konform zu sein. Das stimmt so nicht. Diese Normen sind gut geeignet, um Managementsystem-Anforderungen abzubilden, und sie werden voraussichtlich in harmonisierten Normen oder Vergabebedingungen faktisch relevant werden. Eine explizite gesetzliche Pflicht, genau diese Zertifizierungen zu halten, steht im AI Act aber nicht. Wer das pauschal behauptet, beschreibt eine Interpretation, keine Rechtslage.

Die Ethik-Dimension: Von Leitlinien zu Zertifikaten

Parallel zur gesetzlichen Konformitätsbewertung läuft eine zweite Debatte: KI-Ethik-Zertifizierung. Die EU-Kommission hat bereits 2019 Ethikleitlinien für vertrauenswürdige KI veröffentlicht, entwickelt von der High-Level Expert Group on AI. Sie definieren sieben Kernanforderungen: menschliche Aufsicht, technische Robustheit, Datenschutz, Transparenz, Nichtdiskriminierung, gesellschaftliches Wohlergehen und Rechenschaftspflicht. 2020 folgte die Assessment List for Trustworthy AI (ALTAI) als Bewertungs-Checkliste.

Diese Leitlinien sind rechtlich nicht bindend. Sie dienen aber als ethischer Referenzrahmen, an dem sich viele Zertifizierungsprogramme orientieren – und sie sind die Grundlage für eine wachsende Zahl von Ethik-Labeln und Trust-Siegeln, die Unternehmen über gesetzliche Mindestanforderungen hinaus Vertrauen signalisieren sollen. Das ist ein legitimes Instrument. Aber es bringt eine Verwässerungsgefahr mit sich: Wenn jeder Anbieter sein eigenes „Trustworthy AI“-Label kreiert, ohne dass eine akkreditierte Stelle dahintersteht, wird das Label zum Marketingvehikel.

Meine Einschätzung dazu ist eindeutig: Ein Ethik-Zertifikat, das nicht auf einer akkreditierten Prüfstelle basiert und dessen Kriterien der Zertifizierer selbst definiert hat, ist wenig wert. Der Markt braucht hier dringend Klarheit darüber, was ein valides Zertifikat ausmacht – und was nicht.

Die UNESCO-Empfehlung zur Ethik Künstlicher Intelligenz, 2021 von 193 Mitgliedstaaten angenommen, unterstreicht diese Forderung. Sie betont explizit, dass nur interne Überprüfungen nicht ausreichen. Es sollen externe Überwachungsmechanismen mit Transparenzpflichten und multiperspektivischer Beteiligung etabliert werden.

Wer kontrolliert die Kontrolleure? Die Glaubwürdigkeitsfrage

Die Kontrollkette auf dem Papier ist klar: Akkreditierungsstellen wie die DAkkS akkreditieren Konformitätsbewertungsstellen. Diese prüfen KI-Systeme. Die Akkreditierungsstellen selbst unterliegen europäischem Peer-Review. Aber wie gut ist dieses System auf KI-spezifische Prüfanforderungen vorbereitet?

Das ist die eigentlich unbequeme Frage. KI-Systeme sind keine Aufzüge und keine Medizinprodukte. Bias-Tests, Robustheitsprüfungen, Transparenzanforderungen bei Entscheidungsalgorithmen – das erfordert Prüfkompetenz, die sich fundamental von klassischer Produktzertifizierung unterscheidet. Welche Qualifikationsanforderungen müssen Prüfer von Hochrisiko-KI-Systemen erfüllen? Wie wird sichergestellt, dass eine akkreditierte Stelle, die bisher Aufzüge zertifiziert hat, die nötigen KI-spezifischen Kompetenzen aufbaut? Harmonisierte Normen für diesen Bereich sind noch nicht final. Pilotprojekte und erste Anforderungskataloge entstehen gerade – aber von einem funktionierenden, flächendeckenden System ist die EU noch weit entfernt.

Das Fraunhofer-Analysedokument zur KI-Zertifizierung bringt das auf den Punkt: Die gesetzliche Zertifizierung nach AI Act gilt nur für Systeme, die aufgrund anderer Gesetze ohnehin eine Zertifizierung benötigen. Alle übrigen KI-Systeme bleiben auf freiwillige Zertifizierungen angewiesen, deren Vorgaben die Zertifizierer selbst definieren. Das ist ein strukturelles Problem, das den gesamten Markt für KI-Konformitätsbewertung betrifft.

ISO/IEC 42001 ist kein Ersatz für produktspezifische AI-Act-Konformität – aber eine praxistaugliche Grundlage für KI-Governance-Systeme. (Symbolbild)

ISO 42001 und der Managementsystem-Ansatz: Pragmatismus oder Lückenfüller?

In der Praxis orientieren sich viele Unternehmen derzeit an ISO/IEC 42001, dem internationalen Standard für KI-Managementsysteme. Ergänzt wird dieser häufig durch ISO 27001 für Informationssicherheit und ISO 9001 für Qualitätsmanagement. Die Idee dahinter: Wer ein funktionierendes Managementsystem für KI nachweisen kann, hat eine solide Grundlage für AI-Act-Compliance und kann das gegenüber Kunden, Behörden und Partnern dokumentieren.

Das ist ein pragmatischer Ansatz, der für größere Organisationen durchaus Sinn ergibt. Ein integriertes Compliance-System, das Datenschutz, Informationssicherheit, Qualität und KI-Governance zusammenführt, ist effizienter als parallele Einzelprojekte. Aber es ist wichtig, diesen Ansatz richtig einzuordnen: ISO 42001 ist ein Managementsystem-Standard, kein Produktzertifikat. Er bescheinigt, dass ein Unternehmen KI-Risiken systematisch managt – nicht, dass ein spezifisches KI-System den Anforderungen des AI Act entspricht. Diese Unterscheidung ist für Einkauf, Beschaffung und Behörden entscheidend.

Governance-Strukturen für KI – klare Verantwortlichkeiten, Risikobewertungen, Dokumentationsprozesse – sind unabhängig von der Zertifizierungsfrage sinnvoll. Unternehmen, die jetzt ihre KI-Governance-Strukturen aufbauen, schaffen damit eine Basis, die bei der späteren Zertifizierung hilft und gleichzeitig operativ nützlich ist.

Ethik-Zertifikat versus Rechtskonformität: Zwei Kategorien, die man nicht verwechseln darf

Ein Punkt, der in der öffentlichen Debatte regelmäßig für Verwirrung sorgt: Ethik-Zertifizierung und Rechtskonformitäts-Zertifizierung sind nicht dasselbe. Ein Ethik-Label, das auf den EU-Leitlinien oder der UNESCO-Empfehlung basiert, adressiert oft ethische Prinzipien jenseits des rechtlichen Minimums – Fairness, gesellschaftliche Auswirkungen, ökologische Nachhaltigkeit. Das kann wichtig sein. Aber es garantiert keine vollständige AI-Act-Compliance.

Umgekehrt kann ein System, das alle formalen Anforderungen des AI Act erfüllt, dennoch ethisch problematische Aspekte haben, die rechtlich noch nicht geregelt sind. Wer als Beschaffer oder Behörde ein KI-System einkauft, sollte deshalb beide Dimensionen prüfen: Ist die gesetzliche Konformitätsbewertung vorhanden? Und auf welchem Standard basiert ein Ethik-Zertifikat, falls eines vorliegt?

Die praktische Prüffrage lautet: Ist die Zertifizierungsstelle selbst akkreditiert – etwa durch die DAkkS oder eine andere nationale Akkreditierungsstelle? Und basiert das Zertifikat auf anerkannten Normen und EU-Leitlinien? Wer diese beiden Fragen nicht beantworten kann, sollte das Zertifikat mit erheblicher Skepsis betrachten. Informationen zu einschlägigen Anforderungen und dem Stand der harmonisierten Normen lassen sich unter anderem bei der EU-Kommission zu den Ethikleitlinien für vertrauenswürdige KI nachschlagen.

Was Unternehmen jetzt konkret tun können

Der Aufbau des europäischen Akkreditierungssystems für KI-Konformitätsbewertungsstellen ist im Gange, aber noch nicht abgeschlossen. Das bedeutet für Unternehmen: Abwarten ist keine Strategie. Wer jetzt handelt, hat einen klaren Vorteil.

Erster Schritt: Risikoklassifizierung der eigenen KI-Systeme. Welche fallen unter die Hochrisiko-Kategorie des AI Act? Das hängt vom Anwendungsfall ab – KI in kritischer Infrastruktur, Bildung, Strafverfolgung oder als Teil von Medizinprodukten ist anders zu bewerten als eine KI-gestützte Suchfunktion im internen Intranet.

Zweiter Schritt: Klären, ob eine externe Konformitätsbewertung verpflichtend ist oder ob Self-Assessment ausreicht. Für viele Systeme gilt letzteres – aber Self-Assessment muss ernsthaft durchgeführt und dokumentiert werden. KI-Governance-Strukturen und -prozesse, die dabei helfen, sollten jetzt aufgebaut werden, nicht nach einer Marktaufsichtsprüfung.

Dritter Schritt: Wer Zertifikate als Nachweis gegenüber Kunden oder Behörden nutzen will, prüft, welche Zertifizierungsstellen akkreditiert sind und auf welchen Normen ihre Programme basieren. Managementsystem-Ansätze nach ISO/IEC 42001 können dabei eine sinnvolle Grundlage sein – als Ergänzung, nicht als Ersatz für produktspezifische Anforderungen.

Vierter Schritt: Die Normenentwicklung im Blick behalten. CEN/CENELEC und ISO/IEC entwickeln derzeit KI-spezifische Standards weiter. Was heute Best Practice ist, kann in zwei Jahren harmonisierte Norm und damit de-facto-Pflicht sein. Wer die Entwicklungen bei der DAkkS und dem europäischen Akkreditierungsnetz EA verfolgt, bleibt auf dem aktuellen Stand.

Marktdynamik und Wettbewerbsverzerrung: Ein unterschätztes Risiko

Ein Aspekt, der in der technisch-juristischen Debatte oft untergeht, ist die wirtschaftliche Dimension der KI-Zertifizierung. Wenn akkreditierte Konformitätsbewertungsstellen für KI noch rar sind und die Nachfrage durch den AI Act gleichzeitig steigt, entsteht eine Engpasssituation, die kleinere und mittlere Unternehmen deutlich stärker trifft als große Konzerne. Ein DAX-Konzern kann sich eine langwierige und teure externe Prüfung leisten und verfügt über juristische und technische Ressourcen, um Self-Assessment-Prozesse professionell aufzusetzen. Ein mittelständisches Softwareunternehmen, das ein Hochrisiko-KI-System für Personalentscheidungen entwickelt, steht vor ganz anderen Kapazitätsproblemen.

Hinzu kommt ein weiteres Wettbewerbsproblem: Anbieter aus Drittstaaten, die ihre KI-Systeme auf dem EU-Markt vertreiben wollen, unterliegen grundsätzlich denselben Anforderungen. Aber die Marktüberwachung für importierte KI-Systeme ist noch kaum operativ. Wenn europäische Unternehmen konsequent geprüft werden, während Importe faktisch unkontrolliert bleiben, entsteht ein struktureller Wettbewerbsnachteil für EU-Anbieter, der politisch kaum zu rechtfertigen ist. Die EU-Kommission hat dieses Problem benannt, eine belastbare Lösung steht aber noch aus.

Für mittelständische Unternehmen empfiehlt es sich deshalb, frühzeitig Branchenverbände und Kammern einzubinden, die zunehmend Orientierungshilfen zur KI-Zertifizierung anbieten. Die spezifischen KI-Governance-Pflichten, die Unternehmen unterschiedlicher Größe treffen, hängen stark vom konkreten Einsatzbereich und der Systemkategorie ab – eine pauschale Antwort gibt es hier nicht.

Internationale Perspektive: Wie gehen andere Regulierungsräume mit dem Problem um?

Die EU ist bei der Regulierung von KI-Zertifizierung international keineswegs allein, aber sie geht einen besonders systematischen Weg. Die USA setzen bislang stärker auf sektorspezifische Regulierung und freiwillige Frameworks – etwa das NIST AI Risk Management Framework –, ohne ein verbindliches, horizontal wirkendes Konformitätsbewertungssystem aufzubauen. China wiederum hat eigene Anforderungen für bestimmte KI-Dienste eingeführt, die vor allem auf algorithmische Empfehlungssysteme und generative KI abzielen, aber konzeptionell anders strukturiert sind als der EU-Ansatz.

Diese internationale Divergenz hat direkte Konsequenzen für Unternehmen, die global tätig sind. Eine Konformitätsbewertung nach EU AI Act schafft keine automatische Anerkennung in anderen Regulierungsräumen und umgekehrt. Wer KI-Systeme in mehreren Märkten betreibt, muss parallele Compliance-Prozesse managen – und dabei darauf achten, dass die genutzten Zertifizierungen in den jeweiligen Märkten tatsächlich anerkannt werden. Gegenseitige Anerkennungsabkommen für KI-Zertifizierung zwischen der EU und wichtigen Handelspartnern befinden sich allenfalls in einer frühen Diskussionsphase. Das ist ein weiterer Grund, warum ein robustes, international anschlussfähiges Akkreditierungssystem innerhalb der EU nicht nur eine regulatorische, sondern auch eine wirtschaftspolitische Priorität sein sollte.

Die Meta-Governance-Frage bleibt ungelöst

Die EU baut gerade ein System auf, das KI-Konformitätsbewertung regulieren soll. Das ist richtig und nötig. Aber die eigentliche Herausforderung liegt tiefer: Akkreditierungsstellen und Konformitätsbewertungsstellen müssen KI-spezifische Prüfkompetenz aufbauen, die es in dieser Form bisher kaum gibt. Bias-Erkennung, Robustheitstests, Transparenzprüfungen bei Black-Box-Modellen – das ist technisch anspruchsvoll und methodisch noch nicht standardisiert.

Meine zweite persönliche Einschätzung: Die EU-Kommission und die nationalen Akkreditierungsstellen sollten diesen Kompetenzaufbau mit deutlich mehr Priorität und Ressourcen betreiben. Ein Akkreditierungssystem, das formal funktioniert, aber inhaltlich auf unzureichend qualifizierte Prüfer setzt, schafft Sicherheit nur auf dem Papier. Das wäre für das Vertrauen in KI-Zertifizierung langfristig schädlicher als gar kein Zertifizierungssystem.

Der Unterschied zwischen einem glaubwürdigen und einem unglaubwürdigen Zertifizierungsregime liegt nicht im Stempel, sondern in der Qualität der Prüfer dahinter. Wer kontrolliert, dass die Kontrolleure tatsächlich kompetent sind – und nicht nur formal akkreditiert?

Diese Frage sollte die KI-Governance-Debatte in der EU der nächsten Jahre bestimmen. Welche Maßnahmen zur Qualitätssicherung der Prüfer planen DAkkS, EA und EU-Kommission konkret – und bis wann?

KI-Zertifizierung in der EU: Wer kontrolliert die Konformitätsbewertung?

Das zweistufige Kontrollsystem: Wer steckt hinter der KI-Zertifizierung?

Was der AI Act tatsächlich vorschreibt – und was er offen lässt

Die Ethik-Dimension: Von Leitlinien zu Zertifikaten

Wer kontrolliert die Kontrolleure? Die Glaubwürdigkeitsfrage

ISO 42001 und der Managementsystem-Ansatz: Pragmatismus oder Lückenfüller?

Ethik-Zertifikat versus Rechtskonformität: Zwei Kategorien, die man nicht verwechseln darf

Was Unternehmen jetzt konkret tun können

Marktdynamik und Wettbewerbsverzerrung: Ein unterschätztes Risiko

Internationale Perspektive: Wie gehen andere Regulierungsräume mit dem Problem um?

Die Meta-Governance-Frage bleibt ungelöst

Mitreden & diskutieren

Das zweistufige Kontrollsystem: Wer steckt hinter der KI-Zertifizierung?

Was der AI Act tatsächlich vorschreibt – und was er offen lässt

Die Ethik-Dimension: Von Leitlinien zu Zertifikaten

Wer kontrolliert die Kontrolleure? Die Glaubwürdigkeitsfrage

ISO 42001 und der Managementsystem-Ansatz: Pragmatismus oder Lückenfüller?

Ethik-Zertifikat versus Rechtskonformität: Zwei Kategorien, die man nicht verwechseln darf

Was Unternehmen jetzt konkret tun können

Marktdynamik und Wettbewerbsverzerrung: Ein unterschätztes Risiko

Internationale Perspektive: Wie gehen andere Regulierungsräume mit dem Problem um?

Die Meta-Governance-Frage bleibt ungelöst

Auch interessant

Medizin-KI und die Frist bis 2028: Was die Verschiebung wirklich bedeutet

Cloud-Gaming in Deutschland: Was Xbox Game Pass und PlayStation Plus wirklich bieten

Streaming-Tarife 2026: Wie Netflix und Disney Plus den Markt umbauen