Anhänge, verwiesen in Artikel 51Artikel Annex XIII

Anhang XIII: Kriterien zur Einstufung von GPAI-Modellen mit Systemrisiko

Anwendbar seit 2. Aug. 2025ca. 566 WörterEUR-Lex geprüft Apr. 2026

Anhang XIII listet die Kriterien für die Einstufung eines GPAI-Modells als Modell mit Systemrisiko gemäss Artikel 51. Er umfasst sowohl quantitative Indikatoren (insbesondere die 10^25 FLOPs Schwelle, die eine widerlegbare Vermutung begründet) als auch qualitative Kriterien, die das KI-Büro bei der Bewertung von Fähigkeiten mit hoher Wirkung berücksichtigt. Die Kommission kann diese Kriterien über delegierte Rechtsakte gemäss Artikel 97 aktualisieren.

Kostenlose Bewertung starten Alle Artikel

Für wen gilt das?

-Anbieter von GPAI-Modellen bei Bewertung der Systemrisiko-Schwellen
-Das KI-Büro und das wissenschaftliche Gremium (Anwendung und Überwachung der Kriterien)
-Nachgelagerte Anbieter, die GPAI-Modelle integrieren und deren Systemrisiko-Status kennen müssen
-Compliance-Teams bei Überwachung von Schwellenänderungen über delegierte Rechtsakte der Kommission

Szenarien

Ein neues Frontier-Modell wird mit kumulierter Rechenleistung über 10^25 Gleitkommaoperationen trainiert.

Vermutung des Systemrisikos nach Anhang XIII / Art. 51(2). Anbieter muss das KI-Büro benachrichtigen und Art. 55 einhalten.

Ref. Anhang XIII + Art. 51(2)

Ein Modell liegt unter 10^25 FLOPs, erzielt aber Spitzenwerte bei Reasoning- und Code-Benchmarks mit breiter Nutzung in der EU.

Das KI-Büro kann dennoch Systemrisiko auf Basis qualitativer Kriterien (Fähigkeiten mit hoher Wirkung, Reichweite, Nutzerzahl) feststellen.

Ref. Anhang XIII + Art. 51(1)(b)

Was Anhang XIII umfasst (Klartext)

Anhang XIII stellt den Bewertungsrahmen bereit, den das KI-Büro nutzt, um festzustellen, ob ein GPAI-Modell Fähigkeiten mit hoher Wirkung aufweist. Die Kriterien umfassen:

Anzahl der Parameter des Modells
Qualität und Umfang des Trainingsdatensatzes
Umfang der Rechenleistung für das Training (gemessen in FLOPs), einschliesslich der 10^25 FLOPs Vermutungsschwelle
Ein- und Ausgabemodalitäten (Text, Bild, Video, Code usw.)
Benchmarks und Evaluierungen des Modells, einschliesslich State-of-the-Art-Leistung
Anzahl registrierter Nutzer oder Reichweite
Jeder andere Indikator für Fähigkeiten mit hoher Wirkung

Die 10^25 FLOPs Schwelle begründet eine widerlegbare Vermutung: Modelle darüber gelten als systemrisikobehaftet, Anbieter können aber dagegen argumentieren.

Die 10^25-FLOPs-Schwelle, Kontext

Die Schwelle wurde auf Frontier-Modelle zum Zeitpunkt der Gesetzgebungsverhandlungen kalibriert (ungefähr GPT-4-Training-Compute-Klasse). Wesentliche Aspekte:

Es handelt sich um eine widerlegbare Vermutung, keine starre Grenze
Die Kommission kann die Schwelle per delegiertem Rechtsakt aktualisieren
Destillation, Datenqualitätsverbesserungen und Architekturfortschritte können den Bedarf an Rechenleistung für gleichwertige Fähigkeiten senken
Das KI-Büro kann Modelle unterhalb der Schwelle auf Basis qualitativer Kriterien einstufen

Checkliste

Kumulative Trainings-Rechenleistung (FLOPs) für jede GPAI-Modell-Version berechnen und dokumentieren.
Benchmark-Leistung gegen State-of-the-Art-Metriken über alle Modalitäten verfolgen.
Delegierte Rechtsakte der Kommission zu Schwellenaktualisierungen von Anhang XIII überwachen.
Bei über 10^25 FLOPs: Benachrichtigung an das KI-Büro nach Art. 52 vorbereiten.
Bei unter Schwelle aber breiter Nutzung: qualitative Kriterien proaktiv bewerten.
Widerlegungsargumente dokumentieren, falls Systemrisiko-Einstufung trotz Schwellenüberschreitung nicht gerechtfertigt erscheint.

Offiziellen Text auf EUR-Lex lesen

Ihr GPAI-Modell gegen Anhang-XIII-Kriterien prüfen, kostenlose Bewertung.

Kostenlose Bewertung starten

Häufige Fragen

Ist die 10^25-FLOPs-Schwelle dauerhaft?

Nein. Die Kommission kann sie über delegierten Rechtsakt gemäss Art. 97 aktualisieren, basierend auf dem Stand der Technik.

Kann ein Modell unter 10^25 FLOPs trotzdem Systemrisiko haben?

Ja. Art. 51(1)(b) ermöglicht dem KI-Büro die Einstufung auf Basis gleichwertiger Fähigkeiten oder Auswirkungen anhand qualitativer Anhang-XIII-Kriterien.

Wie berechnet man FLOPs?

FLOPs bezeichnet die Gesamtzahl der Gleitkommaoperationen beim Training. Für Transformer-Modelle existieren gängige Näherungen basierend auf Parameteranzahl, Datensatzgrösse und Trainingsschritten.

Auf dieser Seite

Begriffe

10^25 FLOPs: Widerlegbare Rechenschwelle: GPAI-Modelle, die mit kumulierten Gleitkommaoperationen über diesem Wert trainiert wurden, gelten als systemrisikobehaftet.
Fähigkeiten mit hoher Wirkung: Fähigkeiten, die den fortschrittlichsten GPAI-Modellen entsprechen oder diese übertreffen, bewertet anhand technischer Werkzeuge, Indikatoren und Benchmarks aus Anhang XIII.
Delegierter Rechtsakt: Ein Rechtsinstrument der Kommission zur Aktualisierung oder Ergänzung nicht wesentlicher Elemente der Verordnung, einschliesslich Anhang-XIII-Schwellen.

Höchststrafen (Art. 99)

3 % Umsatz / Bis 15 Mio. EUR oder 3 % des weltweiten Jahresumsatzes für GPAI-Verstösse nach Art. 101
KMU / Start-ups: Niedrigere Deckel für KMU und Start-ups nach Art. 101
Unterlassene Benachrichtigung des KI-Büros bei Erfüllung der Anhang-XIII-Kriterien ist ein Verstoss nach Kapitel V.

Zeitachse

2. Aug. 2025
Anhang XIII Kriterien gelten im Rahmen der Kapitel V GPAI-Pflichten.

Auf einen Blick

Artikel: Annex XIII
Status: Anwendbar
Zeitpunkt: 2. Aug. 2025
Aktualisiert: 11. Apr. 2026

Ist Ihr KI-System hochriskant?

Finden Sie es in 2 Minuten heraus, 5 Fragen, sofortige Risikoklasse und die zitierten Pflichten dazu.

Kostenlosen Risiko-Check starten Oder: die vollständige Bewertung