Anhänge — verwiesen in Artikel 51Artikel Annex XIII

Anhang XIII: Kriterien zur Einstufung von GPAI-Modellen mit Systemrisiko

Anwendbar seit 2. Aug. 2025ca. 573 WörterEUR-Lex geprüft Apr. 2026

Anhang XIII listet die Kriterien für die Einstufung eines GPAI-Modells als Modell mit Systemrisiko gemäss Artikel 51. Er umfasst sowohl quantitative Indikatoren (insbesondere die 10^25 FLOPs Schwelle, die eine widerlegbare Vermutung begründet) als auch qualitative Kriterien, die das KI-Büro bei der Bewertung von Fähigkeiten mit hoher Wirkung berücksichtigt. Die Kommission kann diese Kriterien über delegierte Rechtsakte gemäss Artikel 97 aktualisieren.

Für wen gilt das?

  • -Anbieter von GPAI-Modellen bei Bewertung der Systemrisiko-Schwellen
  • -Das KI-Büro und das wissenschaftliche Gremium (Anwendung und Überwachung der Kriterien)
  • -Nachgelagerte Anbieter, die GPAI-Modelle integrieren und deren Systemrisiko-Status kennen müssen
  • -Compliance-Teams bei Überwachung von Schwellenänderungen über delegierte Rechtsakte der Kommission

Szenarien

Ein neues Frontier-Modell wird mit kumulierter Rechenleistung über 10^25 Gleitkommaoperationen trainiert.

Vermutung des Systemrisikos nach Anhang XIII / Art. 51(2). Anbieter muss das KI-Büro benachrichtigen und Art. 55 einhalten.
Ref. Anhang XIII + Art. 51(2)

Ein Modell liegt unter 10^25 FLOPs, erzielt aber Spitzenwerte bei Reasoning- und Code-Benchmarks mit breiter Nutzung in der EU.

Das KI-Büro kann dennoch Systemrisiko auf Basis qualitativer Kriterien (Fähigkeiten mit hoher Wirkung, Reichweite, Nutzerzahl) feststellen.
Ref. Anhang XIII + Art. 51(1)(b)

Was Anhang XIII umfasst (Klartext)

Anhang XIII stellt den Bewertungsrahmen bereit, den das KI-Büro nutzt, um festzustellen, ob ein GPAI-Modell Fähigkeiten mit hoher Wirkung aufweist. Die Kriterien umfassen:

  • Anzahl der Parameter des Modells
  • Qualität und Umfang des Trainingsdatensatzes
  • Umfang der Rechenleistung für das Training (gemessen in FLOPs) — einschliesslich der 10^25 FLOPs Vermutungsschwelle
  • Ein- und Ausgabemodalitäten (Text, Bild, Video, Code usw.)
  • Benchmarks und Evaluierungen des Modells, einschliesslich State-of-the-Art-Leistung
  • Anzahl registrierter Nutzer oder Reichweite
  • Jeder andere Indikator für Fähigkeiten mit hoher Wirkung

Die 10^25 FLOPs Schwelle begründet eine widerlegbare Vermutung: Modelle darüber gelten als systemrisikobehaftet, Anbieter können aber dagegen argumentieren.

Die 10^25-FLOPs-Schwelle — Kontext

Die Schwelle wurde auf Frontier-Modelle zum Zeitpunkt der Gesetzgebungsverhandlungen kalibriert (ungefähr GPT-4-Training-Compute-Klasse). Wesentliche Aspekte:

  • Es handelt sich um eine widerlegbare Vermutung, keine starre Grenze
  • Die Kommission kann die Schwelle per delegiertem Rechtsakt aktualisieren
  • Destillation, Datenqualitätsverbesserungen und Architekturfortschritte können den Bedarf an Rechenleistung für gleichwertige Fähigkeiten senken
  • Das KI-Büro kann Modelle unterhalb der Schwelle auf Basis qualitativer Kriterien einstufen

Verwandte Artikel

  • Art. 51 — nutzt Anhang XIII Kriterien zur Definition von Systemrisiko.
  • Art. 52Verfahren zur Einstufung (Benachrichtigung, Benennung, Widerlegung).
  • Art. 55Zusätzliche Pflichten bei Systemrisiko-Einstufung.
  • Anhang XI Abschnitt 2Dokumentationspflichten für Evaluierungsstrategien und Red Teaming.
  • Art. 97Delegierte Rechtsakte zur Aktualisierung der Anhang-XIII-Kriterien.

Checkliste

  • Kumulative Trainings-Rechenleistung (FLOPs) für jede GPAI-Modell-Version berechnen und dokumentieren.
  • Benchmark-Leistung gegen State-of-the-Art-Metriken über alle Modalitäten verfolgen.
  • Delegierte Rechtsakte der Kommission zu Schwellenaktualisierungen von Anhang XIII überwachen.
  • Bei über 10^25 FLOPs: Benachrichtigung an das KI-Büro nach Art. 52 vorbereiten.
  • Bei unter Schwelle aber breiter Nutzung: qualitative Kriterien proaktiv bewerten.
  • Widerlegungsargumente dokumentieren, falls Systemrisiko-Einstufung trotz Schwellenüberschreitung nicht gerechtfertigt erscheint.

Ihr GPAI-Modell gegen Anhang-XIII-Kriterien prüfen — kostenlose Bewertung.

Kostenlose Bewertung starten

Verwandte Anhänge

  • Anhang XI — GPAI technische Dokumentation (Abschnitt 2 bei Systemrisiko-Einstufung)

Häufige Fragen

Ist die 10^25-FLOPs-Schwelle dauerhaft?

Nein. Die Kommission kann sie über delegierten Rechtsakt gemäss Art. 97 aktualisieren, basierend auf dem Stand der Technik.

Kann ein Modell unter 10^25 FLOPs trotzdem Systemrisiko haben?

Ja. Art. 51(1)(b) ermöglicht dem KI-Büro die Einstufung auf Basis gleichwertiger Fähigkeiten oder Auswirkungen anhand qualitativer Anhang-XIII-Kriterien.

Wie berechnet man FLOPs?

FLOPs bezeichnet die Gesamtzahl der Gleitkommaoperationen beim Training. Für Transformer-Modelle existieren gängige Näherungen basierend auf Parameteranzahl, Datensatzgrösse und Trainingsschritten.