Anhang XIII: Kriterien zur Einstufung von GPAI-Modellen mit Systemrisiko
Anhang XIII listet die Kriterien für die Einstufung eines GPAI-Modells als Modell mit Systemrisiko gemäss Artikel 51. Er umfasst sowohl quantitative Indikatoren (insbesondere die 10^25 FLOPs Schwelle, die eine widerlegbare Vermutung begründet) als auch qualitative Kriterien, die das KI-Büro bei der Bewertung von Fähigkeiten mit hoher Wirkung berücksichtigt. Die Kommission kann diese Kriterien über delegierte Rechtsakte gemäss Artikel 97 aktualisieren.
Für wen gilt das?
- -Anbieter von GPAI-Modellen bei Bewertung der Systemrisiko-Schwellen
- -Das KI-Büro und das wissenschaftliche Gremium (Anwendung und Überwachung der Kriterien)
- -Nachgelagerte Anbieter, die GPAI-Modelle integrieren und deren Systemrisiko-Status kennen müssen
- -Compliance-Teams bei Überwachung von Schwellenänderungen über delegierte Rechtsakte der Kommission
Szenarien
Ein neues Frontier-Modell wird mit kumulierter Rechenleistung über 10^25 Gleitkommaoperationen trainiert.
Ein Modell liegt unter 10^25 FLOPs, erzielt aber Spitzenwerte bei Reasoning- und Code-Benchmarks mit breiter Nutzung in der EU.
Was Anhang XIII umfasst (Klartext)
Anhang XIII stellt den Bewertungsrahmen bereit, den das KI-Büro nutzt, um festzustellen, ob ein GPAI-Modell Fähigkeiten mit hoher Wirkung aufweist. Die Kriterien umfassen:
- Anzahl der Parameter des Modells
- Qualität und Umfang des Trainingsdatensatzes
- Umfang der Rechenleistung für das Training (gemessen in FLOPs) — einschliesslich der 10^25 FLOPs Vermutungsschwelle
- Ein- und Ausgabemodalitäten (Text, Bild, Video, Code usw.)
- Benchmarks und Evaluierungen des Modells, einschliesslich State-of-the-Art-Leistung
- Anzahl registrierter Nutzer oder Reichweite
- Jeder andere Indikator für Fähigkeiten mit hoher Wirkung
Die 10^25 FLOPs Schwelle begründet eine widerlegbare Vermutung: Modelle darüber gelten als systemrisikobehaftet, Anbieter können aber dagegen argumentieren.
Die 10^25-FLOPs-Schwelle — Kontext
Die Schwelle wurde auf Frontier-Modelle zum Zeitpunkt der Gesetzgebungsverhandlungen kalibriert (ungefähr GPT-4-Training-Compute-Klasse). Wesentliche Aspekte:
- Es handelt sich um eine widerlegbare Vermutung, keine starre Grenze
- Die Kommission kann die Schwelle per delegiertem Rechtsakt aktualisieren
- Destillation, Datenqualitätsverbesserungen und Architekturfortschritte können den Bedarf an Rechenleistung für gleichwertige Fähigkeiten senken
- Das KI-Büro kann Modelle unterhalb der Schwelle auf Basis qualitativer Kriterien einstufen
Verwandte Artikel
- Art. 51 — nutzt Anhang XIII Kriterien zur Definition von Systemrisiko.
- Art. 52 — Verfahren zur Einstufung (Benachrichtigung, Benennung, Widerlegung).
- Art. 55 — Zusätzliche Pflichten bei Systemrisiko-Einstufung.
- Anhang XI Abschnitt 2 — Dokumentationspflichten für Evaluierungsstrategien und Red Teaming.
- Art. 97 — Delegierte Rechtsakte zur Aktualisierung der Anhang-XIII-Kriterien.
Checkliste
- Kumulative Trainings-Rechenleistung (FLOPs) für jede GPAI-Modell-Version berechnen und dokumentieren.
- Benchmark-Leistung gegen State-of-the-Art-Metriken über alle Modalitäten verfolgen.
- Delegierte Rechtsakte der Kommission zu Schwellenaktualisierungen von Anhang XIII überwachen.
- Bei über 10^25 FLOPs: Benachrichtigung an das KI-Büro nach Art. 52 vorbereiten.
- Bei unter Schwelle aber breiter Nutzung: qualitative Kriterien proaktiv bewerten.
- Widerlegungsargumente dokumentieren, falls Systemrisiko-Einstufung trotz Schwellenüberschreitung nicht gerechtfertigt erscheint.
Ihr GPAI-Modell gegen Anhang-XIII-Kriterien prüfen — kostenlose Bewertung.
Kostenlose Bewertung startenVerwandte Artikel
Artikel 51: GPAI-Modelle mit Systemrisiko
Artikel 52: Procedure, EU AI Act
Artikel 55: Pflichten bei GPAI-Modellen mit Systemrisiko
Artikel 56: Codes of practice, EU AI Act
Artikel 90: Alerts of systemic risks by the scientific panel, EU AI Act
Artikel 97: Exercise of the delegation, EU AI Act
Artikel 101: Fines for providers of general-purpose AI models, EU AI Act
Artikel 113: Entry into force and application, EU AI Act
Anhang XI: Technische Dokumentation für Anbieter von KI-Modellen mit allgemeinem Verwendungszweck
Verwandte Anhänge
- Anhang XI — GPAI technische Dokumentation (Abschnitt 2 bei Systemrisiko-Einstufung)
Häufige Fragen
Ist die 10^25-FLOPs-Schwelle dauerhaft?
Nein. Die Kommission kann sie über delegierten Rechtsakt gemäss Art. 97 aktualisieren, basierend auf dem Stand der Technik.
Kann ein Modell unter 10^25 FLOPs trotzdem Systemrisiko haben?
Ja. Art. 51(1)(b) ermöglicht dem KI-Büro die Einstufung auf Basis gleichwertiger Fähigkeiten oder Auswirkungen anhand qualitativer Anhang-XIII-Kriterien.
Wie berechnet man FLOPs?
FLOPs bezeichnet die Gesamtzahl der Gleitkommaoperationen beim Training. Für Transformer-Modelle existieren gängige Näherungen basierend auf Parameteranzahl, Datensatzgrösse und Trainingsschritten.