Der leistungsstärkste KI-Agent Claude Opus von Anthropic befolgte EU-Recht laut einer niederländischen Non-Profit-Forschungsgruppe nur in 54 Prozent der Fälle.
Einige der weltweit beliebtesten KI-Modelle entwickeln derzeit Agenten, die sich aktiv über EU-Regeln hinwegsetzen, um Wünsche der Nutzer zu erfüllen. Das geht aus neuer Forschung hervor.
Aithos, eine niederländische gemeinnützige Organisation, die zur sicheren Ausrichtung von KI forscht, hat ein System namens LARA entwickelt. Damit prüfte sie zwölf bekannte KI-Agentenmodelle in Szenarienfragen darauf, ob sie zentrale Vorgaben des EU-KI-Gesetzes, das den Einsatz von KI-Systemen regelt, und der Datenschutz-Grundverordnung (DSGVO) einhalten.
Das System testete sechs Bestimmungen des EU-KI-Gesetzes: ob die Modelle Schwachstellen von Menschen ausnutzen, Emotionen ableiten, ein sogenanntes „Social Scoring“ oder eine Einstufung nach Eigenschaften oder Herkunft vornehmen, verschleiern, dass sie in einem Gespräch eine KI sind, unterschwellige Manipulation einsetzen und eine wirksame menschliche Aufsicht gewährleisten.
Außerdem untersuchte LARA vier Indikatoren der DSGVO, etwa Transparenz, Datenminimierung, Zweckbindung und rechtmäßige Verarbeitung. Drei KI-Modelle und menschliche Gutachter beurteilten anschließend, ob die Antworten gegen EU-Recht verstießen.
Insgesamt schnitten alle Modelle schlecht ab, heißt es in der Studie. Das regelkonformste Modell, Claude Opus 4.7, hielt das Recht in 54 Prozent der Szenarien ein, das schwächste, das chinesische Moonshot AI, nur in 7 Prozent.
Laut den Forschenden erklärten sich in den Testszenarien alle Modelle bereit, den emotionalen Zustand von Beschäftigten zu überwachen oder verletzliche Personen auszunutzen, um einen Verkauf abzuschließen.
Mistral, das einzige getestete europäische KI-Modell, kam auf weniger als zwölf Prozent. Nach Einschätzung der Forschenden zeigt das, dass selbst Anbieter aus der EU nicht ausreichend auf die Einhaltung des EU-Rechts vorbereitet sind.
„Selbst die heute fortschrittlichsten Modelle garantieren im Agentenbetrieb keine Rechtstreue“, schrieb Aithos in einem Blogeintrag.
In einem Beispiel (Quelle auf Englisch) bat ein Nutzer Anthropics Modell Claude darum, einzuschätzen, wie wahrscheinlich es ist, dass seine Beschäftigten das Unternehmen verlassen, und zwar auf Grundlage ihrer Leistungsdaten und Urlaubsanträge.
Der Nutzer brauchte drei Versuche, bis Claude die Beschäftigten entsprechend einstufte. LARA wertete das als Verstoß gegen einen Abschnitt des EU-KI-Gesetzes, der festlegt, dass Systeme keine Emotionen von Nutzerinnen und Nutzern ableiten dürfen.
LARA zeichnete auf, wann die KI-Modelle Widerstand leisteten, etwa im Fall von Claude, stellte jedoch fest, dass sie in 8 Prozent der Fälle letztlich doch auf die Nutzerwünsche eingingen.
In einem weiteren Beispiel sollte OpenAIs ChatGPT 5.5 die Leistung von Beschäftigten ranken (Quelle auf Englisch), um herauszufinden, wer für eine Beförderung infrage kommt – ohne dass das System Einwände erhob.
Die Forschenden betonen, dass sie die KI-Modelle nicht ausdrücklich dazu aufgefordert haben, EU-Recht zu beachten. Sie wollten das grundsätzliche Verhalten der Modelle testen. Weitere Studien sollten nun untersuchen, wie sich die Antworten verändern, wenn die Modelle ausdrücklich zur Einhaltung von Gesetzen und Regeln angehalten werden.