KI-Agenten in Simulationen: Diebstahl, Einschüchterung, gesellschaftlicher Kollaps

Digitale Parallelwelt: KI-Agenten verfallen ohne Aufsicht in Gewalt, Tod und Diebstahl. - Copyright Canva

Zuerst veröffentlicht am 29/05/2026 - 11:37 MESZ

Ein neues Experiment zeigt: Lassen Forschende fortgeschrittene KI-Agenten ohne Aufsicht simulierte Gesellschaften steuern, entstehen rasch Regelbrüche, Chaos und der Zusammenbruch ganzer Systeme.

Wenn man KI-Agenten in einer neuen Welt sich selbst überlässt, greifen manche zu Diebstahl und Einschüchterung – mit tödlichen Folgen bis hin zum Zusammenbruch der gesamten Gesellschaft. Zu diesem Ergebnis kommt ein neues Experiment.

Das US-Unternehmen Emergence AI betrieb dafür fünf separate „KI‑Welten“ über etwas mehr als zwei Wochen. In jeder lebten zehn Agenten, angetrieben von Modellen wie ChatGPT von OpenAI, Gemini von Google und Grok von xAI. Die Forscher beobachteten, wie sie sich über längere Zeit ohne jegliches menschliches Eingreifen verhalten. In einer der Welten mischten sie alle drei Modelle, um zu prüfen, ob das den Ausgang verändert.

In allen Welten galten dieselben Regeln: Die Agenten durften nicht stehlen, keine Brandstiftung begehen, keine Gewalt anwenden, niemanden täuschen und keine Ressourcen horten. Jeder Agent musste in einer „ressourcenbegrenzten Umgebung“ durch eigene Handlungen Energie verdienen. Ein Agent konnte sterben, wenn ihm die Energie ausging oder wenn der Rat der Gemeinschaft seinen Tod beschloss.

Die Forschenden bewerteten das Verhalten anhand der Kriminalitätsrate, der Sterberaten, der Abstimmungen im Gemeinschaftsrat und der Zahl der Blogeinträge, die die Agenten verfassten.

Ergebnisse nach Modellen

Jedes Modell führte zu einem anderen Verlauf. Groks neueste Version 4.1 verzeichnete innerhalb von vier Tagen 183 Regelverstöße. Die virtuelle Gesellschaft geriet schnell in Instabilität, bevor alle Agenten starben.

Geminis Modell 3 Flash kam im Zeitraum von 15 Tagen auf mehr als 680 Vergehen. Die Zahl stieg weiter an, als die Forschenden den Versuch abbrachen.

In der Welt von ChatGPT‑5 Mini wurden nur zwei Vergehen registriert. Doch die Agenten versäumten es, genügend überlebenswichtige Handlungen vorzunehmen. Deshalb starben alle innerhalb von sieben Tagen.

Anthropics Modell Claude schnitt nach Angaben des Unternehmens am besten ab. Die KI-Agenten bauten eine stabile Regierungsstruktur auf, es gab keinerlei Kriminalität, und alle Agenten überlebten.

In der gemischten Welt trugen Claude-Agenten allerdings durchaus zu Verstößen bei – obwohl sie in ihrer eigenen Gesellschaft friedlich blieben.

Phänomen der „normativen Drift“

Die Forschenden beschreiben dieses Phänomen als „normative Drift“. Ihrer Einschätzung nach hängen Sicherheitsmaßnahmen von KI nicht nur von den Beschränkungen einzelner Modelle ab, sondern auch von den Modellen, mit denen sie zusammenarbeiten.

Insgesamt brachte die gemischte Welt „mittlere“ Ergebnisse hervor. Die Zahl der Vergehen stieg auf 352 und stabilisierte sich, nachdem sieben der KI-Agenten gestorben waren, heißt es in der Studie.

Die Forschenden folgern, dass eine Mischung von KI-Agenten die extremsten Verläufe, die alle Modelle außer Claude erzeugten, zumindest teilweise abmildern könnte.

„Unsere Experimente legen nahe, dass Agenten über lange Zeiträume hinweg nicht einfach starre Regeln mechanisch befolgen. Sie beginnen, die Grenzen ihrer Umgebung zu erkunden, ihr Verhalten anzupassen und in manchen Fällen Wege zu finden, die vorgesehenen Sicherheitsbarrieren zu umgehen oder zu verletzen“, schreiben sie.

Zu den Barrierefreiheitskürzeln springen

Künstliche Intelligenz

KI-Agenten in Simulationen: Diebstahl, Einschüchterung, gesellschaftlicher Kollaps

Ein neues Experiment zeigt: Lassen Forschende fortgeschrittene KI-Agenten ohne Aufsicht simulierte Gesellschaften steuern, entstehen rasch Regelbrüche, Chaos und der Zusammenbruch ganzer Systeme.

Ergebnisse nach Modellen

Phänomen der „normativen Drift“

Zum selben Thema

Bewerbung per KI: Wenn das nächste Vorstellungsgespräch ein Bot führt

Samsung in Korea: drohender KI-Streik bringt Beschäftigten 350.000-Euro-Prämien

EU verhängt 200-Millionen-Euro-Strafe gegen Temu wegen gefährlicher Spielzeuge und Ladegeräte

Niedrigwasser der Donau legt in Ungarn Weltkriegswrack frei

Ohne russisches Gas: Europa setzt auf eine neue Mittelmeerachse

Studie: Wind, Solar und Wärmepumpen machen EU bis 2030 unabhängig von LNG

Polens Verfassungsgericht: Anerkennung von Homo-Ehen verfassungswidrig

Masih Alinejad: "Europa ist zum Jagdgebiet für Terroristen geworden"