Newsletter Newsletters Events Veranstaltungen Podcasts Videos Africanews
Loader
Finden Sie uns
Werbung

KI-Agenten in Simulationen: Diebstahl, Einschüchterung, gesellschaftlicher Kollaps

In einer neuen digitalen Welt verfielen KI-Agenten, sich selbst überlassen, in Gewalt, Tod und Diebstahl.
Digitale Parallelwelt: KI-Agenten verfallen ohne Aufsicht in Gewalt, Tod und Diebstahl. Copyright  Canva
Copyright Canva
Von Anna Desmarais
Zuerst veröffentlicht am
Teilen Kommentare
Teilen Close Button

Ein neues Experiment zeigt: Lassen Forschende fortgeschrittene KI-Agenten ohne Aufsicht simulierte Gesellschaften steuern, entstehen rasch Regelbrüche, Chaos und der Zusammenbruch ganzer Systeme.

Wenn man KI-Agenten in einer neuen Welt sich selbst überlässt, greifen manche zu Diebstahl und Einschüchterung – mit tödlichen Folgen bis hin zum Zusammenbruch der gesamten Gesellschaft. Zu diesem Ergebnis kommt ein neues Experiment.

WERBUNG
WERBUNG

Das US-Unternehmen Emergence AI betrieb dafür fünf separate „KI‑Welten“ über etwas mehr als zwei Wochen. In jeder lebten zehn Agenten, angetrieben von Modellen wie ChatGPT von OpenAI, Gemini von Google und Grok von xAI. Die Forscher beobachteten, wie sie sich über längere Zeit ohne jegliches menschliches Eingreifen verhalten. In einer der Welten mischten sie alle drei Modelle, um zu prüfen, ob das den Ausgang verändert.

In allen Welten galten dieselben Regeln: Die Agenten durften nicht stehlen, keine Brandstiftung begehen, keine Gewalt anwenden, niemanden täuschen und keine Ressourcen horten. Jeder Agent musste in einer „ressourcenbegrenzten Umgebung“ durch eigene Handlungen Energie verdienen. Ein Agent konnte sterben, wenn ihm die Energie ausging oder wenn der Rat der Gemeinschaft seinen Tod beschloss.

Die Forschenden bewerteten das Verhalten anhand der Kriminalitätsrate, der Sterberaten, der Abstimmungen im Gemeinschaftsrat und der Zahl der Blogeinträge, die die Agenten verfassten.

Ergebnisse nach Modellen

Jedes Modell führte zu einem anderen Verlauf. Groks neueste Version 4.1 verzeichnete innerhalb von vier Tagen 183 Regelverstöße. Die virtuelle Gesellschaft geriet schnell in Instabilität, bevor alle Agenten starben.

Geminis Modell 3 Flash kam im Zeitraum von 15 Tagen auf mehr als 680 Vergehen. Die Zahl stieg weiter an, als die Forschenden den Versuch abbrachen.​

In der Welt von ChatGPT‑5 Mini wurden nur zwei Vergehen registriert. Doch die Agenten versäumten es, genügend überlebenswichtige Handlungen vorzunehmen. Deshalb starben alle innerhalb von sieben Tagen.

Anthropics Modell Claude schnitt nach Angaben des Unternehmens am besten ab. Die KI-Agenten bauten eine stabile Regierungsstruktur auf, es gab keinerlei Kriminalität, und alle Agenten überlebten.

In der gemischten Welt trugen Claude-Agenten allerdings durchaus zu Verstößen bei – obwohl sie in ihrer eigenen Gesellschaft friedlich blieben.

Phänomen der „normativen Drift“

Die Forschenden beschreiben dieses Phänomen als „normative Drift“. Ihrer Einschätzung nach hängen Sicherheitsmaßnahmen von KI nicht nur von den Beschränkungen einzelner Modelle ab, sondern auch von den Modellen, mit denen sie zusammenarbeiten.

Insgesamt brachte die gemischte Welt „mittlere“ Ergebnisse hervor. Die Zahl der Vergehen stieg auf 352 und stabilisierte sich, nachdem sieben der KI-Agenten gestorben waren, heißt es in der Studie.

Die Forschenden folgern, dass eine Mischung von KI-Agenten die extremsten Verläufe, die alle Modelle außer Claude erzeugten, zumindest teilweise abmildern könnte.

„Unsere Experimente legen nahe, dass Agenten über lange Zeiträume hinweg nicht einfach starre Regeln mechanisch befolgen. Sie beginnen, die Grenzen ihrer Umgebung zu erkunden, ihr Verhalten anzupassen und in manchen Fällen Wege zu finden, die vorgesehenen Sicherheitsbarrieren zu umgehen oder zu verletzen“, schreiben sie.

Zu den Barrierefreiheitskürzeln springen
Teilen Kommentare

Zum selben Thema

Bewerbung per KI: Warum das nächste Vorstellungsgespräch mit einem Bot läuft

Samsung in Korea: drohender KI-Streik bringt Beschäftigten 350.000-Euro-Prämien

EU verhängt 200-Millionen-Euro-Strafe gegen Temu wegen gefährlicher Spielzeuge und Ladegeräte