Newsletter Newsletters Events Veranstaltungen Podcasts Videos Africanews
Loader
Finden Sie uns
Werbung

Was ist DeepSeek, der KI-Chatbot aus China?

DeepSeek löste auch ein Erdbeben auf den Technologiemärkten aus
DeepSeek löste auch ein Erdbeben auf den Technologiemärkten aus Copyright  DeepSeek
Copyright DeepSeek
Von Cagla Uren & David Walsh mit AP
Zuerst veröffentlicht am
Diesen Artikel teilen Kommentare
Diesen Artikel teilen Close Button

DeepSeek-R1, das jüngste in einer Reihe von Modellen, die mit weniger Chips und zu geringen Kosten entwickelt wurden, fordert die Vorherrschaft von OpenAI, Google und Meta heraus.

WERBUNG

Das gleichnamige große Sprachmodell (LLM) des chinesischen Labors für künstliche Intelligenz (KI) DeepSeek hat das Silicon Valley in Erstaunen versetzt und ist zu einem der größten Konkurrenten des ChatGPT des US-Unternehmens OpenAI geworden.

Die neuesten DeepSeek-Modelle, die diesen Monat veröffentlicht wurden, sollen sowohl extrem schnell als auch kostengünstig sein.

Der DeepSeek-R1, das letzte der mit weniger Chips entwickelten Modelle, fordert bereits die Vorherrschaft von Giganten wie OpenAI, Google und Meta heraus und ließ die Aktien des Chip-Herstellers Nvidia am Montag abstürzen.

Im Folgenden erfahren Sie, was wir über den Branchenveränderer aus China wissen.

Woher kommt DeepSeek?

Das in Hangzhou, China, ansässige Unternehmen wurde im Juli 2023 von Liang Wenfeng, einem Informations- und Elektronikingenieur und Absolvent der Zhejiang-Universität, gegründet.

Es war Teil des Inkubationsprogramms von High-Flyer, einem Fonds, den Liang 2015 gegründet hatte. Wie andere führende Namen in der Branche will Liang eine "allgemeine künstliche Intelligenz" erreichen, die den Menschen bei verschiedenen Aufgaben einholen oder übertreffen kann.

Das unabhängige Finanzierungsmodell von DeepSeek ermöglicht es dem Unternehmen, ehrgeizige KI-Projekte ohne den Druck externer Investoren zu verfolgen und der langfristigen Forschung und Entwicklung Vorrang einzuräumen.

Das Team von DeepSeek besteht aus jungen Hochschulabsolventen der besten Universitäten Chinas, wobei das Unternehmen bei der Rekrutierung technische Fähigkeiten über Berufserfahrung stellt.

Kurz gesagt, man geht davon aus, dass das Unternehmen eine neue Perspektive bei der Entwicklung von Modellen der künstlichen Intelligenz einnimmt.

Die Reise von DeepSeek begann im November 2023 mit der Einführung von DeepSeek Coder, einem Open-Source-Modell für Codierungsaufgaben.

Es folgte DeepSeek LLM, das darauf abzielte, mit anderen großen Sprachmodellen zu konkurrieren. DeepSeek-V2, das im Mai 2024 veröffentlicht wurde, gewann aufgrund seiner starken Leistung und seiner niedrigen Kosten an Zugkraft.

Es zwang auch andere große chinesische Tech-Giganten wie ByteDance, Tencent, Baidu und Alibaba, die Preise für ihre KI-Modelle zu senken.

Wie hoch ist die Kapazität der DeepSeek-Modelle?

DeepSeek-V2 wurde später durch DeepSeek-Coder-V2 ersetzt, ein fortschrittlicheres Modell mit 236 Milliarden Parametern. Das Modell wurde für komplexe Codierungsaufforderungen entwickelt und verfügt über ein großes Kontextfenster mit bis zu 128.000 Token.

Ein Token ist eine Einheit in einem Text. Diese Einheit kann oft ein Wort, ein Partikel (wie "künstlich" und "Intelligenz") oder sogar ein Zeichen sein. Ein Beispiel: "Künstliche Intelligenz ist toll!" kann aus vier Token bestehen: "Künstlich", "Intelligenz", "großartig", "!".

Ein Kontextfenster von 128.000 Token ist die maximale Länge des Eingabetextes, den das Modell gleichzeitig verarbeiten kann. Ein größeres Kontextfenster ermöglicht es einem Modell, längere Texte zu verstehen, zusammenzufassen oder zu analysieren. Dies ist ein großer Vorteil, zum Beispiel bei der Arbeit an langen Dokumenten, Büchern oder komplexen Dialogen.

Mit den neuesten Modellen DeepSeek-V3 und DeepSeek-R1 hat das Unternehmen seine Position weiter gefestigt.

Der DeepSeek-V3, ein Modell mit 671.000 Parametern, benötigt deutlich weniger Ressourcen als seine Konkurrenten und schneidet in verschiedenen Benchmark-Tests mit anderen Marken eindrucksvoll ab.

Der DeepSeek-R1, der in diesem Monat auf den Markt kam, konzentriert sich auf komplexe Aufgaben wie logisches Denken, Codierung und Mathe. Mit seinen Fähigkeiten in diesem Bereich fordert er den o1 heraus, eines der neuesten Modelle von ChatGPT.

Obwohl DeepSeek in kurzer Zeit beachtliche Erfolge erzielt hat, konzentriert sich das Unternehmen in erster Linie auf die Forschung und hat laut Forbes keine detaillierten Pläne für eine Kommerzialisierung in naher Zukunft.

Für den Endverbraucher kostenlos

Einer der Hauptgründe, warum DeepSeek so viel Aufmerksamkeit erregt hat, ist die Tatsache, dass es für den Endnutzer kostenlos ist. Es ist das erste fortschrittliche KI-System dieser Art, das den Nutzern frei zur Verfügung steht. Andere leistungsstarke Systeme wie OpenAI o1 und Claude Sonnet erfordern ein kostenpflichtiges Abonnement. Bei einigen Abonnements werden den Nutzern sogar Quoten auferlegt.

Google Gemini ist ebenfalls kostenlos erhältlich, aber die kostenlosen Versionen sind auf ältere Modelle beschränkt. DeepSeek hat im Moment keine Einschränkungen.

Wie wird es verwendet?

Nutzer können auf die für den Endnutzer entwickelte DeepSeek-Chat-Schnittstelle unter "chat.deepseek" zugreifen. Es genügt, auf dem Chat-Bildschirm Befehle einzugeben und die Schaltfläche "Suchen" zu drücken, um das Internet zu durchsuchen.

Es gibt eine "Deep Think"-Option, um detailliertere Informationen zu einem beliebigen Thema zu erhalten. Diese Option liefert zwar detailliertere Antworten auf die Anfragen der Benutzer, kann aber auch mehr Seiten in der Suchmaschine durchsuchen. Im Gegensatz zu ChatGPT, das sich bei der Suche nur auf bestimmte Quellen stützt, kann diese Funktion jedoch auch falsche Informationen auf einigen Seiten aufdecken. Daher müssen die Benutzer die Informationen, die sie über diesen Chatbot erhalten, bestätigen.

Ist es sicher?

Eine weitere wichtige Frage bei der Nutzung von DeepSeek ist, ob es sicher ist. DeepSeek benötigt, wie andere Dienste auch, Nutzerdaten, die wahrscheinlich auf Servern in China gespeichert sind.

Wie bei jedem LLM ist es wichtig, dass die Nutzer dem Chatbot keine sensiblen Daten zur Verfügung stellen. Da DeepSeek auch quelloffen ist, können unabhängige Forscher den Code des Modells einsehen und versuchen zu bestimmen, ob er sicher ist. Genauere Informationen zu den Sicherheitsbedenken werden voraussichtlich in den nächsten Tagen veröffentlicht.

Was bedeutet Open Source?

Die Modelle, einschließlich DeepSeek-R1, wurden weitgehend als Open Source veröffentlicht. Das bedeutet, dass jeder auf den Code des Tools zugreifen und ihn zur Anpassung des LLM verwenden kann. Die Trainingsdaten sind urheberrechtlich geschützt.

OpenAI hingegen hatte das o1-Modell geschlossen veröffentlicht und verkauft es bereits nur an Nutzer, sogar nur an Nutzer, mit Paketen von 20 $ (19 €) bis 200 $ (192 €) pro Monat.

Wie konnte das Unternehmen trotz US-Beschränkungen ein solches Modell entwickeln?

Das Unternehmen ist strategische Partnerschaften eingegangen, um seine technologischen Fähigkeiten und seine Marktreichweite zu verbessern.

Eine der bemerkenswerten Kooperationen war die mit dem US-Chiphersteller AMD. Laut Forbes hat DeepSeek in wichtigen Phasen der Modellentwicklung, insbesondere bei DeepSeek-V3, AMD Instinct GPUs (Grafikprozessoren) und ROCM-Software eingesetzt.

Die MIT Technology Review berichtete, dass Liang bereits lange vor den US-Chipsanktionen gegen China erhebliche Bestände an Nvidia-A100-Chips erworben hatte, einem Typ, der derzeit nicht nach China exportiert werden darf.

Das chinesische Medienunternehmen 36Kr schätzt, dass das Unternehmen mehr als 10.000 Stück auf Lager hat. Manche sprechen von 50.000 Stück.

Liang erkannte die Bedeutung dieser Bestände für das KI-Training und gründete DeepSeek, wo er sie in Verbindung mit stromsparenden Chips zur Verbesserung seiner Modelle einsetzte.

Der wichtigste Punkt ist jedoch, dass Liang einen Weg gefunden hat, mit wenigen Ressourcen kompetente Modelle zu erstellen. Die US-Chip-Exportbeschränkungen zwangen die DeepSeek-Entwickler, intelligentere, energieeffizientere Algorithmen zu entwickeln, um die fehlende Rechenleistung zu kompensieren.

Es wird angenommen, dass ChatGPT 10.000 Nvidia-GPUs benötigt, um Trainingsdaten zu verarbeiten. DeepSeek-Ingenieure sagen, dass sie ähnliche Ergebnisse mit nur 2.000 GPUs erzielt haben.

Wie war die Reaktion auf DeepSeek?

Alexandr Wang, CEO von ScaleAI, das Trainingsdaten für KI-Modelle großer Unternehmen wie OpenAI und Google bereitstellt, bezeichnete das Produkt von DeepSeek in einer Rede auf dem Weltwirtschaftsforum (WEF) in Davos letzte Woche als "ein weltbewegendes Modell".

Während DeepSeek die amerikanischen Konkurrenten verblüfft hat, warnen Analysten bereits davor, was seine Veröffentlichung im Westen bedeuten wird.

"Wir sollten alarmiert sein. Die weitere Integration chinesischer KI-Technologie in die britische und westliche Gesellschaft ist nicht nur eine schlechte Idee - sie ist rücksichtslos", sagte Ross Burley, Mitbegründer des Centre for Information Resilience.

"Wir haben immer wieder gesehen, wie Peking seine technologische Dominanz zur Überwachung, Kontrolle und Nötigung einsetzt, sowohl im Inland als auch im Ausland. Ob durch mit Spyware versehene Geräte, staatlich geförderte Cyber-Kampagnen oder den Missbrauch von KI zur Unterdrückung abweichender Meinungen - Chinas Erfolgsbilanz zeigt, dass seine Technologie eine Erweiterung seiner geopolitischen Strategie ist", fügte er hinzu.

"Dies mag wie ein harmloses Large Language Model aussehen, aber wir haben bereits gesehen, dass die KI Informationen unterdrückt, die der chinesischen Regierung kritisch gegenüberstehen.

Andere sind ebenfalls der Meinung, dass die Veröffentlichung des neuesten LLM ein politischer Schachzug ist, der die ohnehin schon angespannten chinesisch-amerikanischen Beziehungen weiter anheizen dürfte.

"Die technologische Innovation ist real, aber der Zeitpunkt der Veröffentlichung ist politischer Natur", sagte Gregory Allen, Direktor des Wadhwani AI Center am Center for Strategic and International Studies, gegenüber der Associated Press.

Allen verglich die Ankündigung von DeepSeek in der vergangenen Woche mit der Veröffentlichung eines neuen Telefons des von den USA sanktionierten chinesischen Unternehmens Huawei während diplomatischer Gespräche über die Exportkontrollen der Biden-Administration im Jahr 2023.

"Der Versuch zu zeigen, dass die Exportkontrollen nutzlos oder kontraproduktiv sind, ist ein wirklich wichtiges Ziel der chinesischen Außenpolitik im Moment", sagte Allen.

Zu den Barrierefreiheitskürzeln springen
Diesen Artikel teilen Kommentare

Zum selben Thema

EU-Datenschutzbeauftragter: Favorit für Top-Position zu wenig neutral?

China-Startup DeepSeek erschüttert globale Märkte, Nvidia-Aktien stürzen ab

Was wissen wir über die Cyberangriffe auf europäische Flughäfen?