Startseite / What is Deepseek and why should ChatGPT be afraid?"

What is Deepseek and why should ChatGPT be afraid?"

30.01.2025 07:00:14
DeepSeek ist ein Open-Source KI-Modell, das die Leistung von Top-Modellen wie GPT-3 erreicht, aber deutlich weniger trainiert wurde. Entwickelt in China, ermöglicht es die Komprimierung komplexer Modelle und deren Ausführung auf Hardware mit geringer Ausstattung. Obwohl DeepSeelks Performance beeindruckend ist, bestehen Bedenken hinsichtlich seiner Herkunft und potenziellen Vorurteile aufgrund chinesischer Entwicklung und möglichen Zensurmechanismen. Das Modell kann große KI-Modelle komprimieren, wodurch es effizienter für bestimmte Anwendungen wird. Die Transparenz durch Open Source ermöglicht Modifikationen und Weiterentwicklungen. DeepSeek könnte die KI-Branche nachhaltig verändern, indem es den Zugang zu leistungsstarker KI für eine breitere Nutzergruppe erleichtert.
What is Deepseek and why should ChatGPT be afraid?"
## Überarbeitetes Übersetzungsergebnis: **Zusammenfassung:** DeepSeek ist Open-Source und erreicht die Leistung der besten KI-Modelle, wurde aber für deutlich weniger trainiert. Entwickelt von chinesischen Ingenieuren kann es komplexe Modelle komprimieren und lokal auf Hardware mit niedriger Ausstattung ausführen. Es bestehen Bedenken hinsichtlich seiner Herkunft und potenziellen Vorurteile.

Das Internet ist voller Gerüchte über den Namen „DeepSeek“. KI-Unternehmen wie OpenAI und NVIDIA sehen ihren Aktienkurs sinken, und KI-Enthusiasten jubeln weltweit. Warum sorgt dieser neue Player in der KI-Welt für so viel Aufregung?

DeepSeek ist eine Open-Source-KI mit großen Ankündigungen.

Wie GPT-3 oder Claude, oder Llama, oder eines der aktuellen Favoriten in der KI-Welt, ist DeepSeek ein generatives KI-Modell. Nun, genauer gesagt handelt es sich um eine Gruppe von KI-Modellen, die Varianten sind, die für verschiedene Anwendungen entwickelt wurden.

Im Gegensatz zu Modellen wie den GPT-Modellen von OpenAI steht DeepSeek unter der MIT-Lizenz und ist damit quelloffen. Diese Lizenz erlaubt die kommerzielle Nutzung. Das bedeutet, dass die gesamten Funktionsweisen des Modells transparent sind. Jeder kann es nutzen, ohne Lizenzgebühren zahlen zu müssen, und niemand hindert jemanden daran, die bereits vorhandene Arbeit zu modifizieren oder weiterzuentwickeln. Dies ist einer der Hauptgründe für die kurzfristige Marktstörung durch DeepSeek, die sich möglicherweise in eine langfristige Marktanpassung verwandeln könnte.

Allerdings spielt all das nichts, wenn DeepSeek nicht gut ist. Der andere wichtige Faktor, der alle über dieses KI-Modell sprechen lässt, ist seine Leistung. In KI-Benchmarks erreicht DeepSeek die Leistung von GPT-o1 und anderen erstklassigen generativen Modellen. In einigen Fällen sogar besser. Das ist natürlich etwas, das jeder überprüfen kann, aber die wirklich schockierende Behauptung ist, wie viel es gekostet hat, dieses Modell zu entwickeln.

Ollama.com

DeepSeek behauptet, das Modell sei für weniger als sechs Millionen Dollar trainiert worden. Das klingt nach viel Geld, bis man bedenkt, dass die Modelle, mit denen es sich misst, über hundert Millionen Dollar zum Training kosten. Darüber hinaus wurde DeepSeek auf weniger leistungsstarken Hardware trainiert als die, die US-Unternehmen wie OpenAI zur Verfügung stehen. Natürlich ist dies eine der Behauptungen, die nicht so leicht zu überprüfen sind, und es ist möglich, dass der genannte Betrag viel niedriger als die Wahrheit ist. Zum jetzigen Zeitpunkt gibt es jedoch keine Hinweise darauf, dass die Kosten höher waren als angegeben.

Letzteres "große Ding", das ich erwähnen möchte, ist die Verwendung von DeepSeek, um große, dichte und rechenaufwendige Modelle wie Llama in kleinere Modelle mit vergleichbaren Schlussfolgerungsfähigkeiten zu "verdampfen". DeepSeek trainiert im Grunde ein Modell auf den bestehenden Modellen, die es dann leichter macht, diese auf weniger leistungsstarken Hardware auszuführen. Für einen bestimmten Anwendungsfall kann man also eine DeepSeek Version nutzen, die deutlich effizienter ist.

Es gibt einige spezielle Bedenken hinsichtlich DeepSeek.

Angesichts der Tatsache, dass Teile der Geschichte von DeepSeek für einige Experten in der KI-Branche zu schön klingen könnten und ihre Herkunft aus China Bedenken hinsichtlich Verzerrung, Zensur und sogar Cybersicherheit aufwirft, ist es kein Wunder, dass es Skepsis gegenüber DeepSeek gibt.

In der Tat, stellen Sie der Online-Version des LLM Fragen, die empfindlich auf die aktuelle chinesische Regierung reagieren, und es könnte nicht so offen sein, wie Sie erwarten würden. Da der Code jedoch für alle zugänglich ist, kann jeder das Verhalten anpassen, wenn er über das nötige Wissen verfügt. Diese Bedenken können prinzipiell angegangen werden.

Es ist noch früh für DeepSeek, und es wird einige Zeit dauern, bis sich die Lage klar darstellt. Aber eines weiß ich mit Sicherheit: Die KI-Branche hat seit dem öffentlichen Launch von ChatGPT ihren ersten großen Paradigmenwechsel erlebt.

**Änderungen:** * Einige Sätze wurden umformuliert, um Klarheit zu verbessern. * Der Abschnitt über DeepSeelks Fähigkeit, große Modelle zu komprimieren, wurde hinzugefügt und verbessert. * Der letzte Absatz wurde leicht überarbeitet.

Das könnte Ihnen gefallen