What is Deepseek and why should ChatGPT be afraid?"

Das Internet ist voller Gerüchte über den Namen „DeepSeek“. KI-Unternehmen wie OpenAI und NVIDIA sehen ihren Aktienkurs sinken, und KI-Enthusiasten jubeln weltweit. Warum sorgt dieser neue Player in der KI-Welt für so viel Aufregung?
DeepSeek ist eine Open-Source-KI mit großen Ankündigungen.
Wie GPT-3 oder Claude, oder Llama, oder eines der aktuellen Favoriten in der KI-Welt, ist DeepSeek ein generatives KI-Modell. Nun, genauer gesagt handelt es sich um eine Gruppe von KI-Modellen, die Varianten sind, die für verschiedene Anwendungen entwickelt wurden.
Im Gegensatz zu Modellen wie den GPT-Modellen von OpenAI steht DeepSeek unter der MIT-Lizenz und ist damit quelloffen. Diese Lizenz erlaubt die kommerzielle Nutzung. Das bedeutet, dass die gesamten Funktionsweisen des Modells transparent sind. Jeder kann es nutzen, ohne Lizenzgebühren zahlen zu müssen, und niemand hindert jemanden daran, die bereits vorhandene Arbeit zu modifizieren oder weiterzuentwickeln. Dies ist einer der Hauptgründe für die kurzfristige Marktstörung durch DeepSeek, die sich möglicherweise in eine langfristige Marktanpassung verwandeln könnte.
Allerdings spielt all das nichts, wenn DeepSeek nicht gut ist. Der andere wichtige Faktor, der alle über dieses KI-Modell sprechen lässt, ist seine Leistung. In KI-Benchmarks erreicht DeepSeek die Leistung von GPT-o1 und anderen erstklassigen generativen Modellen. In einigen Fällen sogar besser. Das ist natürlich etwas, das jeder überprüfen kann, aber die wirklich schockierende Behauptung ist, wie viel es gekostet hat, dieses Modell zu entwickeln.
Ollama.comDeepSeek behauptet, das Modell sei für weniger als sechs Millionen Dollar trainiert worden. Das klingt nach viel Geld, bis man bedenkt, dass die Modelle, mit denen es sich misst, über hundert Millionen Dollar zum Training kosten. Darüber hinaus wurde DeepSeek auf weniger leistungsstarken Hardware trainiert als die, die US-Unternehmen wie OpenAI zur Verfügung stehen. Natürlich ist dies eine der Behauptungen, die nicht so leicht zu überprüfen sind, und es ist möglich, dass der genannte Betrag viel niedriger als die Wahrheit ist. Zum jetzigen Zeitpunkt gibt es jedoch keine Hinweise darauf, dass die Kosten höher waren als angegeben.
Letzteres "große Ding", das ich erwähnen möchte, ist die Verwendung von DeepSeek, um große, dichte und rechenaufwendige Modelle wie Llama in kleinere Modelle mit vergleichbaren Schlussfolgerungsfähigkeiten zu "verdampfen". DeepSeek trainiert im Grunde ein Modell auf den bestehenden Modellen, die es dann leichter macht, diese auf weniger leistungsstarken Hardware auszuführen. Für einen bestimmten Anwendungsfall kann man also eine DeepSeek Version nutzen, die deutlich effizienter ist.
Es gibt einige spezielle Bedenken hinsichtlich DeepSeek.
Angesichts der Tatsache, dass Teile der Geschichte von DeepSeek für einige Experten in der KI-Branche zu schön klingen könnten und ihre Herkunft aus China Bedenken hinsichtlich Verzerrung, Zensur und sogar Cybersicherheit aufwirft, ist es kein Wunder, dass es Skepsis gegenüber DeepSeek gibt.
In der Tat, stellen Sie der Online-Version des LLM Fragen, die empfindlich auf die aktuelle chinesische Regierung reagieren, und es könnte nicht so offen sein, wie Sie erwarten würden. Da der Code jedoch für alle zugänglich ist, kann jeder das Verhalten anpassen, wenn er über das nötige Wissen verfügt. Diese Bedenken können prinzipiell angegangen werden.
Es ist noch früh für DeepSeek, und es wird einige Zeit dauern, bis sich die Lage klar darstellt. Aber eines weiß ich mit Sicherheit: Die KI-Branche hat seit dem öffentlichen Launch von ChatGPT ihren ersten großen Paradigmenwechsel erlebt.
**Änderungen:** * Einige Sätze wurden umformuliert, um Klarheit zu verbessern. * Der Abschnitt über DeepSeelks Fähigkeit, große Modelle zu komprimieren, wurde hinzugefügt und verbessert. * Der letzte Absatz wurde leicht überarbeitet.Kategorien
Neueste Artikel
- Satechi Tastatur SM3 Mechanical Keyboard Review: Silent and Perfect for Productivity"
- This old phone became a fire hazard right under my nose.
- 10 Diferencias entre las Notas de Apple y el Calendario de Apple
- <p>Apfel im Arbeitsumfeld: Ist 2025 das Jahr, in dem Apple einen Konkurrenten zu Google Workspace veröffentlicht?</p> Der Text enthält keine doppelten oder nicht übersetzten Inhalte.
- Apple probabilmente non terrà un evento speciale per presentare l'iPhone SE 4.
- Today's Tips and Solutions for NYT Connections (February 8th, #608)
- Der Support für Ubuntu 20.04 LTS endet bald.
- Have you got a reading gap? Let AI read it to you.
- This is my shrine Blu-ray Player
- New Apple products will be unveiled next week, here's what to expect."
Neueste Tags
- Layout
- Büro
- mechanisch
- Entsorgung
- aufgeblähte Batterien
- Pressemitteilung
- Speechify
- Artikelvorlesen
- KI-Stimmen
- Leselager