Startseite / ChatGPT has a new rival: Introduction to DeepSeek

ChatGPT has a new rival: Introduction to DeepSeek

27.01.2025 23:42:20
DeepSeek hat mit ihrem KI-Chattbot einen starken Wettbewerb gegen OpenAI gestartet, der bei Leistung und Preise überlegen ist. Die App hat sich als die am häufigsten heruntergeladene kostenlose App auf mehreren Plattformen etabliert. DeepSeek nutzt ein lokal ausführbares Modell mit 671 Milliarden Parametern, das transparent arbeitet und bestimmte Themen censiert. Die Startup hat ihre Effizienz im Training unter Beweis gestellt, indem sie nur mit wenigen GPU-Chips gereicht hat. Dies könnte den US-Regierungserzwungenen Handelsstrafe für Nvidia-Chips beeinflussen. OpenAI wird sich mit dem Vorbehalt und möglicher Kommerzialisierung seiner Technologie konfrontieren.
ChatGPT has a new rival: Introduction to DeepSeek

Die chinesische Startup DeepSeek hat die größten Silicon Valley-Unternehmen mit ihrem neuen KI-Chattbot überrascht, der die Leistung von OpenAIs ChatGPT erreicht und viel günstiger zu entwickeln ist.

Bis heute hat DeepSeek den ChatGPT auf App Store in den USA, Großbritannien, China und mehreren anderen Ländern als die am häufigsten heruntergeladene kostenlose App überstiegen. Es funktioniert wie ein typisches Chattenbot: Sie geben eine Frage ein, und sein quelloffenes Modell generiert eine Antwort. Das zugrunde liegende DeepSeek-V3-Modell verfügt über 671 Milliarden Parameter, was die App in der Lage macht, "zu denken", bevor sie das Problem löst.

Im Gegensatz zur Modell von OpenAI, das nur auf seinen eigenen Servern laufen kann, kann DeepSeek lokal auf hochleistungsfähigen Computern und vielen GPU-beschleunigten Servern ausgeführt werden. Die Firma behauptet, dass ihr Modell bei bestimmten Benchmarks mit dem o1-Modell von OpenAI übereinstimmt. Im Gegensatz zu vielen anderen AI-Chatchaten zeigt DeepSeek auch transparent seine Gründe und wie er eine Antwort hergeleitet hat. Als chinesische App censiert jedoch DeepSeek bestimmte Themen wie den Tiananmensplatz.

Die App, die am 20. Januar veröffentlicht wurde, ist auch im Google Play Store verfügbar. Die Firma DeepSeek hat plötzlich Popularität gewonnen благодаря ihrer Fähigkeit, oder sogar überlegen zu sein, etablierte KI-Modelle. Ihr Forschungsartikel, der Montag veröffentlicht wurde, enthält Informationen darüber, wie effizient die Training von DeepSeek-V3 ist.

Christian Zibreg / Wie es geht mit dem Technikwissen

Obwohl ihre Ansprüche noch nicht überprüft wurden, scheint DeepSeek nur mit 2.048 spezialisierten Nvidia H800-Chips R1 zu trainieren, während OpenAI die führenden Modelle mit mehr als 16.000 Nvidia-Chips trainierte. DeepSeek behauptet, dass die erhebliche Reduzierung der Anzahl der modernsten GPUs für die AI-Training ermöglicht hat, es nur mit 5,6 Millionen US-Dollar zu trainieren. Im Gegensatz dazu hat OpenAI über 100 Millionen US-Dollar investiert, um sein vergleichbar großes GPT-4-Modell zu trainieren. Allerdings hat die Firma DeepSeek den Energieverbrauch in Bezug auf ihre Wettbewerber noch nicht quantifiziert.

R1 basiert selbst auf DeepSeek's V3 großen Sprachmodell (LLM), das die Firma behauptet, mit OpenAIs GPT-4o und Anthropic's Claude 3.5 Sonnet zu übereinstimmen. Die Leistung von DeepSeek ist besonderlich beeindruckend im Hinblick auf die US-Regierungserzwungene Handelsstrafe für komplexen Nvidia-Chips, die für AI-Bildungsdatzentren verwendet werden. Mit den größten AI-Händlern wie Nvidia, OpenAI, Meta und Microsoft, die Milliarden an ihren AI-Datzentren ausgeben, werden wir diese Woche viele Headlines sehen, die das amerikanische Vorrecht in der AI unterhalten.

Es wird spannend sein zu sehen, wie DeepSeek's Innovation die Trump-Regierung's Milliardenstargate-Projekt beeinflusst – ein Projekt, das von OpenAI, Softbank und Oracle unterstützt wird und sich mit dem Ziel hat, über die nächsten vier Jahre $500 Milliarden in die Errichtung neuer AI-Infrastruktur und Datenzentren für OpenAI zu investieren. Es wird besonders interessant sein, als OpenAI von einer gemeinnützigen Organisation zur kommerziellen Gesellschaft übergeht, da DeepSeek seine AI-Modelle offenedenkt hat.

Meta hat auch einige Aspekte seiner KI-Technologie offengelegt, wie zum Beispiel den Lama LLM. Trotzdem ist DeepSeek ein neuer Anwalt im Spiel, über den alle sprechen. Das Fakt, dass Entwickler sich frei auf DeepSeeks Technologie bauen können, könnte OpenAI in die Arme zwingen.

Das könnte Ihnen gefallen