ホーム / New opponent appears in ChatGPT: Let's meet DeepSeek

New opponent appears in ChatGPT: Let's meet DeepSeek

2025/01/27 23:42:20
中国のスタートアップDeepSeekが、パフォーマンスとコスト面で優れたAIチャットボット「DeepSeek-V3」を発表しました。このアプリはAppleのApp Storeでダウンロード数最多の無料アプリとして上回り、透明性も高いです。しかし、特定のトピック(例:天安門广场)を цензуアリングしています。DeepSeekは独自の訓練方法と高性能なコンピュータを使用し、コスト効率的にモデルを構築しました。この発表はAI技術の競争情勢に大きな影響を与える可能性があります。
New opponent appears in ChatGPT: Let's meet DeepSeek

中国のスタートアップDeepSeekは、OpenAIのChatGPTと同等のパフォーマンスを持つ新しいAIチャットボットを発表し、開発費用が大幅に安価であることに大変驚かせました。

現在、DeepSeekはAppleのApp Storeでアメリカ合衆国、イギリス、中国、そして複数の他の国で最もダウンロードされた無料アプリとしてChatGPTを上回っています。このアプリは典型的なチャットボットのように機能します:質問を入力すると、オープンソースモデルが答えを生成します。DeepSeek-V3の基礎となるモデルには6710億パラメータがあり、これによりアプリは問題解決に到達する前に「考える」ことができます。

OpenAIのモデルとは異なり、DeepSeekは独自のサーバーではなく、高性能なコンピュータや多くのGPUアクセラレートされたサーバーでローカルに動作できます。会社は、そのモデルが特定のベンチマークにおいてOpenAIのo1モデルと同等であると言っています。多くの他のAIチャットボットとは異なり、DeepSeekも透明にその推論や答えを導き出した方法を示しています。ただし、中国のアプリとして、DeepSeekは特定のトピック(例:天安門广场)を цензуアリングしています。

アプリは1月20日にリリースされ、GoogleのPlayストアでも利用可能です。DeepSeekは既存のAIモデルをマッチまたは上回る能力により突然の人気を集めました。月曜日に発表された研究論文では、DeepSeek-V3のコスト効率的な訓練方法が明らかになりました。

クリスチャン・ジブレッグ / ホウト・ゲーク

「その主張はまだ検証されていませんが、DeepSeekはR1を訓練するために2,048個の専門的なNvidia H800チップを使用したというと聞こえます。これはOpenAIのリーダーモデル(GPT-4)を訓練するのに必要な数倍のNvidiaチップ(16,000個以上)を使用しました。DeepSeekは、最新のGPUが必要なAI訓練の大幅な削減により、R1を訓練するためにただ5.6百万ドルを費やしたと主張しています。これはOpenAIがその同等規模のモデル(GPT-4)を訓練するために100百万ドル以上を費やすことに比べています。ただし、会社はDeepSeekのエネルギー消費量が競合者に対してどの程度かを定量的に示していない。

R1自体はDeepSeekのV3大規模言語モデル(LLM)に基づいており、会社はこれがOpenAIのGPT-4oとAnthropicのClaude 3.5 Sonnetに匹敵すると主張しています。DeepSeekの成就是特に注目を集めています。アメリカ政府がAI訓練に使用される高度なNvidiaチップに対する貿易制裁を加えたという事実を考えると、Nvidia、OpenAI、Meta、Microsoftなどの最大のAIプレイヤーが数十億ドルをAIデータセンターや研究開発に費やしていることに注意深く、今週はアメリカのAIリーダーシップについて疑問を投げかけられる見込みです。

DeepSeekの革新がトランプ政府の100億ドルのStargateプロジェクトにどのように影響するかを見ることは興味深いです。このプロジェクトは、OpenAI、ソフトバンク、Oracleの支援で行われ、4年間にわたって500億ドルを投資して新しいAIインフラストラクチャとデータセンターを構築することを目指しています。特に興味深いのは、OpenAIが非営利組織から営利组织に移行しているときに、DeepSeekがAIモデルを開源していることです。

メタは、AI技術の一部をオープンソースしました。例えば、ラマLLMです。それでも、DeepSeekは話題の新星で、開発者が自由にDeepSeekの技術を基に構築できるという事実は、OpenAIに挑戦を与えるかもしれません。