DeepSeek とは何か? ChatGPT がなぜ懸念すべきなのか?
2025/01/30 7:00:14
中国エンジニアによって開発されたオープンソースのAIモデル「DeepSeek」が注目を集めている。DeepSeekは、既存の大規模AIモデルと同等の性能を発揮する一方で、はるかに少ないデータと費用で学習されているという。これは、より複雑なモデルを圧縮し、低スペックのハードウェアでも実行可能にする革新的な技術によって実現されている。しかし、中国政府による潜在的なバイアスや検閲、サイバーセキュリティに関する懸念も存在する。

概要として、DeepSeekはオープンソースであり、トップクラスのAIモデルと同等の性能を発揮する一方で、はるかに少ないデータで学習されています。中国のエンジニアによって開発されたこのモデルは、複雑なモデルを圧縮し、低スペックのハードウェアでもローカルで実行することができます。しかし、その起源や潜在的なバイアスに関する懸念も存在します。 「DeepSeek」という名前がインターネットで話題になっている。OpenAIやNVIDIAなどのAI企業の株価は暴落し、世界中のAI愛好家は喜びを隠せない。この新しいAI参入者がなぜそれほど注目されているのか? ## DeepSeek はオープンソースのAIで大きな主張をしている DeepSeekは、GPT-3やClaude、Llamaなど、現在のAI界で人気を集めているモデルと同じく、生成型AIモデルです。正確には、異なるアプリケーション向けに設計された複数のAIモデルのグループであると言えます。 OpenAIのGPTモデルとは異なり、DeepSeekはMITライセンスでオープンソース化されており、商用利用が許可されています。これは、モデルの内部動作全体が公開されていることを意味します。誰でもライセンス料を支払うことなく使用でき、すでに作成された作業を変更したり拡張したりすることもできます。これがDeepSeekが短期的な市場の混乱を引き起こし、それが長期的な市場調整に発展する可能性がある理由の一つです。 しかし、DeepSeek自体の性能が良くないなら、すべては意味がありません。このAIモデルについて人々を騒がせているもう1つの大きな要因は、その性能です。AIベンチマークでは、DeepSeekはGPT-o1や他の最高クラスの生成モデルと同様に高いパフォーマンスを発揮します。場合によってはそれ以上です。もちろん、これは誰でも確認できることですが、本当に驚くべき主張は、このモデルを開発するのにかかった費用です。 オ llama ドットコム DeepSeek は、このモデルを600万ドル未満で訓練したと主張しています。1億ドルを超える費用がかかっている競合モデルを考えると、それは多く聞こえます。さらに、DeepSeekはOpenAIのような米国の企業が利用できるよりも強力なハードウェアで訓練されたわけではありません。もちろん、確認しにくい主張の1つであり、引用された金額が実際にははるかに少ない可能性もあります。ただし、現時点では、コストが主張された額を超えていたことを示す確実な証拠はありません。 最後の注目すべき点は、DeepSeekがLlamaなどの大型で密集した計算資源を要するモデルを、同様の推論能力を持つ小型モデルに「凝縮」するために使用されていることです。基本的には、DeepSeekはより複雑なモデルから学習し、その出力結果を模倣するように訓練されます。これは、内部の複雑な機構なしに、より大きなモデルをより小さなものへ圧縮する効果です。これにより、ローカルで複雑なモデルを実行し、消費電力を減らし、ハードウェア要件を削減できるという点で大きな進歩が生まれています。 ## 中国のエンジニアによって開発された DeepSeek。 クリスチャン・ジブレグ/ハウツーギーク DeepSeekは、元ヘッジファンドマネージャーの梁文峰(39歳)が率いるスタートアップ企業です。彼は特に量化ヘッジファンドマネージャーとして成功を収めました。これは、機械学習を用いて市場動向を予測し、投資家がそこから利益を得られるようする投資手法です。そのため、Wenfengはすでにこのようなモデルを訓練するために必要な強力なハードウェアにアクセスしていました。 DeepSeek は情熱的なプロジェクトのようなものであり、営利を目的としていません。実際、このモデルはすでにオープンソースとしてすべての人に公開されています。皮肉なことに、NVIDIA などの強力なAIチップに対するアメリカの輸出規制が、DeepSeek の開発者がそれを非常に効率的にする必要に迫られた理由の一つかもしれません。 ## DeepSeekにはいくつかの特別な懸念事項がある。 AI業界の評論家の中には、DeepSeekのストーリーの一部が信じられないほど素晴らしいと感じる人もいるでしょう。さらに、その起源が中国であり、バイアス、検閲、さらにはサイバーセキュリティに関する懸念が生じるため、DeepSeekに対する懐疑的な意見があるのも当然です。 実際、中国政府が現在神経質になっている質問をオンラインでホスティングされているLLMに投げかけても、あなたが期待するほど答えが出てこないかもしれません。しかし、コードは誰でも自由に利用可能なので、知識があればその動作を変更できます。これらの懸念点は原則として解決できる可能性があります。 DeepSeekはまだ初期段階であり、今後どうなるのかはしばらく時間がかかるでしょう。しかし、ChatGPTが一般公開されて以来、生成型AI業界で最初の大きなパラダイムシフトが起こったことは間違いありません。