Accueil / What is Deepseek and why should ChatGPT be worried?

What is Deepseek and why should ChatGPT be worried?

30/01/2025 07:00:14
DeepSeek est un logiciel d'intelligence artificielle open source développé en Chine qui rivalise avec les modèles populaires comme GPT-3. Son faible coût de développement (moins de 6 millions de dollars) et ses performances comparables aux modèles haut de gamme suscitent l'attention, mais des inquiétudes persistent quant à ses origines, aux potentiels biais et à la censure possible. Bien que le code soit ouvert, certaines questions sur sa transparence et son impartialité restent en suspens. DeepSeek pourrait représenter un tournant majeur dans l'industrie de l'IA générative.
What is Deepseek and why should ChatGPT be worried?
Résumé : DeepSeek est un logiciel libre qui rivalise avec les meilleurs modèles d'IA, tout en ayant été entraîné avec beaucoup moins de ressources. Développé par des ingénieurs chinois, il peut compresser des modèles complexes et s'exécuter localement sur du matériel moins performant. Cependant, des inquiétudes persistent quant à ses origines et aux potentiels biais qu'il pourrait présenter.

L'internet est en ébullition avec le nom "DeepSeek". Les entreprises d'IA comme OpenAI et NVIDIA voient leurs cours boursiers s'effondrer, et les passionnés d'IA se frottent les mains de joie du monde entier. Pourquoi ce nouvel entrant dans le monde de l'IA fait-il tant parler ?

DeepSeek est une IA open source aux ambitions folles.

Comme GPT-3 ou Claude, ou Llama, ou tout autre modèle d'IA actuel qui fait sensation, DeepSeek est un modèle d'intelligence artificielle générative. Il est plus juste de dire qu'il s'agit d'un groupe de modèles d'IA qui sont des variantes conçues pour différentes applications.

Contrairement aux modèles GPT d'OpenAI, par exemple, DeepSeek est open source sous la licence MIT, qui permet une utilisation commerciale. Cela signifie que le fonctionnement interne complet du modèle est visible. N'importe qui peut l'utiliser sans payer de frais de licence, et rien n'empêche quelqu'un de modifier ou de s'appuyer sur le travail déjà accompli. C'est l'une des principales raisons pour lesquelles DeepSeek a provoqué une perturbation du marché à court terme, qui pourrait se transformer en une correction du marché à long terme.

Cependant, rien de tout cela n'a vraiment d'importance si DeepSeek n'est pas performant. Le deuxième facteur majeur qui fait parler de ce modèle d'IA est sa performance. Dans les benchmarks d'IA, DeepSeek s'en sort aussi bien que GPT-o1 et d'autres modèles génératifs de premier plan. Même mieux dans certains cas. C'est bien sûr quelque chose que chacun peut vérifier, mais la prétention vraiment choquante est le coût de développement de ce modèle.

Ollama.com

DeepSeek affirme que le modèle a été formé pour moins de six millions de dollars. Ce qui semble beaucoup d'argent jusqu'à ce qu'on compare avec les milliards investis par des entreprises comme Google et OpenAI. Cela soulève des questions sur la manière dont DeepSeek a réussi à obtenir de tels résultats avec un budget si limité.

Il existe bien sûr de nombreux modèles DeepSeek plus petits qui ne sont pas aussi performants, mais qui fonctionnent très bien sur l'ordinateur que vous possédez probablement actuellement. En fait, il existe même une version qui peut fonctionner (juste) sur un Raspberry Pi.

Il existe certaines préoccupations spécifiques concernant DeepSeek.

Compte tenu du fait que certaines parties de l'histoire de DeepSeek peuvent paraître trop belles pour être vraies aux yeux de certains experts du secteur de l'IA, et qu'elle provient de la Chine, ce qui soulève des inquiétudes concernant les biais, la censure et même la cybersécurité, il n'est pas surprenant qu'il existe une certaine hésitation à l'égard de DeepSeek.

En effet, posez des questions à la version hébergée en ligne de ce modèle linguistique à grande échelle (LLM) qui sont sensibles au gouvernement chinois actuel, et il pourrait ne pas être aussi ouvert que vous le pensez. Cependant, puisque le code est ouvert à tous, quiconque peut ajuster son comportement s'il possède les connaissances nécessaires. Ces préoccupations peuvent être résolues en principe.

Il est encore tôt pour DeepSeek, et il faudra du temps pour voir comment les choses évolueront, mais une chose dont je n'ai aucun doute, c'est que l'industrie de l'IA générative vient de connaître son premier changement de paradigme majeur depuis le lancement public de ChatGPT.

Vous pourriez aimer