GPT has a new competitor: Did you know about DeepSeek?

La startup cinese DeepSeek ha stupito i principali giocatori del Silicon Valley con il suo nuovo assistente di chat IA che rivalizza nel prestazioni rispetto a quella di ChatGPT di OpenAI, mentre costa molto meno da sviluppare.
Al momento di questa scrittura, DeepSeek ha superato ChatGPT nell'App Store d'Apple come l'app gratuita più scaricata negli Stati Uniti, nel Regno Unito, in Cina e in molte altre nazioni. Funziona come un bot di chat tipico: inserisci una domanda e il suo modello open source genera una risposta. Il modello sottostante DeepSeek-V3 ha 671 miliardi di parametri, permettendo all'app di "pensare" prima di risolvere il problema.
Contrariamente al modello di OpenAI, che può eseguire solo sui propri server, DeepSeek può funzionare localmente su computer più potenti e molti server accelerati da GPU. La società afferma che il suo modello sia simile al modello o1 di OpenAI su specifiche baselining. A differenza di molte altre chatbot AI, DeepSeek mostra inoltre in modo trasparente la sua ragione e come ha derivato la risposta. Tuttavia, essendo un'applicazione cinese, DeepSeek censura certi argomenti come il Piazza Tiananmen.
L'applicazione, rilasciata il 20 gennaio, è anche disponibile nel negozio di applicazioni Google Play. DeepSeek ha acquisito un improvviso popolarità grazie alla sua capacità di confrontarsi o superare i modelli AI esistenti. Il suo articolo di ricerca, rilasciato lunedì, rivela come il training di DeepSeek-V3 sia economicamente efficiente.
Christian Zibreg / Come Funziona
Le sue affermazioni non sono ancora state verificate, ma DeepSeek sembra aver utilizzato solo 2.048 chip Nvidia H800 specializzati per addestrare R1 rispetto agli oltre 16.000 chip Nvidia utilizzati per addestrare i modelli più avanzati di OpenAI. DeepSeek afferma che la riduzione drastiche del numero di GPU di punta necessarie per l'addestramento dell'intelligenza artificiale gli ha permesso di spese solo 5,6 milioni di dollari per addestrare R1. Confrontati con OpenAI, che ha speso oltre 100 milioni di dollari per addestrare il suo modello GPT-4 simile in dimensioni. Tuttavia, la società non ha quantificato l'consumo energetico di DeepSeek rispetto ai concorrenti.
R1 si basa sul modello di linguaggio grande V3 di DeepSeek, che la società sostiene corrisponda a GPT-4 o di OpenAI e Claude 3.5 Sonnet di Anthropic. L'accomplimento di DeepSeek è particolarmente impressionante in luce delle sanzioni commerciali imposte dall'US government sui chip Nvidia sofisticati utilizzati per il training AI. Con i più grandi giocatori dell'AI come Nvidia, OpenAI, Meta e Microsoft che spengono miliardi nei loro centri dati AI, vedremo molte notizie questa settimana sottolineando la leadership degli Stati Uniti nell'AI.
I sarà interessante vedere come il recente avvio di DeepSeek influenzará il progetto Stargate del governo Trump - sostenuto da OpenAI, Softbank e Oracle - con l'obiettivo di investire 500 miliardi di dollari nella costruzione di nuove infrastrutture AI e centri dati per OpenAI negli anni successivi. Sarà particolarmente interessante vedere come OpenAI passa dalla non-profit alla società a profitto, dato che DeepSeek ha rilasciato i suoi modelli di IA.
Meta ha anche reso disponibili in open source alcuni aspetti della propria tecnologia AI, come Lama LLM. Tuttavia, DeepSeek è una nuova entrata nel campo che sta causando molto parlare, e il fatto che gli sviluppatori possano utilizzare liberamente la tecnologia di DeepSeek potrebbe dare a OpenAI un bello sfidare.
Categorie
Ultimi articoli
- Recensione della tastiera meccanica Satechi Keyboard SM3: silenziosa e perfetta per la produttività.
- Questo vecchio telefono si è trasformato in un pericolo di incendio davanti ai miei occhi.
- 10 modi in cui l'app Invitations di Apple differisce da Calendar di Apple
- Apple al lavoro: Il 2025 sarà l'anno in cui Apple rilascerà un concorrente di Google Workspace?
- È improbabile che Apple organizzi un evento speciale per annunciare l'iPhone SE 4.
- Suggerimenti e soluzioni per le connessioni di oggi del NYT dell'8 febbraio (#608)
- Il supporto per Ubuntu 20.04 LTS sta per concludersi.
- Hai un ritardo nella lettura? Lascia che l'IA ti legga ad alta voce.
- Questo è il mio lettore Blu-ray del Santo Graal.
- Nuove produzioni Apple saranno rilasciate la prossima settimana, ecco cosa arriverà.
Tag più recenti
- silenziosa
- meccanica
- smaltimento
- litio
- gonfie
- differenze
- Apple Calendar
- e-mail aziendale
- Google Workspace
- Connessione