DeepSeek: il colosso cinese dell’Intelligenza Artificiale che scuote il mercato globale.
di PAOLO POLETTI ♦
Negli ultimi anni, il settore dell’intelligenza artificiale (IA) è stato dominato da colossi della Silicon Valley come OpenAI, Google e Anthropic. Tuttavia, una nuova startup cinese, DeepSeek, ha rapidamente scosso gli equilibri, emergendo come uno dei principali protagonisti nel panorama globale dell’IA. Con modelli avanzati e strategie di sviluppo innovative, DeepSeek non solo sfida la supremazia tecnologica statunitense, ma solleva anche interrogativi etici e geopolitici sul futuro di questa tecnologia.
L’ascesa di DeepSeek: una minaccia al predominio statunitense.
Fondata nel 2023 da Liang Wenfeng, DeepSeek ha avuto origine dall’hedge fund quantitativo[1] cinese High-Flyer, noto per le sue strategie di trading basate sull’IA. Wenfeng ha utilizzato le risorse e l’esperienza maturate in High-Flyer per costruire modelli di IA all’avanguardia, con l’obiettivo di democratizzare l’accesso a questa tecnologia.
La svolta per DeepSeek è arrivata con il rilascio del modello V3 nel dicembre 2023, un sistema con 671 miliardi di parametri addestrato in soli 55 giorni. Questo modello, che ha eguagliato le prestazioni di concorrenti come GPT-4 di OpenAI e Claude 3.5 di Anthropic, ha suscitato grande interesse nella comunità tecnologica. Tuttavia, è stato il recente lancio del modello R1 a gennaio 2025 a trasformare DeepSeek in un fenomeno globale.
Uno dei fattori chiave che rendono DeepSeek una minaccia per i giganti americani è la sua efficienza nei costi. Addestrare il modello V3 è costato circa 5,6 milioni di dollari, una cifra irrisoria rispetto ai 100 milioni o più spesi da aziende come OpenAI per modelli comparabili. Inoltre, l’inferenza[2] con R1 costa appena 2,19 dollari per milione di token[3], contro i 60 dollari richiesti dai modelli di OpenAI. Questa strategia permette a DeepSeek di rendere i suoi modelli open source e accessibili gratuitamente, aumentando il suo impatto globale.
Dietro questa efficienza si cela l’ingegno di DeepSeek nell’ottimizzazione software, che le ha permesso di utilizzare chip meno avanzati, come i Nvidia H800, progettati per rispettare le restrizioni statunitensi sulle esportazioni di semiconduttori verso la Cina.
DeepSeek e il campanello d’allarme di Trump.
L’ex presidente degli Stati Uniti, Donald Trump, ha definito i progressi di DeepSeek un “campanello d’allarme” per le industrie americane. “Il rilascio di DeepSeek AI da parte di un’azienda cinese dovrebbe essere un segnale per le nostre industrie: dobbiamo essere concentrati al massimo per competere e vincere,” ha dichiarato Trump a Miami. “Voglio liberare le aziende tecnologiche americane e dominare il futuro come mai prima d’ora.”
Il consumo energetico di DeepSeek e il confronto con i modelli americani
Oltre ai costi di addestramento, DeepSeek si distingue per l’efficienza energetica nell’addestramento dei suoi modelli. Il modello DeepSeek-R1 è stato addestrato utilizzando circa 2.000 unità di calcolo[4], un numero significativamente inferiore rispetto ai modelli sviluppati da OpenAI e Google.
Grazie all’ottimizzazione dei processi di calcolo e all’adozione di algoritmi efficienti come il Group Relative Policy Optimization (GRPO), DeepSeek è riuscita a ridurre il consumo energetico durante la fase di addestramento e di inferenza. Tuttavia, alcuni test indipendenti suggeriscono che, sebbene l’addestramento sia stato più efficiente, la fase di inferenza potrebbe risultare più energivora: in alcuni benchmark, il tempo di esecuzione di DeepSeek-R1 è risultato circa doppio rispetto a modelli come Llama 3.3, con un consumo energetico complessivo superiore dell’87% sullo stesso set di richieste.
Questa disparità evidenzia una differenza fondamentale tra addestramento ed inferenza: mentre il primo richiede un elevato impiego di risorse per un periodo di tempo relativamente limitato, il secondo può comportare un consumo energetico continuo e prolungato, specialmente se il modello viene utilizzato su larga scala.
Huawei e la sfida ai giganti americani.
Huawei è emersa come il principale rivale di Nvidia in Cina per la produzione di chip di inferenza. Il Financial Times ha riportato che Huawei sta lavorando con aziende come DeepSeek per adattare i modelli di IA a funzionare sui suoi chip Ascend, eliminando la dipendenza dalla tecnologia americana.
Un investitore del settore semiconduttori a Pechino ha commentato: “Huawei sta migliorando. Il governo sta spingendo le grandi aziende tecnologiche ad acquistare i suoi chip e usarli per l’inferenza.”
Dubbi sui costi dichiarati.
DeepSeek ha dichiarato che il modello R1 è stato addestrato con un budget di soli 5,6 milioni di dollari, ma alcuni esperti contestano questa affermazione. Secondo il consulente Dylan Patel di SemiAnalysis, DeepSeek e il suo hedge fund associato High-Flyer avrebbero accesso a decine di migliaia di GPU Nvidia, utilizzate per addestrare i modelli precedenti.
“DeepSeek ha speso ben oltre 500 milioni di dollari in GPU nella sua storia,” ha affermato Patel. “Sebbene il loro addestramento sia stato efficiente, ha richiesto esperimenti e test significativi per funzionare.”
Un impatto di portata globale.
L’effetto dell’ascesa di DeepSeek si è fatto sentire non solo nell’ambito tecnologico, ma anche sui mercati finanziari. Dopo l’annuncio del modello R1, i titoli tecnologici legati all’IA e ai semiconduttori hanno subito un crollo significativo. Aziende come Nvidia, Microsoft e Alphabet hanno registrato perdite di miliardi di dollari in capitalizzazione di mercato. In Europa, il settore tecnologico ha subito un ribasso del 5%, evidenziando la vulnerabilità delle big tech di fronte a innovazioni provenienti dalla Cina.
La notizia del lancio del modello R1 ha portato a una significativa correzione nel settore dell’energia negli Stati Uniti, con aziende fornitrici di energia per i data center che hanno registrato perdite di valore. Ad esempio, Constellation Energy ha subito una perdita del 20%, mentre Vistra Energy ha perso il 30%, a seguito delle previsioni di una domanda energetica inferiore da parte dei grandi data center dedicati all’IA.
Tuttavia, l’ex CEO di Intel Pat Gelsinger, ritiene che questa sia una reazione eccessiva e che la maggiore accessibilità dell’IA possa effettivamente espandere il mercato.
Nonostante ciò, alcuni esperti mettano in dubbio l’entità del risparmio energetico dichiarato da DeepSeek. Test indipendenti mostrano che, sebbene la fase di addestramento sia stata più efficiente, l’inferenza potrebbe ancora richiedere una quantità di energia simile o superiore rispetto ai modelli americani.
L’allineamento con il governo cinese e le implicazioni etiche.
Nonostante la sua portata globale, DeepSeek non è immune da critiche. I suoi modelli mostrano un chiaro allineamento con le politiche del governo cinese, in particolare per quanto riguarda la moderazione dei contenuti. Test condotti su argomenti politicamente sensibili, come le proteste di Piazza Tiananmen, hanno rivelato che l’IA evita risposte dirette o ripropone narrazioni ufficiali. Questo solleva preoccupazioni sul potenziale utilizzo di modelli open source per diffondere censura o propaganda.
Impatti economici e finanziari della maggiore efficienza energetica di DeepSeek
L’efficienza energetica di DeepSeek ha avuto ripercussioni anche sui mercati finanziari. La notizia del lancio del modello R1 ha portato a una significativa correzione nel settore dell’energia negli Stati Uniti, con aziende fornitrici di energia per i data center che hanno registrato perdite di valore. Ad esempio, Constellation Energy ha subito una perdita del 20%, mentre Vistra Energy ha perso il 30%, a seguito delle previsioni di una domanda energetica inferiore da parte dei grandi data center dedicati all’IA.
Nonostante ciò, alcuni esperti mettano in dubbio l’entità del risparmio energetico dichiarato da DeepSeek. Test indipendenti mostrano che, sebbene la fase di addestramento sia stata più efficiente, l’inferenza potrebbe ancora richiedere una quantità di energia simile o superiore rispetto ai modelli americani.
Conclusione: innovazione o minaccia?
DeepSeek rappresenta un caso emblematico delle tensioni geopolitiche e tecnologiche tra Cina e Stati Uniti. Da un lato, la sua ascesa dimostra che la Cina è in grado di competere con i leader globali nel settore dell’IA, nonostante le sanzioni e le restrizioni. Dall’altro, solleva interrogativi su come bilanciare l’innovazione tecnologica con le implicazioni etiche e geopolitiche.
Il futuro dell’intelligenza artificiale sembra dunque più competitivo che mai e il dominio statunitense nel settore non è più garantito. La competizione globale sta diventando più intensa e controversa, con DeepSeek pronta a riscrivere le regole del gioco.
PAOLO POLETTI
