L’intelligenza artificiale cinese DeepSeek sfida ChatGPT con risorse ridotte

Nel panorama dell’intelligenza artificiale generativa, dominato finora da colossi statunitensi come OpenAI, Google e Meta, una nuova realtà cinese si sta facendo strada con ambizioni dichiarate e risultati sorprendenti. Si tratta di DeepSeek, una giovane azienda fondata nel 2023, che con il suo ultimo modello DeepSeek-V3 punta a competere direttamente con GPT-4o, ma con un decimo del budget.

Una nuova potenza emergente nel settore AI

Negli ultimi anni, la Cina ha progressivamente abbandonato l’etichetta di “fabbrica del mondo” per assumere un ruolo sempre più centrale nella ricerca e sviluppo tecnologico. Dopo aver conquistato spazi significativi nei settori dei semiconduttori, degli smartphone e dell’automotive, ora punta sull’intelligenza artificiale, con una strategia che coniuga sovranità tecnologica, open source e velocità esecutiva.

DeepSeek-V3: un modello open source ad alte prestazioni

Annunciato il 26 dicembre 2024, DeepSeek-V3 presenta caratteristiche di alto profilo:

  • 671 miliardi di parametri, superando anche Meta Llama 3.1, il miglior modello open source americano

  • Un costo di addestramento di soli 5,5 milioni di dollari, circa dieci volte inferiore a quello stimato per GPT-4o

  • Addestramento su 14,8 trilioni di token, indicatore di un dataset esteso e variegato

  • Un’interfaccia fortemente ispirata a ChatGPT, con motore di ricerca integrato

  • Velocità di output migliorata: 60 token al secondo

  • API a basso costo, che potrebbe attrarre sviluppatori ed ecosistemi in cerca di alternative economiche alle soluzioni americane

Il tutto in un framework completamente open source, una scelta strategica che favorisce la trasparenza, l’adozione rapida e la collaborazione internazionale.

Risultati promettenti, soprattutto nei compiti tecnici

Secondo i primi benchmark pubblicati da DeepSeek, il modello V3 risulta competitivo con GPT-4o e Claude 3.5 Sonnet, in particolare su compiti matematici e di programmazione, settori chiave per l’automazione industriale e la ricerca scientifica. Il modello eccelle naturalmente nella lingua cinese, ma si dimostra efficace anche in inglese, pur con qualche imprecisione segnalata dai primi utenti.

Una strategia che mette in discussione il primato USA

La forza di DeepSeek non sta solo nella tecnologia, ma nella sua efficienza economica e nella capacità di catalizzare attenzione e risorse interne, in un contesto politico favorevole all’innovazione locale. La comparsa sulla scena di un’alternativa cinese a ChatGPT ha attirato l’attenzione dei media e degli analisti americani, provocando reazioni sorprendenti. Alcuni esperti hanno criticato la politica statunitense troppo restrittiva verso l’open source, accusata di rallentare l’innovazione interna.

Un ecosistema in piena espansione

DeepSeek non è un caso isolato. L’ecosistema cinese dell’AI sta rapidamente maturando, con progetti come:

  • CogVideoX e HunyuanVideo (Tencent), per la generazione video

  • Kling, nuovo sistema multimediale in fase avanzata

  • Qwen, il modello open source di Alibaba

Tutti accomunati da un approccio aperto e da un accesso più ampio ai dati rispetto ai concorrenti occidentali, spesso limitati da vincoli legali e commerciali.

Le incognite geopolitiche

Resta da capire come reagirà Washington. La precedente amministrazione Trump aveva già intrapreso una linea dura contro Huawei e altri gruppi tecnologici cinesi. Di fronte all’avanzata di DeepSeek, un nuovo ciclo di sanzioni o restrizioni tecnologiche non è da escludere. La competizione tra modelli linguistici si intreccia sempre più con equilibri geopolitici, e l’intelligenza artificiale rischia di diventare un nuovo terreno di scontro strategico.

Conclusione: un avversario credibile con risorse limitate

DeepSeek rappresenta oggi una sfida concreta al monopolio americano nell’intelligenza artificiale, dimostrando che è possibile ottenere prestazioni avanzate con costi contenuti e un approccio collaborativo. Se i test indipendenti confermeranno le promesse, la Cina potrebbe diventare un punto di riferimento anche nel settore dei modelli linguistici, accelerando un processo di multipolarizzazione tecnologica che avrà implicazioni profonde per il futuro dell’economia digitale globale.

Articoli simili :

Vota questo articolo

Lascia un commento