28

Deepseek usa migliaia di super GPU H100 che non dovrebbe avere? NVIDIA smentisce anche Musk, ma restano dubbi

Il successo del modello R1 di DeepSeek ha scatenato voci su una presunta violazione delle normative statunitensi, con NVIDIA che è intervenuta per chiarire la situazione e promuovere il "Test Time Scaling".

NOTIZIA di Raffaele Staccini   —   28/01/2025
Deepseek e NVIDIA, immagine realizzata con Imagen 3

L'ascesa di DeepSeek, startup cinese che ha sfidato il dominio di OpenAI con il suo modello di linguaggio R1, ha acceso un dibattito internazionale sulle modalità con cui l'azienda sia riuscita a raggiungere risultati così sorprendenti a costi contenuti.

Trattandosi di un'azienda cinese, era solo questione di tempo prima che indiscrezioni si concentrassero sulla presunta acquisizione di migliaia di GPU H100 di NVIDIA, la cui vendita alla Cina è vietata da specifiche normative statunitensi. Figure di spicco del settore tech, come Alexandr Wang (CEO di Scale AI) e l'onnipresente Elon Musk, hanno contribuito ad alimentare le speculazioni, ipotizzando che DeepSeek avesse aggirato i controlli sulle esportazioni per procurarsi l'hardware necessario.

La risposta di NVIDIA

Alle voci che hanno cominciato a circolare incontrollate, rilanciando l'ipotesi di un "condotto" per portare merci statunitensi in Cina tramite Singapore, NVIDIA ha deciso di rispondere con una dichiarazione ufficiale. Secondo l'azienda, DeepSeek avrebbe sfruttato una tecnica innovativa chiamata "Test Time Scaling", che permette di sviluppare nuovi modelli di intelligenza artificiale utilizzando risorse computazionali già esistenti e ampiamente disponibili, nel pieno rispetto delle leggi internazionali.

Al momento X/Twitter ha dei problemi
e non è possibile caricare il post

Questo approccio, che si aggiunge alle strategie di scaling per il pre-training e il post-training, dimostrerebbe come sia possibile ottenere performance elevate senza dover necessariamente ricorrere a hardware di ultima generazione o a pratiche illegali. L'inferenza, ovvero l'utilizzo del modello addestrato, richiede comunque un numero significativo di GPU NVIDIA e reti ad alte prestazioni, ma non implica l'accesso a tecnologie proibite.

La presa di posizione di NVIDIA mira a placare le polemiche, ma solleva anche interrogativi sul futuro del mercato delle GPU. Se il "Test Time Scaling" dovesse rivelarsi una soluzione efficace e facilmente applicabile, la domanda di hardware di punta potrebbe subire una contrazione, con conseguenze significative per aziende come la stessa NVIDIA. Non è un caso che le azioni della società abbiano registrato un crollo del 17% in borsa a seguito della diffusione della notizia, facendo perdere a NVIDIA il secondo posto nella classifica delle aziende più capitalizzate al mondo.

Al momento X/Twitter ha dei problemi
e non è possibile caricare il post

Ma quale sarà l'impatto a lungo termine del "Test Time Scaling" sull'industria dell'intelligenza artificiale? E riuscirà a democratizzare l'accesso a modelli di linguaggio sempre più potenti e sofisticati? Diteci la vostra nei commenti qua sotto, mentre se volete saperne di più potete leggere la nostra notizia di ieri su come DeepSeek R1 ha sfidato OpenAI.