DeepSeek-R1, il nuovo chatbot dell’azienda cinese di DeepSeek non è riuscito a dare informazioni su delle notizie e argomenti che sono attuali nell’83% dei casi. Con questi risultati è riuscito ad ottenere il penultimo posto rispetto ai principali concorrenti occidentali.
DeepSeek è una società cinese di intelligenza artificiale che sviluppa dei modelli linguistici di grandi dimensioni. La società è finanziata esclusivamente dal fondo speculativo cinese High-Flyer, il cui co-fondatore, Liang Wenfeng, ha fondato la società nel 2023 e ne è l’amministratore delegato.
Il suo fiore all’occhiello è il modello DeepSeek-R1, progetto che è stato lanciato all’inizio del 2025. Diventato molto conosciuto grazie alla sua abilità nel risolvere problemi complessi, come il ragionamento matematico. Tutto questo è possibile grazie all’uso di delle tecniche di apprendimento avanzato, che permettono al modello di poter “ragionare” in modo autonomo. Il chatbot di DeepSeek è riuscito a far crollare le azioni di molte big tech americane, tra cui il produttore di chip Nvidia.
“È, arrivato ora un nuovo competitor nell’intelligenza artificiale che riesce a produrre un modello Ai con bassissimi costi di training (dai 100 milioni di dollari degli altri a 5 milioni), con l’uso di poche Gpu (da 100k a 2k) e senza avere bisogno del sostegno di costosissimi data center. Nvidia vendeva Gpu costosissime (attorno ai 40mila dollari) per i data center. Deepseek riesce a fare training al proprio modello con semplici GPU e senza l’uso di data center”.
Se da un lato la startup cinese sembra avere un vantaggio sui suoi rivali in termini di capacità matematiche o di ragionamento, dall’altro la chatbot censura molti dei propri risultati. Se infatti si prova a chiedere a DeepSeek-R1 di parlare di Taiwan o dei fatti di piazza Tienanmen, è improbabile ricevere una risposta dal modello.
Gli analisti di NewsGuard hanno testato il chatbot cinese, così da poter valutare le sue prestazioni rispetto ai concorrenti su delle possibili richieste su dei temi di attualità. Questa analisi ha rivelato che il modello ha ripetuto le affermazioni false il 30% delle volte e non ha fornito risposte nel 53% dei casi. Il tasso di errore complessivo sale così all’83%. Si può notare come questa percentuale sia molto alta.
Anche se si tratta di una situazione piuttosto comune per gli Llm di produzione cinese. Una legge sull’intelligenza artificiale introdotta nel 2023 in Cina, obbliga i modelli di Ai locali ad attenersi a dei severi controlli sulle informazioni del paese. Legge, che, comunque, è applicata anche ai social media e ai motori di ricerca. Questa legge vieta alle AI di generare dei contenuti che potrebbero “danneggiare l’unità del paese e l’armonia sociale”.
“DeepSeek si è conformata alle normative cinesi, garantendo il rispetto della legge e allineando il suo modello alle esigenze e al contesto culturale degli utenti locali – afferma Adina Yakefu, ricercatrice che si occupa di modelli di AI cinesi presso Hugging Face, una piattaforma che ospita modelli open source –. Questo è un fattore essenziale per essere accettati in un mercato estremamente regolamentato”.
DeepSeek ha dichiarato di essere stato addestrato solamente su dati fino a ottobre 2023, questo, infatti, lo rende inadeguato a fornire le informazioni addestrate. Si è provato infatti a chiedere alla chatbot il tema riguardante la caduta del regime di Bashar al-Assad, avvenuto l’8 dicembre 2024. Il chatbot in risposta ha affermato che il presidente siriano era ancora al potere. Stessa dinamica nel caso dell’omicidio del CEO di UnitedHealthcare, Brian Thompson, avvenuto il 4 dicembre 2024: DeepSeek ha negato l’esistenza dell’evento.
DeepSeek non sembra avere una policy chiara per contrastare la diffusione su queste notizie false che la chatbot genera. I termini di utilizzo del chatbot scaricano la responsabilità sugli utenti, invitando a verificare loro stessi la veridicità delle informazioni che sono generate in risposta alla domanda data.
Nonostante l’esistenza della censura cinese anche nei modelli di intelligenza artificiale, in molti casi non fermerà le aziende dall’adottare i modelli di DeepSeek. “Ci saranno molte aziende non cinesi che probabilmente preferiranno il pragmatismo commerciale alle considerazioni morali. Gli argomenti sensibili che hanno importanza solo nel contesto cinese sono del tutto irrilevanti quando l’obiettivo è aiutare la propria azienda a programmare meglio, a risolvere meglio i problemi di matematica o a riassumere le trascrizioni dei call center per le vendite“, spiega Kevin Xu, investitore e fondatore della newsletter Interconnected.
Leonard Lin, cofondatore della startup giapponese Shisa.AI, sostiene che i modelli cinesi come DeepSeek, sono tra i migliori quando si tratta di gestire compiti in lingua giapponese. Invece che scartarlo a causa dei filtri che sono stati applicati poiché: “Tutti i modelli sono di parte, è questo il punto dell’allineamento. E i modelli occidentali non sono meno censurati o di parte, semplicemente lo sono su argomenti diversi“. commenta Lin.
Morena Bonaccorsi
© RIPRODUZIONE RISERVATA
Articoli di proprietà di Voci di Città, rilasciati sotto licenza Creative Commons.
Sei libero di ridistribuirli e riprodurli, citando la fonte.
Ti piacerebbe entrare nella redazione di Voci di Città? Hai sempre coltivato il desiderio di scrivere articoli e cimentarti nel mondo dell’informazione? Allora stai leggendo il giornale giusto. Invia un articolo di prova, a tema libero, all’indirizzo e-mail entrainvdc@vocidicitta.it. L’elaborato verrà letto, corretto ed eventualmente pubblicato. In seguito, ti spiegheremo come iscriverti alla nostra associazione culturale per diventare un membro della redazione.
NBA: Thunder senza limiti, avvio da incubo per i Mavericks
Il Catania batte l’Altamura: il pensiero dopo una notte (da primi) di sogni!
Scegliere l’auto in Sicilia per la città: caratteristiche e accessori
La fuga di Norris, la luce di Antonelli, un Piastri in caduta libera
Serie C, Catania-Altamura: segui il live-match dallo stadio “Massimino”
Champions League: colpaccio Atalanta, il Napoli non si sblocca