Durante lo Spring Update, l’azienda OpenAi ha lanciato un nuovo modello di intelligenza artificiale disponibile per gli utenti in modalità gratuita: la ChatGPT-4o, dove “0” sta per “omnimodel”. Questo nuovo modello di chatbot presenta numerose novità rispetto ai precedenti, novità che permetteranno un’interazione più “naturale” tra uomo e macchina.
Avreste mai immaginato di rivolgervi a un’intelligenza artificiale e ricevere feedback simili a quelli che ricevereste da un essere umano? Non si tratta di un film sci-fi. Se si assiste alla dimostrazione della demo di ChatGPT-40, ciò che salta subito all’occhio è la nuova capacità dell’IA di conversare con l’utente. Oltre a possedere un tempo di reazione molto più veloce (di 232 millisecondi) il tono della “voce” è più emotivo e meno schematico. Rispetto ai modelli di ChatGPT-3.5 e ChatGPT-4, riesce a gestire i momenti di interruzione di una conversazione riducendo il ritardo di 2-3 secondi.
La CTO (Chief Technology Officer) di OpenAi, Mira Murati, ha spiegato che tutto ciò è possibile perché i tre passaggi che nei modelli precedenti avvenivano separatamente nella ChatGPT-40 attraversano la stessa rete neurale. Prima esistevano tre modelli per il dialogo di ChatGPT: la trascrizione dall’audio in testo, l’elaborazione di una risposta testuale e infine la riconversione del testo in audio. Questo comportava una perdita di informazioni e l’impossibilità di osservare il tono della voce, distinguere tra più interlocutori, rilevare i rumori di fondo o generare più stati emotivi con la voce; cosa che GPT-4o, invece, riesce a fare, perché sia gli input che gli output vengono processati contemporaneamente.
Tuttavia, non sono solo le sue capacità di conversazione ad essere migliorate. ChatGPT-40 può comprendere, analizzare e discutere le immagini molto più velocemente. Basta attivare la fotocamera della chatbot e posarla su qualsiasi oggetto intorno a noi, per poi domandare a ChatGPT-40 ciò che vogliamo sapere su tale oggetto. L’IA è in grado di interagire con l’utente e aiutarlo per qualsiasi dubbio o difficoltà. Questo la rende un’assistente e una guida incredibile: sarebbe come avere accanto a noi un amico o un insegnante pronti ad assisterci in qualunque momento.
Infatti, ChatGPT-4o può tradurre da 50 lingue diverse in tempo reale; può guidare l’utente al ragionamento per la realizzazione di piani marketing o la risoluzione di compiti scolastici; può partecipare a meeting online o trascrivere una conversazione avvenuta tra più interlocutori. Nella chat si possono inserire documenti, file audio, immagini, e ricevere in cambio riassunti, analisi, trascrizioni, caricature per comics. Le funzionalità di ChatGPT-40 possono essere impiegate per tantissimi scopi.
È indubbio che rendere ChatGPT-4o, un modello ancora più potente della GPT-4 (che è a pagamento), gratuita per tutti, avrà un impatto non indifferente all’interno della vita quotidiana. Come ha dichiarato Mira Murati, la missione di OpenAi è rendere l’intelligenza artificiale disponibile per la maggior parte delle persone. Cosa fattibile, se si contano gli oltre 100 milioni di persone che utilizzano ChatGPT ogni giorno. Le funzionalità di ChatGPT-4o verranno distribuite gradualmente nel corso di queste settimane.
Una domanda sorge, però, spontanea: quanto può essere sicura un IA così veloce e potente, se resa disponibile gratuitamente? OpenAI ha dichiarato di aver progettato GPT-4o per renderla sicura, attraverso tecniche come il filtraggio dei dati e il raffinamento del comportamento del modello dopo il processo di training.
Inoltre, ha creato appositi sistemi di sicurezza per fornire limiti agli output vocali. Secondo il Preparedness Framework di OpenAI, le valutazioni umane a automatiche eseguite mostrano che GPT-4o non supera il livello di rischio “medio”. Questa valutazione ha visto un’ampia fase di testing esterno, con la partecipazione di oltre settanta esperti in campi come psicologia sociale, bias, equità e disinformazione. Le modalità audio di GPT-4o, però, presentano una varietà di nuovi rischi. Ecco perché, al lancio, gli output audio saranno limitati alla selezione di voci preimpostate e rispetteranno le politiche di sicurezza esistenti.
In ogni caso, l’entusiasmo per la nuova ChatGPT-4o è palpabile. “Parlare con un computer non mi è mai sembrato davvero naturale, questa volta lo è” ha dichiarato Sam Altman, Ceo e co-fondatore di OpenAi. “Con l’aggiunta della personalizzazione (opzionale), dell’accesso alle informazioni, della capacità di intraprendere azioni per conto dell’utente e di molto altro ancora, vedo un futuro entusiasmante in cui saremo in grado di usare i computer per fare molto di più di quanto non sia mai stato fatto prima”.
Valentina Contarino
© RIPRODUZIONE RISERVATA
Articoli di proprietà di Voci di Città, rilasciati sotto licenza Creative Commons.
Sei libero di ridistribuirli e riprodurli, citando la fonte.
Nata a Catania nell’estate del 2002, Valentina ha sempre creduto che una pagina bianca fosse lo spazio più grande per esprimere la propria voce. Dopo aver conseguito la maturità classica, ha partecipato alla XXXIV edizione del Premio Italo Calvino e ha pubblicato racconti per un blog. Ora frequenta la facoltà di Lettere all’Università degli Studi di Catania, macinando pagine su pagine ogni giorno. Convinta che le parole siano tra gli strumenti più potenti che abbiamo, sogna di riempire pagine bianche per lavoro. Non ha ancora realizzato nulla di grande, ma il suo motto è che “si parte sempre dal basso”, o no?