Questo testo è un riassunto del seguente articolo: TechCrunch (eng)
Riassunto
OpenAI ha finalmente rilasciato le capacità video in tempo reale per ChatGPT, che aveva presentato quasi sette mesi fa.
Le polemiche di mesi fa
La prima dimostrazione del Voice Mode with Vision è avvenuta mesi fa, eccola qua. Dopo la pubblicazione si creò un po' di polemica perché sembrava che la voce femminile, simile a quella di Scarlett Johanson, stesse flirtando con l'utente. La vera polemica però doveva ancora arrivare: qualche settimana dopo la stessa attrice ha inviato una lettera ad OpenAI chiedendo di rimuovere la sua voce (che in realtà era appartenente ad una voice actress molto simile). La mossa di Johanson ha aperto le danze ad una protesta più ampia in cui attori e attrici statunitensi hanno chiesto misure più rigide sul training non consentito sulla loro voce o immagine.
La nuova funzione, chiamata Advanced Voice Mode with vision, permette agli utenti di ChatGPT Plus, Team o Pro di utilizzare l'app per inquadrare oggetti con il proprio telefono e ricevere risposte quasi in tempo reale.
Questa funzione può anche interpretare ciò che appare sullo schermo di un dispositivo attraverso la condivisione dello schermo, fornendo spiegazioni e suggerimenti, ad esempio su problemi matematici.
L'accesso a questa funzione sarà progressivo e inizierà giovedì, ma non sarà disponibile subito per tutti: gli abbonati ChatGPT Enterprise ed Edu dovranno aspettare fino a gennaio, e non c'è una data di rilascio prevista per gli utenti in UE, Svizzera, Islanda, Norvegia o Liechtenstein.
Durante una demo, Advanced Voice Mode with vision ha dimostrato le sue capacità di riconoscere disegni realizzati da Anderson Cooper, sebbene possa ancora commettere errori, come dimostrato con un problema di geometria.
Questo aggiornamento è stato ritardato più volte a causa di problemi nelle fasi di sviluppo. Allo stesso tempo, concorrenti come Google e Meta stanno sviluppando funzionalità simili per i loro chatbot.
Contestualmente, OpenAI ha lanciato un nuovo "Santa Mode" per ChatGPT, che introduce la voce di Babbo Natale come impostazione predefinita dell'app.
L'attendibilità della fonte è stata analizzata tramite Media Bias/Fact Check.