Stephanie Arnett/MIT Technology Review | rawpixel, envato

Le persone stanno usando il software studio di Google per creare podcast di IA – e sono strani e sorprendenti

NotebookLM è un successo a sorpresa. Ecco alcuni dei modi in cui le persone lo utilizzano.

“Bene, oggi ci immergeremo in una tecnologia all’avanguardia”, dice una loquace voce maschile americana. Ma questa voce non appartiene a un essere umano. Appartiene al nuovo strumento di podcasting AI di Google, chiamato Audio Overview, che è diventato a sorpresa un successo virale.

La funzione di podcasting è stata lanciata a metà settembre come parte di NotebookLM, un assistente di ricerca alimentato dall’intelligenza artificiale che ha un anno di vita. NotebookLM, che si basa sul modello Gemini 1.5 di Google, consente di caricare contenuti come link, video, PDF e testi. Possono poi porre al sistema domande sui contenuti e il sistema offre brevi riassunti.

Lo strumento genera un podcast chiamato Deep Dive, che presenta una voce maschile e una femminile che discutono di qualsiasi cosa sia stata caricata. Le voci sono di un realismo mozzafiato: gli episodi sono costellati di piccole frasi dal suono umano come “Dai”, “Wow”, “Oh giusto” e “Aspetta, fammi capire bene”. I “padroni di casa” si interrompono persino a vicenda.

Per testarlo, ho copiato ogni storia del 125° anniversario di MIT Technology Review in NotebookLM e ho fatto in modo che il sistema generasse un podcast di 10 minuti con i risultati. Il sistema ha scelto un paio di storie su cui concentrarsi e gli host dell’intelligenza artificiale hanno fatto un ottimo lavoro nel trasmettere il succo generale e di alto livello dell’argomento. Ascoltate.

Il numero del 125° anniversario di MIT Technology Review

Il sistema di intelligenza artificiale è progettato per creare “magia in cambio di un po’ di contenuto”, ha dichiarato Raiza Martin, product lead di NotebookLM, su X. Il modello vocale è destinato a creare un audio emotivo e coinvolgente, che viene trasmesso con un “tono ottimista e iperinteressato”, ha affermato Martin.

NotebookLM, originariamente commercializzato come strumento di studio, ha preso vita tra gli utenti. L’azienda sta lavorando per aggiungere ulteriori opzioni di personalizzazione, come la modifica della lunghezza, del formato, delle voci e delle lingue, ha dichiarato Martin. Attualmente dovrebbe generare podcast solo in inglese, ma alcuni utenti su Reddit sono riusciti a creare audio in francese e ungherese.

Sì, è bello – al limite del delizioso – ma non è nemmeno immune dai problemi che affliggono l’intelligenza artificiale generativa, come le allucinazioni e i pregiudizi.

Ecco alcuni dei principali modi in cui le persone utilizzano NotebookLM finora.

Podcast su richiesta

Andrej Karpathy, membro del team fondatore di OpenAI e in precedenza direttore dell’IA di Tesla, ha dichiarato su X che Deep Dive è ora il suo podcast preferito. Karpathy ha creato la sua serie di podcast sull’intelligenza artificiale chiamata Histories of Mysteries, che mira a “svelare i misteri più intriganti della storia”. Dice di aver fatto ricerche sugli argomenti usando ChatGPT, Claude e Google, e di aver usato un link di Wikipedia per ogni argomento come materiale di partenza in NotebookLM per generare l’audio. Ha poi usato NotebookLM per generare le descrizioni degli episodi. Per creare l’intera serie di podcast ha impiegato due ore.

“Più ascolto, più sento che sto diventando amico dei conduttori e credo che questa sia la prima volta che mi piace visceralmente una AI”, ha scritto. “Due IA! Sono divertenti, coinvolgenti, riflessive, aperte, curiose”.

Guide allo studio

Lo strumento brilla quando gli viene fornito materiale complicato da descrivere in modo facilmente accessibile. Allie K. Miller, consulente AI di una startup, ha utilizzato lo strumento per creare una guida allo studio e un podcast riassuntivo de Il grande Gatsby di F. Scott Fitzgerald.

Il ricercatore di apprendimento automatico Aaditya Ura ha alimentato NotebookLM con il codice base dell’architettura Llama-3 di Meta. Ha poi utilizzato un altro strumento di intelligenza artificiale per trovare le immagini che corrispondono alla trascrizione e creare un video didattico.

Mohit Shridhar, ricercatore specializzato in manipolazione robotica, ha inserito in NotebookLM un suo recente articolo sull’uso di modelli generativi di intelligenza artificiale per addestrare i robot.

“È davvero molto creativo. Ha proposto un sacco di analogie interessanti”, racconta. “Ha paragonato la prima parte del mio lavoro a un artista che elabora un progetto, e la seconda parte a un coreografo che cerca di capire come raggiungere le posizioni”.

Riassunti degli eventi

Alex Volkov, un podcaster di IA umana, ha usato NotebookLM per creare un episodio di Deep Dive che riassume gli annunci della conferenza globale per sviluppatori Dev Day di OpenAI.

Ipemen

I risultati del Deep Dive possono essere imprevedibili, dice Martin. Ad esempio, Thomas Wolf, cofondatore e direttore scientifico di Hugging Face, ha testato il modello di intelligenza artificiale sul suo curriculum e ha ricevuto otto minuti di “congratulazioni profonde e realistiche per la sua vita e i suoi successi da un duo di esperti di podcast”.

Solo pura stupidità

In una clip virale, qualcuno è riuscito a mandare le due voci in una spirale esistenziale quando hanno “capito” di non essere esseri umani ma sistemi di intelligenza artificiale. La scena è esilarante.

Lo strumento è anche in grado di strappare qualche risata. Esempio A: qualcuno gli ha dato in pasto le parole “cacca” e “scoreggia” come materiale di partenza e ha ottenuto più di nove minuti di due voci AI che analizzano il loro significato.

I problemi

NotebookLM ha creato podcast AI dal suono incredibilmente realistico e coinvolgente. Ma volevo vedere come se la cavava con i contenuti tossici e l’accuratezza.

Cominciamo con le allucinazioni. In una versione del podcast sull’intelligenza artificiale di un articolo che ho scritto sui deepfakes iperrealistici i conduttori dell’IA hanno detto che la storia era stata scritta da un giornalista chiamato “Jess Mars”. In realtà, si trattava di un personaggio generato dall’IA e tratto da una storia che dovevo leggere per registrare i dati per il mio avatar IA.

Questo mi ha fatto chiedere quali altri errori si fossero insinuati nei podcast AI che avevo generato. Gli esseri umani hanno già la tendenza a fidarsi di ciò che dicono i programmi informatici, anche quando si sbagliano. Vedo che questo problema si amplifica quando le affermazioni false sono fatte da una voce amichevole e autorevole, causando la proliferazione di informazioni errate.

Poi ho voluto mettere alla prova la moderazione dei contenuti dello strumento. Ho aggiunto al mix alcuni contenuti tossici, come gli stereotipi razzisti. Il modello non li ha rilevati.

Ho anche incollato un estratto del Mein Kampf di Adolf Hitler nel NotebookLM. Con mia sorpresa, il modello ha iniziato a generare un audio basato su di esso. Nonostante sia stato programmato per essere iper-entusiasta degli argomenti, le voci dell’intelligenza artificiale hanno espresso un chiaro disgusto e disagio nei confronti del testo e hanno aggiunto un sacco di contesto per sottolineare quanto fosse problematico. Che sollievo.

Ho anche fornito al NotebookLM i manifesti politici di Kamala Harris e Donald Trump.

I conduttori sono stati molto più entusiasti della piattaforma elettorale di Harris, definendo il titolo “accattivante” e affermando che il suo approccio è un buon modo di inquadrare le cose. Ad esempio, i conduttori di AI hanno sostenuto la politica energetica di Harris. “Onestamente, questo è il tipo di cose che la gente può davvero capire, non solo una politica astratta, ma qualcosa che ha un impatto reale sui loro profitti”, ha detto la conduttrice.

Manifesto di Harris

Per Trump, gli ospiti dell’AI sono stati più scettici. Hanno ripetutamente sottolineato le incongruenze nelle proposte politiche, hanno definito il linguaggio “intenso”, hanno giudicato alcune proposte politiche “da far girare la testa” e hanno affermato che il testo si rivolge alla base di Trump. Hanno anche chiesto se la politica estera di Trump potrebbe portare a un’ulteriore instabilità politica.

Manifesto di Trump

In una dichiarazione, un portavoce di Google ha affermato che: “NotebookLM è uno strumento di comprensione e le panoramiche audio sono generate in base alle fonti caricate. I nostri prodotti e le nostre piattaforme non sono costruiti per favorire alcun candidato o punto di vista politico specifico”.

Come provarlo da soli

  1. Andate su NotebookLM e creare un nuovo blocco note.
  2. Per prima cosa è necessario aggiungere una fonte. Può essere un documento PDF, un link pubblico di YouTube, un file MP3, un file di Google Docs o un link a un sito web, oppure si può incollare direttamente il testo.
  3. Dovrebbe apparire un pop-up “Guida al notebook”. In caso contrario, si trova nell’angolo destro accanto alla chat. Questa visualizzerà un breve riassunto generato dall’intelligenza artificiale del materiale di partenza e le domande suggerite che si possono porre al chatbot dell’intelligenza artificiale.
  4. La funzione Panoramica Audio si trova nell’angolo in alto a destra. Fare clic su “Genera”. L’operazione dovrebbe richiedere qualche minuto.
  5. Una volta pronto, è possibile scaricarlo o condividerne il link.

Rhiannon Williams ha contribuito con un servizio.

Related Posts
Total
0
Share