Quello che il traduttore di Skype perde per strada

Il software di traduzione in tempo reale di Skype evidenzia dei sorprendenti progressi nel campo dell’apprendimento automatico – anche se continua a faticare con le sottigliezze nella comunicazione fra esseri umani.

di John Pavlus

Talvolta, il massimo riconoscimento che una nuova tecnologia innovativa può ricevere è un credibile confronto con Star Trek. L’Oculus Rift è come il ponte olografico; le stampanti 3-D sono come i replicatori di materia; Qualcomm sta persino sponsorizzando un X-Prize per la creazione di un tricoder.

Skype Translator, l’app di traduzione in tempo reale disponibile nella versione beta open per gli utenti di Windows 8.1 viene ampiamente paragonato al “traduttore universale” che i capitani Kirk e Picard utilizzano per comunicare agilmente con i loro interlocutori alieni. Pur restando un affascinante strumento tecnologico, però, Skype Translator è meno sofisticato.

Skype Translator esegue una traduzione istantanea delle chat di testo in oltre 40 lingue, ma la sua caratteristica principale è la traduzione in tempo reale delle conversazioni vocali fra inglese e spagnolo (Microsoft, che è proprietaria di Skype, non ha precisato quali altre lingue intende incorporare nel software).

A differenza del traduttore universale di Star Trek, Skype Translator è progettato per emulare un interprete umano che agisce da intermediario fra i due interlocutori primari.

Questo interprete virtuale è personalizzabile: è possibile selezionare una voce maschile o femminile ed impostare la tolleranza del filtro di profanità. Proprio come un traduttore umano, il sistema “ascolta” una frase, attende una pausa e riferisce le parole in un’altra lingua all’interlocutore dall’altra parte del telefono. La traduzione vocale è udibile da ambo le parti. Durante la mia prova, la sua accuratezza mi ha sorpreso in diverse occasioni.

In teoria, la traduzione di Skype potrebbe essere trasformativa. è come una versione della traduzione in tempo reale di cui godono i leader mondiali in visita alle Nazioni Unite. In pratica, però, è più venire interrotti costantemente da Siri di Apple (o Cortana di Microsoft).

Persino una simile traduzione, grezza ed automatica, è alquanto notevole. Le macchine hanno evidenti problemi a riconoscere parole o frasi con precisione e velocità, e Skype Translator riesce ad ottenere un elevato livello di precisione sfruttando una tecnica conosciuta come apprendimento approfondito. Il software che opera all’interno dei server Microsoft è stato addestrato per riconoscere le parole utilizzando metodi di elaborazione delle informazioni che si ispirano al funzionamento biologico del cervello (vedi “Le magnifiche dieci: Odissea nel cervello“).

L’apprendimento approfondito permette ai computer Microsoft di trasformare agilmente un flusso audio in parti di testo che può quindi analizzare utilizzando convenzionali metodi di traduzione. Con l’aumentare degli utenti che utilizzano questo software, il sistema dovrebbe diventare sempre più efficace nel riconoscere le idiosincrasie di accento e cadenza e, di conseguenza, diventare sempre più utile.

Il software Microsoft cerca di filtrare le disfluenze (quali “uhm”, “ah”, e le ripetizioni) fra parole e periodi. Durante la mia prova, alcune disfluenze sono sfuggite al software, ma la traduzione è ugualmente partita con una velocità ed una precisione sorprendenti.

I limiti del software di Skype sono alquanto indicativi, in quanto mostrano quanto sia difficile imitare le sottigliezze di una vera conversazione fra esseri umani. La determinazione del significato appropriato per una parola in contesti differenti può essere vessante. “Se un software dovesse eseguire una traduzione fra l’inglese americano e quello britannico, e riconoscesse la parola ‘football’, dovrebbe anche comprendere se questa si riferisce al ‘calcio’ o al ‘football americano'”, dice Christopher Manning, un professore di scienza linguistica ed informatica del Natural Language Processing Group dell’Università di Stanford.

Skype Translator non è nemmeno in grado di riconoscere i ritmi di una conversazione normale, per cui non si può esser certi di quando la sua voce robotica interromperà un dialogo per offrire la sua traduzione. Talvolta, questo stesso problema si presenta anche per le persone. “Anche con i traduttori umani, occorre imparare quando dare tempo all’interprete per assorbire quanto avete detto e ripeterlo”, spiega Vikram Dendi, direttore di Microsoft Research.

Con un po’ di pratica si potrebbe apprendere il “ritmo” di Skype Translator e rendere più fluida l’esperienza audio. L’introduzione di un avatar del “Bot” nello schermo potrebbe aiutare a rafforzare la metafora di una terza persona nella chiamata, agevolando magari la modulazione della conversazione fra i due interlocutori umani così da lasciar spazio al software.

Skype Translator offre comunque una soluzione elegante a questo problema generando in tempo reale il testo tradotto della conversazione. L’interfaccia è meno futuristica rispetto alla traduzione parlata, ma pare più naturale e presenta errori più facili da correggere, visto che entrambe le persone possono digitare nella finestra di dialogo in cui compaiono le traduzioni.

Dendi ammette che Skype e Microsoft non sanno ancora quale esperienza offrire agli utenti attraverso questo software. “Quando vediamo queste cose nei programmi TV [come Star Trek], pare ovvio: si parla naturalmente e la propria voce esce già tradotta”, dice. “Quando però si comincia a investigare l’implementazione di un simile sistema e a metterlo in pratica, emergono svariati dettagli che possono rendere l’esperienza più o meno piacevole”.

Altri sforzi per il miglioramento dell’apprendimento approfondito potrebbero aiutare. Alcuni ricercatori di Google e dell’Università di Montreal stanno applicando metodi simili alla traduzione del linguaggio (piuttosto che al semplice riconoscimento delle parole) con un “successo sorprendente”, secondo Manning. Ulteriori progressi potrebbero un giorno rendere virtualmente perfetta la traduzione automatica in tempo reale. Il progresso potrebbe anche incontrare un ostacolo. “è ancora tutto da vedere”, dice Manning. “Credo non sia ancora chiaro quali siano i limiti dell’apprendimento approfondito nella risoluzione di problemi cognitivi di alto livello”.

Per il momento, Skype Translator non ha certo risolto il problema, ma è un ottimo inizio.

(MO)

Related Posts
Total
0
Share