Un gruppo di ricercatori di Google ha addestrato una rete neurale per mappare le impronte vocali e utilizzarle nel passaggio da una lingua all’altra.
di Karen Hao
Provate ad ascoltare questo clip audio in lingua spagnola.
Questa è la traduzione in inglese che potreste ricevere attraverso un tradizionale sistema di traduzione automatica.
Questa, invece, è la traduzione che otterreste passando per il nuovo traduttore automatico di Google.
I risultati non sono perfetti, ma potete intuire come il traduttore di Google sia stato in grado di conservare la voce e il tono originali dell’oratore. Questa impresa è possibile grazie alla conversione diretta degli input audio in output, senza alcuno step intermedio. Per contro, i tradizionali traduttori automatici convertono i file audio in testo, traducono il testo, quindi sintetizzano il testo in un nuovo file audio, perdendo le caratteristiche della voce originale.
Il nuovo sistema, soprannominato Translatotron, presenta tre componenti, ciascuna delle quali analizza lo spettrogramma audio dell’oratore – un’istantanea delle frequenze utilizzate, spesso descritte come l’impronta vocale. Il primo elemento sfrutta una rete neurale addestrata per mappare lo spettrogramma audio del linguaggio in entrata in quello del linguaggio in uscita; il secondo converte lo spettrogramma in un’onda audio eseguibile; il terzo componente, infine, può sovrapporre le caratteristiche vocali dell’oratore originale alla registrazione audio in uscita.
Questo approccio non permette solamente di produrre traduzioni più sfumate trattenendo importanti segnali non verbali; in teoria, dovrebbe anche ridurre gli errori di traduzione, perché riduce il numero di passaggi intermedi.
Il Translatortron è ancora una dimostrazione di concetto. Finora, i ricercatori hanno solamente effettuato traduzioni dallo spagnolo all’inglese, con un notevole impiego di dati per l’addestramento della rete neurale. Output audio come quello dimostrativo ci mostrano il potenziale di un eventuale sistema commerciale. Potete ascoltare altre registrazioni tradotte qui.
Immagine: Il segretario generale delle Nazioni Unite, Ban Ki-moon EMILIO MORENATTI/AP
(MO)