La società ha sviluppato una nuova tecnica per effettuare traduzioni automatiche in tempo reale.
di Karen Hao
La sfida: Sviluppare un sistema di traduzione simultanea è difficile perché le parole variano da un linguaggio a un altro. Basti prendere le seguenti frasi in inglese e cinese:
“The US president meets with the English prime minister.”
“美国总统与英国首相会晤.”
In inglese, il verbo “meet” figura all’inizio del periodo, mentre la sua controparte cinese, “会晤” (huiwu), figura alla fine. Per via di queste regole differenti, sistemi commerciali per la traduzione “in tempo reale” devono attendere la fine del periodo prima di poter avviare il processo di traduzione nella lingua designata. Il risultato è una user experience goffa e lenta.
Come funziona: Il nuovo approccio sviluppato da Baidu è in grado di ridurre i tempi di attesa avviando la fase di traduzione prima della fine del periodo. Se il sistema dovesse tradurre l’esempio precedente, il processo comincerebbe immediatamente prima del verbo, partendo dal presupposto che il soggetto (il presidente) compirà un’azione.
L’idea di questo approccio è nata prendendo spunto dalla tecnica di anticipazione comunemente utilizzata dai traduttori umani per seguire i periodi elaborati dall’oratore.
Lavori in corso: Come per qualunque modello di apprendimento automatico predittivo, il sistema risulta accurato in rapporto alla quantità di dati presentati con strutture di periodo simili. È presto per parlare di una imminente implementazione su larga scala.
A seguito di alcuni test condotti su periodi costruiti con parole scandite nel tempo, i ricercatori di Baidu hanno scoperto che il sistema non è ancora abile quanto un sistema di traduzione integrale dei periodi. Il nuovo approccio li ha ugualmente entusiasmati.
“La traduzione simultanea è un’operazione estremamente complessa e faticosa per un interprete umano”, spiega Liang Huang, principale scienziato di Baidu Research, “per cui speriamo che le macchine possano rendere questo servizio più accessibile per professionisti e consumatori”.
(MO)