Seguici
Iscriviti alla nostra newsletter

    Lettura digitale delle labbra

    Il riconoscimento della parola è una tecnologia a lungo promessa che sta finalmente cominciando a divenire realtà. Tuttavia i migliori sistemi attuali tendono a fallire quando chi parla si trova in un luogo rumoroso. Per affrontare questo problema, i ricercatori stanno aggiungendo la lettura delle labbra ai sistemi esistenti. Mentre le persone si affidano alle forme della bocca ogni volta che bisogna interpretare le parole, la lettura delle labbra non è un compito facile per un computer. Infatti una singola forma può corrispondere a diversi suoni specifici. Inoltre i movimenti della bocca cominciano almeno 120 millisecondi prima che un suono sia pronunciato. L’uomo può usare altri indizi come il contesto della frase e le espressioni facciali per superare queste difficoltà, ma fino a poco tempo fa ai computer mancava la potenza di elaborazione per fare la stessa cosa.

    Ora ricercatori di Intel, IBM e altre istituzioni stanno modificando i programmi di elaborazione del linguaggio per collegare ogni suono vocale a più movimenti possibili della bocca, consentendo al software di fare una previsione accettabile di quello che è stato detto. In alcuni test in ambienti rumorosi, l’aggiunta di informazione visiva ha incrementato l’accuratezza del riconoscimento della parola dal 20 al 75 per cento, afferma Ara Nefian, un ricercatore di Intel Research, a Santa Clara, in California.

    All’inizio questo sistema sarà più utile ai medici e a chi lavora in ambienti rumorosi che richiedono maggiore precisione di quella offerta dal software di dettatura per ufficio. Pensando a questo tipo di utenza, IBM sta inserendo una telecamera minuscola nella sede del microfono che va ad aggiungersi al software esistente per il riconoscimento della parola. Più in là nel tempo, i ricercatori intravedono il giorno in cui il cruscotto dell’automobile sarà dotato di una telecamera puntata sulle labbra del guidatore per i controlli azionati vocalmente o il cellulare potrà guardare quello che una persona sta dicendo.

    Related Posts
    Total
    0
    Share