Per milioni di persone, soprattutto gli asiatici-americani, che si collocano dal versante sbagliato della barriera linguistica americano, la tecnologia sta creando ulteriori ostacoli invece di rimuoverli.
di Tate-Ryan Mosley
Jennifer Xiong ha trascorso la sua estate aiutando la comunità Hmong in California a registrarsi per votare alle elezioni presidenziali statunitensi. Gli Hmong sono un gruppo etnico di 300.000 persone che proviene dalle montagne di Cina, Vietnam, Laos e Thailandia ma non ha un proprio paese, e Xiong è una volontaria dello Hmong Innovating Politics, o HIP, a Fresno che ha passato ore a fare operazioni bancarie telefoniche e lavorare su annunci da pubblicare su canali radio e TV Hmong.
È stato un lavoro stimolante. “Si trattava di una cosa completamente nuova per me”, dice. “Non ero abituato a stare in contatti con giovani progressisti, principalmente donne che svolgono questo lavoro nella nostra comunità”. A detta di tutti, il lavoro da fare era enorme. L’affluenza alle urne degli asiatici-americani alle elezioni del 2020 in generale è stata straordinaria e gli osservatori dicono che l’affluenza alle urne tra i cittadini Hmong è stata la più alta mai registrata.
Ma Xiong dice che è stato anche incredibilmente scoraggiante.
Sebbene gli Hmong abbiano legami da lungo tempo con gli Stati Uniti – molti furono incoraggiati a migrare attraverso il Pacifico dopo essere stati reclutati per sostenere gli Stati Uniti durante la guerra del Vietnam – sono spesso esclusi dal discorso politico tradizionale. Un esempio? Sul sito web dell’anagrafe della contea di Fresno, la pagina governativa per la registrazione degli elettori ha un’opzione per tradurre l’intera pagina in Hmong, ma, dice Xiong, molte delle informazioni sono inesatte.
Fin dall’inizio, invece della parola Hmong per “ciao” o “benvenuto”, spiega, “la traduzione riporta qualcosa come ‘tuo onore’ o ‘la regina’ o ‘il re’”. Vedere qualcosa di così semplice fatto in questo modo è stato frustrante. “Non solo è stato probabilmente realizzato con Google Traduttore”, continua, “ma non è stato nemmeno modificato e rivisto tra pari per garantirne la fluidità e la coerenza”. Xiong dice che questo tipo di disattenzione è comune online, ed è uno dei motivi per cui lei e altri membri della comunità Hmong si sentono esclusi dalla politica.
Non sono gli unici ad avere la sensazione che il mondo digitale non sia stato costruito per loro. Il web stesso si basa su un’architettura in inglese e la maggior parte delle grandi piattaforme di social media che ospitano il discorso pubblico negli Stati Uniti mettono al primo posto questa lingua. E mentre le tecnologie si affidano ai proxies per gli spazi civici negli Stati Uniti, il primato dell’inglese è andato crescendo. Per gli asiatici americani, il passaggio al digitale significa che l’accesso alle istituzioni democratiche – dalla registrazione del voto alle notizie locali – è ostacolato da barriere linguistiche.
È un problema anche nell’assistenza sanitaria. Durante la pandemia, quando i pazienti neri, ispanici e nativi avevano una probabilità da due a tre volte maggiore di essere ricoverati in ospedale o di morire rispetto ai pazienti bianchi, queste barriere aggiungono un altro fardello: il Brigham and Women’s Hospital di Boston ha scoperto che i pazienti non anglofoni avevano il 35 per cento in più di probabilità di morire di covid rispetto a chi parlava inglese.
I problemi di traduzione non sono l’unico problema. Xiong dice che quando gli utenti Hmong cercavano di fissare appuntamenti per il vaccino, gli veniva chiesto il loro segno zodiacale come domanda di sicurezza, nonostante il fatto che molti in questa comunità non abbiano familiarità con l’astrologia occidentale.
In tempi normali, superare queste sfide sarebbe abbastanza complicato, dal momento che gli asiatici americani sono il gruppo etnico più diversificato linguisticamente in America. Ma dopo un anno che ha visto un drammatico aumento degli attacchi a sfondo razzista nel mondo reale e online contro gli asiatici americani, la situazione è diventata ancora più urgente.
Il problema della disinformazione
Christine Chen, direttore esecutivo di APIAVote, un’organizzazione no profit che promuove l’impegno civico tra gli asiatici e gli abitanti delle isole del Pacifico, afferma che la vita politica ha sempre escluso gli asiatici negli Stati Uniti, ma “con gli spazi digitali è molto più facile ritrovarsi in una condizione di isolamento sociale”.
Le grandi piattaforme come Facebook, Twitter e YouTube sono popolari tra gli asiatici americani, così come le app di messaggistica come WeChat, WhatsApp e Line. I canali di comunicazione utilizzati dalle persone spesso dipendono dalla loro etnia. Durante la campagna elettorale, Chen si è concentrata sulla costruzione di una rete di volontari. All’epoca, la disinformazione rivolta agli asiatici-americani dilagava nei gruppi WeChat e su Facebook e Twitter, dove la moderazione dei contenuti è meno efficace in lingue diverse dall’inglese.
I volontari di APIAVote, che monitorano la disinformazione incoraggiando i cittadini a votare, hanno scoperto che i vietnamiti-americani, per esempio, venivano presi di mira con affermazioni secondo cui Joe Biden era un socialista, alimentando le paure del comunismo e lanciando messaggi politici simili a quelli riservati ai cubano americani.
Chen afferma che mentre le politiche di moderazione dei contenuti di Facebook, Twitter e altri sono riuscite a filtrare alcune delle più ovvie disinformazioni in lingua inglese, il sistema spesso perde tali contenuti quando sono in altre lingue. Questo lavoro invece doveva essere svolto da volontari come il suo team, che cercavano la disinformazione e venivano addestrati per disinnescarla e minimizzarne la diffusione.
I servizi e le tecnologie di traduzione di Google come Translatotron e e le cuffie per la traduzione in tempo reale utilizzano l’intelligenza artificiale per la conversione tra le lingue. Ma Xiong trova questi strumenti inadeguati per gli Hmong, il cui linguaggio profondamente complesso attribuisce grande importanza al contesto. “Siamo diventati dipendenti da sistemi avanzati come Google”, afferma, “che si presentano come accessibili, ma in realtà distorcono la realtà”.
Un portavoce di Google ha ammesso che le lingue minori “pongono un compito di traduzione più difficile”, ma ha affermato che l’azienda ha “investito nella ricerca che avvantaggia in particolare le traduzioni linguistiche con poche risorse”, utilizzando l’apprendimento automatico e il feedback della comunità.
Meno dati, meno precisione
Le sfide del linguaggio online vanno al di là degli Stati Uniti e mettono in discussione il codice sottostante. Yudhanjaya Wijeratne è ricercatore e data scientist presso il think tank dello Sri Lanka LIRNEasia. Nel 2018, ha iniziato a tracciare reti di bot la cui attività sui social media ha incoraggiato la violenza contro i musulmani: a febbraio e marzo di quell’anno, una serie di rivolte da parte di buddisti cingalesi ha preso di mira musulmani e moschee nelle città di Ampara e Kandy.
Il suo gruppo di ricerca ha catalogato centinaia di migliaia di post sui social media singalesi e ha evidenziato la logica sottostante ai risultati su Twitter e Facebook. “Le loro dichiarazioni erano ben intenzionate, ma sostanzialmente preconfezionate”, dice. In una dichiarazione, Twitter afferma di utilizzare la revisione umana e sistemi automatizzati per “applicare le nostre regole in modo imparziale per tutte le persone coinvolte nel servizio, indipendentemente dal background, dall’ideologia o dalla posizione nello spettro politico”.
Quando è stato contattato da “MIT Technology Review”, un portavoce di Facebook ha affermato che l’azienda ha commissionato una valutazione indipendente sui diritti umani per definire il ruolo giocato dalla piattaforma nella violenza in Sri Lanka, che è stata pubblicata nel 2020 e ha introdotto modifiche sulla scia degli attacchi, inclusa l’assunzione di dozzine. moderatori di contenuti di lingua singalese e tamil. “Abbiamo implementato una tecnologia di rilevamento proattivo dei discorsi di incitamento all’odio in singalese per identificare più rapidamente ed efficacemente i contenuti potenzialmente scorretti”, hanno affermato.
Quando il comportamento del bot è continuato, Wijeratne ha deciso di esaminare le librerie di codici e gli strumenti software che le aziende stavano utilizzando e ha scoperto che i meccanismi per monitorare l’incitamento all’odio nella maggior parte delle lingue diverse dall’inglese non erano ancora stati definiti.
“Gran parte della ricerca, infatti, per molte lingue come la nostra semplicemente non è stata ancora svolta”, afferma Wijeratne. “Quello che posso fare con tre righe di codice Python in inglese richiede almeno due anni di lavoro con 28 milioni di parole in singalese per costruire i corpus e gli strumenti di base e raggiungere quel livello di analisi del testo”.
Dopo che gli attentatori suicidi hanno preso di mira le chiese di Colombo, la capitale dello Sri Lanka, nell’aprile del 2019, Wijeratne ha costruito uno strumento per analizzare l’incitamento all’odio e la disinformazione in singalese e tamil. Il sistema, chiamato Watchdog, è un’applicazione mobile gratuita che aggrega notizie e allega avvisi a storie false. Gli avvertimenti provengono da volontari addestrati al controllo dei fatti.
Wijeratne sottolinea che questo lavoro va ben oltre la traduzione. “Molti degli algoritmi che diamo per scontati e spesso citati nella ricerca, in particolare nell’elaborazione del linguaggio naturale, mostrano risultati eccellenti per l’inglese”, afferma. “Eppure molti algoritmi identici, anche utilizzati su lingue con pochi gradi di differenza, sia che si tratti del tedesco o le lingue romanze, possono restituire risultati completamente diversi”.
L’elaborazione del linguaggio naturale è la base dei sistemi automatizzati di moderazione dei contenuti. Wijeratne ha pubblicato un documento nel 2019 che ha esaminato le discrepanze tra la loro accuratezza nelle diverse lingue. A suo parere, più risorse di calcolo esistono per un linguaggio, come set di dati e pagine web, meglio gli algoritmi possono funzionare. Le lingue dei paesi o delle comunità più povere sono svantaggiate.
L’ingiustizia ha radici nel passato
Il movimento per colmare questo divario è noto come giustizia linguistica e non è nuovo. L’American Bar Association descrive la giustizia linguistica come un “quadro” che preserva i diritti delle persone “di comunicare, capire ed essere compresi nella lingua in cui si possono esprimere nel migliore dei modi”.
Il percorso verso la giustizia linguistica si muove con passo incerto. Le aziende tecnologiche e i fornitori di servizi governativi dovrebbero investire molte più risorse nella sua realizzazione. E, sottolinea Wijeratne, il razzismo, l’incitamento all’odio e l’emarginazione degli asiatici, specialmente negli Stati Uniti, esistevano molto prima di Internet. Anche se la giustizia linguistica potesse essere raggiunta, non risolverà questi problemi profondi.
Ma per Xiong, la giustizia linguistica è un obiettivo importante che ritiene cruciale per la comunità Hmong. Dopo l’elezione, Xiong ha assunto un nuovo ruolo con la sua organizzazione, cercando di collegare la comunità Hmong della California con i servizi pubblici come il Census Bureau, l’anagrafe della contea e il sistema di registrazione per i vaccini. Il suo obiettivo principale è quello di “incontrare la comunità dove si trova”, che sia alla radio Hmong o in inglese tramite Facebook dal vivo, e quindi far conoscere la comunità al pubblico più ampio.
Ma ogni giorno deve affrontare gli squilibri tecnologici che escludono le persone dalla conversazione e impediscono loro di accedere alle risorse. L’uguaglianza dovrebbe significare “operare in un mondo in cui l’interpretazione e la traduzione sono un diritto garantito”, conclude.
foto: Ms S Tech | Getty, Pixelsquid