Una nuova ricerca indica la strada dell’apprendimento automatico per moltiplicare efficacemente la capacità di fare test per il covid, con costi che oscillano tra i 3 e i 5 dollari a persona.
di Ziad Obermeyer, Ned Augenblick e Jonathan Kolsta
È impossibile contenere covid-19 senza sapere chi è positivo, almeno fino a quando un vaccino sicuro ed efficace non sarà ampiamente disponibile. Indubbiamente la capacità di fare test è aumentata, ma non è ancora vicina a quanto serve per lo screening dei pazienti senza sintomi, che rappresentano quasi la metà dei contagi da virus.
Ora, la nostra ricerca, pubblicata sul “the National Bureau of Economic Research”, delinea la possibilità per i governi di far ripartire in sicurezza l’economia e arrestare la trasmissione covid-19 in corso, senza costruire nuovi laboratori e senza nuovi farmaci o vaccini.
Molte persone vengono testate per il coronavirus perché hanno manifestato sintomi o sono venute a stretto contatto con qualcuno che ne aveva. Gli uffici e le scuole stanno per riaprire e dovranno fare i conti con una spiacevole verità: basarsi sui sintomi per somministrare i test non permetterà di registrare i casi asintomatici e pre-sintomatici e porterà a una situazione generalizzata di rischio.
Le alternative attuali, tuttavia, non sono allettanti. La carenza di test o lo screening casuale consente ai portatori attivi di diffondere il virus per settimane prima di essere scoperti. Il costo dei test, inoltre, è ancora sostenuto in quanto oscilla dai 100 ai 200 dollari.
I test congiunti, guidati da algoritmi di apprendimento automatico, possono sostanzialmente cambiare la situazione. Nei test comuni, i campioni di molte persone sono riuniti in uno solo. Se non viene rilevato alcun virus nel campione combinato, ciò significa che nessuno nel gruppo è infetto. Ma c’è un problema: se qualcuno risulta infetto, il risultato sarà positivo e saranno necessari ulteriori test per capire chi ha il virus.
Quindi una parte fondamentale del lavoro consiste nel conoscere la probabilità che certe persone nel gruppo siano positive e separarle dal resto. Come facciamo a sapere chi è a rischio? Ecco dove entra in gioco l’apprendimento automatico.
Le probabilità di un contagio stanno rapidamente salendo negli Stati Uniti. Anche il rischio differisce in modo significativo tra un operatore sanitario e un dipendente che lavora in remoto. Stimare queste differenze tra le diverse persone è un lavoro perfetto per l’apprendimento automatico.
Utilizzando dati disponibili al pubblico di datori di lavoro e scuole, dati epidemiologici su infezioni locali e percentuali di test e dati più sofisticati su spostamenti, contatti sociali o sistemi di fognature, se disponibili, i modellatori possono prevedere le possibilità di contagiarsi. In questo modo si generano enormi guadagni di efficienza.
Un altro vantaggio è che i test aggregati diventano più efficienti quando la diffusione della malattia è minore. Se una popolazione – per esempio, tutti gli studenti di un’università – viene testata quotidianamente, il rischio di infezione viene notevolmente ridotto per tutti i membri del gruppo, semplicemente perché i tester rimuovono i positivi dal gruppo successivo. Inoltre, con test più frequenti, le persone che sono contagiate ma non presentano sintomi possono rimanere a casa, riducendo ulteriormente la diffusione e rendendo i test di gruppol ancora più efficienti.
Di conseguenza, i test aggregati ad alta frequenza con sistemi di apprendimento automatico hanno costi molto inferiori a quanto si pensi. Secondo la nostra analisi, fare test giornalieri costa solo il doppio rispetto a quelli mensili, con il vantaggio che i test quotidiani possono attivamente sopprimere il virus, mentre quelli mensili ci permettono solo di registrare la gravità di una situazione.
Questo effetto può essere così potente, infatti, che in alcune situazioni – come negli impianti di confezionamento della carne o nelle case di cura – l’aumento della frequenza può effettivamente ridurre il numero di test necessari e quindi i costi in un determinato periodo di tempo.
L’ultimo pilastro della prevenzione attraverso i test richiede di tenere conto della diffusione del virus tra le persone e, quindi, del rischio correlato. L’uso dell’apprendimento automatico per modellare i social network ha attirato l’attenzione crescente dei ricercatori in informatica, economia e altri campi.
Tali algoritmi, combinati con dati su lavori, aule, dormitori universitari e molti altri setting, consentono agli strumenti di apprendimento automatico di stimare il potenziale di interazione tra persone diverse. Conoscere questa probabilità può rendere i test di gruppo ancora più potenti.
I test in gruppi ad alta frequenza sono fattibili nel mondo reale? Anche se non vogliamo minimizzare le sfide logistiche, si tratta di sfide non di problemi insormontabili. La Food and Drug Administration degli Stati Uniti ha appena approvato il primo utilizzo di test congiunti e la ricerca mostra sempre più che questa tecnica è abbastanza sensibile da rilevare casi positivi. Se i laboratori sono disposti a collaborare, i tester possono iniziare a partire da subito.
Sebbene alcuni abbiano messo in discussione la possibilità di fare test comuni data la diffusione dell’epidemia, è bene ricordare che in genere facciamo affidamento su stime grossolane – e, come mostriamo nella nostra ricerca, potenzialmente inaccurate – della prevalenza del virus in grandi settori della popolazione.
Al contrario, l’apprendimento automatico può darci le stime precise a livello individuale di cui abbiamo bisogno per far funzionare il pooling anche con contagi elevati, identificando quelli che potrebbero essere positivi e tenendoli fuori dai raggruppamenti di grandi dimensioni.
La frequenza paga anche enormi dividendi quando la prevalenza del virus è elevata. Prima che vengano implementati i test comuni, per esempio in una fabbrica o in una scuola, l’intera popolazione potrebbe completare uno screening una tantum. Le persone infette rimarrebbero a casa fino a quando non si riprenderanno, e i test aggregati ad alta frequenza manterrebbero bassa la prevalenza, bloccando rapidamente la diffusione della malattia.
Occorre inoltre affrontare la logistica della raccolta e del raggruppamento dei campioni. Dati incoraggianti vengono da prodotti, alcuni approvati dalla FDA, che consentono alle persone di raccogliere e inviare i propri campioni di prova. Uno di questi si basa sulla saliva, il che significa che i costi di raccolta possono essere mantenuti bassi anche su larga scala.
È giunto il momento che i test ad alta frequenza diventino una parte fondamentale della strategia americana per combattere il covid-19 e far ripartire l’economia. I test comuni che sfruttano le tecniche di apprendimento automatico rendono il pagamento dei costi associati non solo praticabile ma, se confrontato con l’alternativa di chiusure prolungate, un affare.
Ned Augneblick, Jonathan Kolstad e Ziad Obermeyer sono professori associati all’Università della California, a Berkeley. Sono anche cofondatori di Berkeley Data Ventures, un’azienda di consulenza che applica l’apprendimento automatico ai problemi di assistenza sanitaria.
(rp)