Un’auto a guida autonoma può imparare a manovrare più agilmente nel traffico se non si perde nei dettagli di tutti i possibili movimenti che gli altri automobilisti possono fare.
di Karen Hao
Proviamo a soffermarci su tutti i processi inconsci che si svolgono nella nostre menti mentre guidiamo: acquisire informazioni sui veicoli circostanti, anticipare i loro movimenti e le nostre risposte, pensare a come reagiranno alle nostre possibili azioni. Se i robot devono integrarsi perfettamente nel nostro mondo, dovranno fare lo stesso. I ricercatori della Stanford University e della Virginia Tech hanno proposto una nuova tecnica per aiutare i robot a eseguire questo tipo di modellazione comportamentale, che presenteranno a breve alla Conference on Robot Learning.
Il robot dovrà tenere conto solo dei tratti generali dei movimenti di altri agenti piuttosto che entrare in dettagli precisi. In questo modo sarà in grado di prevedere in tempi rapidi le loro azioni future e le proprie risposte senza fare calcoli complessi. I metodi tradizionali per aiutare i robot a lavorare insieme agli esseri umani prendono ispirazione dalla cosiddetta teoria della mente, secondo la quale le persone si impegnano ed entrano in empatia l’una con l’altra sviluppando una comprensione delle rispettive credenze. Questa capacità la sviluppiamo fin da bambini. I ricercatori attingono a questa teoria di matrice psicologica per convincere i robot a costruire un modello delle intenzioni di chi hanno intorno come base per prevedere le loro azioni.
Dorsa Sadigh, ricercatrice di Stanford, pensa che questo modo di agire sia inefficiente. “Se guardiamo alle interazioni uomo-uomo, non agiamo così”, ella dice. “Se stiamo cercando di spostare un tavolo insieme, non ci creiamo un modello del pensiero degli altri”. Due persone che spostano un tavolo si affidano a segnali semplici come la forza che impiega l’altro per sollevare e spostare il tavolo. “Quindi ritengo che quando si svolge un compito insieme entrano in gioco molte meno dimensioni conoscitive”, spiega Dorsa.
Su questa base, un robot potrebbe memorizzare descrizioni molto semplici delle azioni degli agenti circostanti. In una partita di hockey da tavolo, per esempio, potrebbe memorizzare i movimenti dei suoi avversari con una sola parola: “destra”, “sinistra” o “centro”. Può quindi utilizzare questi dati per addestrare due algoritmi separati: un algoritmo di apprendimento automatico che prevede la mossa successiva dell’avversario e un algoritmo di apprendimento per rinforzo per determinare come dovrebbe rispondere. Quest’ultimo algoritmo tiene anche traccia di come l’avversario cambia movimento in base alla propria risposta, così può imparare a influenzare le azioni dell’avversario.
L’idea chiave qui è la semplicità dei dati di addestramento, che è ciò che consente al robot di eseguire l’addestramento al gioco. Un approccio più tradizionale potrebbe memorizzare le coordinate dell’intero percorso dei movimenti dell’avversario, non solo la loro direzione generale. Anche se può sembrare controintuitivo sostenere che sapere meno è meglio, vale la pena ricordare ancora una volta la teoria di Sadigh sull’interazione umana. Anche noi utilizziamo modelli delle persone che ci circondano solo a grandi linee.
I ricercatori hanno testato questa idea nella simulazione per applicazioni tra cui un’auto a guida autonoma e nel mondo reale con una partita robotica di hockey da tavolo. In ciascuna delle prove, la nuova tecnica ha superato i metodi precedenti per insegnare ai robot ad adattarsi agli agenti circostanti. Il robot ha anche imparato efficacemente a influenzare coloro che lo circondano.
Ci sono ancora alcuni problemi che la ricerca futura dovrà risolvere. Il lavoro attualmente presuppone, per esempio, che ogni interazione in cui il robot si impegna sia finita, afferma Jakob Foerster, ricercatore all’Università di Toronto, che non è coinvolto direttamente nel lavoro. Nella simulazione di guida autonoma, i ricercatori presumevano che l’auto robot stesse sperimentando solo un’interazione chiaramente delimitata con un’altra macchina durante ogni round di addestramento. Ma guidare, ovviamente, non funziona in questo modo. Le interazioni sono spesso continue e l’auto a guida autonoma deve apprendere e adattare il proprio comportamento all’interno di ciascuna interazione.
Un’altra sfida, dice Sadigh, è che l’approccio presuppone la conoscenza del modo migliore per descrivere il comportamento di un altro. Gli stessi ricercatori hanno dovuto inventare le etichette “destra”, “sinistra” e “centro” nella partita di hockey da tavolo affinché il robot descrivesse le azioni del suo avversario. La definizione delle etichette non sarà sempre così facile nelle interazioni più complicate.
Tuttavia, Foerster vede possibili sviluppi futuri del contributo dello studio. “Colmare il divario tra l’apprendimento multi-agente e l’interazione uomo-intelligenza artificiale è una strada estremamente importante per la ricerca a venire”, egli afferma. “Sono davvero entusiasta della possibile collaborazione futura dei due settori”.
Immagine: Ms Tech / Getty / Pixabay
(rp)