Seguici
Iscriviti alla nostra newsletter

    Modelli ridotti di IA distribuita

    I ricercatori del MIT-IBM Watson AI Lab hanno scoperto algoritmi di visione artificiale all’avanguardia in grado di funzionare su dispositivi a bassa potenza.

    di Karen Hao

    Il riconoscimento visivo è il punto di forza dell’apprendimento profondo. Gli algoritmi di visione artificiale sono essenziali per la lettura delle immagini mediche, per le auto a guida autonoma e per il riconoscimento facciale. Ma i percorsi di formazione per riconoscere le azioni nei video sono diventati sempre più costosi. Ciò ha alimentato le preoccupazioni relative alla sostenibilità ambientale della tecnologia e alla sua crescente inaccessibilità in ambienti con risorse ridotte.

    I ricercatori del MIT-IBM Watson AI Lab hanno sviluppato una nuova tecnica per addestrare i modelli di riconoscimento video su un telefono o altri dispositivi con capacità di elaborazione molto limitata.

    In genere, un algoritmo elabora il video suddividendolo in frame di immagini ed eseguendo algoritmi di riconoscimento su ciascuno di essi. Quindi mette insieme le azioni mostrate nel video, vedendo come gli oggetti cambiano nei frame successivi. Il metodo richiede che l’algoritmo “ricordi” ciò che ha visto in ciascun frame e l’ordine in cui lo ha visto. Si tratta di un sistema inefficiente.

    Nel nuovo approccio, l’algoritmo estrae invece gli schizzi di base degli oggetti in ciascun fotogramma e li sovrappone uno all’altro. Invece di ricordare la successione temporale, l’algoritmo riesce ad avere un’idea dei diversi passaggi osservando lo spostamento degli oggetti tra i diversi schizzi.

    Durante i test, i ricercatori hanno verificato che il nuovo approccio ha addestrato i modelli di riconoscimento video tre volte più velocemente rispetto allo stato dell’arte. È riuscito anche a classificare rapidamente i gesti delle mani con un piccolo computer e una fotocamera che consumavano solo la quantità di energia sufficiente per alimentare una luce da bici.

    La nuova tecnica potrebbe aiutare a migliorare la velocità e la capacità di calcolo delle attuali applicazioni commerciali di visione artificiale. Per esempio, potrebbe rendere più sicure le auto a guida autonoma, accelerando la loro reazione alle informazioni visive in arrivo. La tecnica potrebbe aprire la strada a nuove applicazioni che prima non erano possibili, come nel caso di telefoni per fare diagnosi ai pazienti o analizzare immagini mediche.

    Man mano che sempre più ricerche sull’IA vengono tradotte in applicazioni, aumenterà la necessità di avere a disposizione modelli più piccoli. Il documento MIT-IBM fa parte di una tendenza generalizzata a ridurre i modelli d’avanguardia a dimensioni più gestibili.

    Immagine: Noun Project / Ms. Tech

    (rp)

    Related Posts
    Total
    0
    Share