Un software capace di comprendere ciò che vede potrebbe portare a nuove forme di pubblicità o semplificare l’editing dei video.
di Tom Simonite
Il software di elaborazione video della Clarifai è in grado di identificare oggetti e scene in un video e fornire una linea temporale così da permettere di avanzare fino al momento esatto in cui un determinato oggetto compare.
Negli ultimi anni, ricercatori e società fra cui Google e Facebook hanno conseguito notevoli progressi nell’addestrare software a comprendere quanto accade nelle immagini, grazie a una tecnica conosciuta come apprendimento profondo. Ora, una startup di nome Clarifai sta offrendo un servizio che utilizza l’apprendimento profondo per comprendere i video.
La società sostiene che il suo software sia in grado di analizzare rapidamente videoclip e riconoscere 10,000 oggetti differenti o tipi di scene. In una dimostrazione presentata la scorsa settimana durante una conferenza sull’apprendimento profondo, il cofondatore e CEO della Clarifai, Matthew Zeiler, ha caricato un clip che includeva le riprese di uno scenario alpino. Il software ha creato una cronologia con un grafico che riassume quando oggetti differenti o tipologie di inquadrature venivano individuati. Il grafico mostra esattamente quando “neve” e “montagne” comparivano singolarmente e assieme. Il software è in grado di analizzare video a una velocità maggiore rispetto a un essere umano; nella dimostrazione, il clip di 3.5 minuti è stato elaborato in appena 10 secondi.
La società sta offrendo la propria tecnologia come servizio e prevede che possa essere utilizzato per funzioni quali l’abbinamento di pubblicità ai contenuti nei video online o lo sviluppo di nuovi sistemi per organizzare raccolte video o editare sequenze.
L’apprendimento profondo comporta l’elaborazione di dati attraverso una rete di semplici “neuroni” simulati che sono stati addestrati utilizzando esempi di dati. La tecnologia della Clarifai è nata da una ricerca della New York University, e nel 2013 la società si è aggiudicata le prime cinque posizioni nella competizione annuale per software in grado di identificare il contenuto delle immagini.
Finora, gran parte della ricerca nel campo si è concentrata su fermo-immagini, non video.
Lo scorso anno, la società ha avviato un servizio di riconoscimento dei fermo-immagine. Un’altra startup di apprendimento profondo, la Dextro, ha presentato il proprio servizio di riconoscimento video alla fine di dicembre.
Chiunque può mettere alla prova il nuovo sistema video della Clarifai. è infatti possibile caricare un videoclip di 10 megabyte sul suo sito per farlo analizzare. I vari oggetti e scene identificate possono includere automobili, alberi o persone. Il software è anche in grado di applicare concetti descrittivi più astratti, quali “divertimento” o “vicinanza”.
Zeiler ritiene che la sua tecnologia possa portare a un nuovo approccio pubblicitario da abbinare ai video online. “Il software può identificare in che punto del video conviene posizionare una pubblicità”, ha detto.
Le società possono già pagare per posizionare le proprie pubblicità a fianco dei video di un particolare genere o soggetto. Zeiler ritiene che la possibilità di abbinare automaticamente le pubblicità a momenti particolari nei video possa risultare ancora più attraente per gli inserzionisti. La tecnologia della Clarifai potrebbe permettere a Starbucks, ad esempio, di far comparire le proprie pubblicità ogni qual volta in cui un caffè viene consumato in un video.
Zeiler sostiene di essere già al lavoro con società interessate a utilizzare la tecnologia di analisi dei video. La società sta anche lavorando al potenziamento delle funzioni del software. Due aspetti in via di sviluppo permetteranno al software di riassumere automaticamente quanto succede all’interno di un video e riconoscere quando avviene un particolare evento, spiega Zeiler.
(MO)