Le equazioni differenziali alle derivate parziali possono descrivere qualsiasi cosa, dal moto planetario alla tettonica a placche, ma sono notoriamente difficili da risolvere.
di Karen Hao
A meno che uno non sia un fisico o un ingegnere, non si hanno davvero molte ragioni per conoscere le equazioni differenziali alle derivate parziali. Dopo anni passati a studiarle durante gli studi di ingegneria meccanica all’università, non le ho mai più usate nel mondo reale.
Ma le PDE (partial differential equations) hanno qualcosa di magico. Sono una categoria di equazioni matematiche perfette per descrivere il cambiamento nello spazio e nel tempo, e quindi molto utili per definire i fenomeni fisici nel nostro universo. Possono essere utilizzate per modellare qualsiasi cosa, dalle orbite planetarie alla tettonica delle placche alla turbolenza dell’aria che disturba un volo, il che ci consente di fare cose come prevedere l’attività sismica e progettare aerei sicuri.
Il problema è che le PDE sono notoriamente difficili da risolvere. E qui, il significato di “risolvere” è forse meglio illustrato da un esempio. Supponiamo che si stia cercando di simulare la turbolenza dell’aria per testare un nuovo design di aereo. Esiste una PDE nota chiamata Navier-Stokes che viene utilizzata per descrivere il movimento di qualsiasi fluido. La “risoluzione” di Navier-Stokes consente di scattare un’istantanea del movimento dell’aria (ovvero le condizioni del vento) in qualsiasi momento e modellare i comportamenti precedenti e futuri.
Questi calcoli sono molto complessi e richiedono un grande impegno dal punto di vista computazionale, motivo per cui le discipline che utilizzano molte PDE spesso si affidano a supercomputer per fare i conti. È anche il motivo per cui il campo dell’AI ha mostrato un interesse speciale per queste equazioni. Se potessimo usare il deep learning per accelerare il processo di risoluzione, sarebbe un deciso passo in avanti per la ricerca scientifica e l’ingegneria.
I ricercatori del Caltech hanno introdotto una nuova tecnica di apprendimento profondo per risolvere le PDE che è notevolmente più accurata dei metodi sviluppati in precedenza. È anche molto più generalizzabile, in grado di risolvere intere famiglie di PDE, come l’equazione di Navier-Stokes per qualsiasi tipo di fluido, senza bisogno di un ulteriore training. Infine, è 1.000 volte più veloce delle formule matematiche tradizionali, il che diminuirebbe la nostra dipendenza dai supercomputer e aumenterebbe la nostra capacità di calcolo per modellare problemi ancora più grandi.
La funzione si adatta a diverse situazioni
Prima di spiegare come è stato possibile, vediamo i risultati della ricerca. L’immagine di lato ne offre una prova. La prima colonna mostra due istantanee del movimento di un fluido; la seconda mostra come il fluido si comporta nella vita reale e la terza raffigura come la rete neurale prevedeva che il fluido si sarebbe mosso. Fondamentalmente la seconda e la terza sembrano identiche. La dimostrazione ha suscitato clamore su Twitter, persino da parte del rapper MC Hammer.
La prima cosa da capire è che le reti neurali sono di fatto approssimatori di funzioni, vale a dire che quando si addestrano su un set di dati di input e output accoppiati, stanno effettivamente calcolando la funzione, o una serie di operazioni matematiche, che traspongono l’una nell’altra. Si immagini di costruire un rilevatore di gatti. Si allena la rete neurale alimentandola con molte immagini di gatti e altre di non gatti (gli input) e si etichetta ogni gruppo rispettivamente con 1 o 0 (gli output).
La rete neurale cerca la migliore funzione in grado di convertire ogni immagine di un gatto in un 1 e ogni immagine di tutto il resto in uno 0. È così che può guardare una nuova immagine e dire se è o meno un gatto. Sta usando la funzione che ha trovato per calcolare la sua risposta e se il training è stato efficace, la maggior parte delle volte lo farà bene.
In linea di massima, questo processo di approssimazione della funzione è ciò di cui si ha bisogno per risolvere una PDE. Alla fine stiamo cercando di trovare una funzione che descriva al meglio il movimento delle particelle d’aria nello spazio e nel tempo fisici.
Di solito, le reti neurali vengono addestrate per approssimare le funzioni tra input e output definiti nello spazio euclideo, il grafico classico con assi x, y e z. Ma questa volta, i ricercatori hanno deciso di definire gli input e gli output nello spazio di Fourier, che è un tipo speciale di grafico per tracciare le frequenze delle onde. L’intuizione a cui hanno attinto dal lavoro in altri campi è che qualcosa come il movimento dell’aria può effettivamente essere descritto come una combinazione di frequenze d’onda, spiega Anima Anandkumar, una professoressa del Caltech che ha supervisionato la ricerca insieme ai suoi colleghi, i professori Andrew Stuart e Kaushik. Bhattacharya.
La direzione generale del vento a livello macro è come una bassa frequenza con onde molto lunghe, mentre i piccoli vortici che si formano a livello micro sono come frequenze alte con picchi molto brevi. Il dato è importante perché è molto più facile approssimare una funzione di Fourier nello spazio di Fourier che essere alle prese con le PDE nello spazio euclideo, il che semplifica notevolmente il lavoro della rete neurale.
La maggiore accuratezza e i guadagni di efficienza si traducono in un enorme vantaggio di velocità rispetto ai metodi tradizionali. La loro tecnica raggiunge un tasso di errore inferiore del 30 per cento durante la risoluzione di Navier-Stokes rispetto ai precedenti metodi di deep learning.
Mentre i precedenti metodi di deep learning dovevano essere addestrati separatamente per ogni tipo di fluido, questo deve essere addestrato solo una volta per gestirli tutti, come confermato dagli esperimenti dei ricercatori. Sebbene non abbiano ancora provato a estenderlo ad altri campi, il sistema dovrebbe essere in grado di studiare ogni tipo di terreno quando si risolvono PDE relative all’attività sismica o qualsiasi materiale quando si risolvono PDE relative alla conducibilità termica.
Una simulazione su scala globale
Questa ricerca non ha solo un valore teorico. L’intento dei ricercatori è di portare il contributo dell’intelligenza artificiale all’interno di più discipline scientifiche. È stato parlando con vari studiosi di scienze del clima, sismologia e scienza dei materiali che Anandkumar ha deciso per la prima volta di affrontare la sfida della PDE con i suoi colleghi e studenti. Ora stanno lavorando per mettere a punto il loro metodo con altri ricercatori del Caltech e del Lawrence Berkeley National Laboratory.
Un argomento di ricerca che è al centro dell’interesse di Anandkumar è il cambiamento climatico. Navier-Stokes non è solo efficace a descrivere la turbolenza dell’aria, ma è anche usato per i modelli meteorologici. “Avere buone previsioni meteorologiche dettagliate su scala globale è un compito complesso anche sui più grandi supercomputer. A oggi, non possiamo farlo su scala globale, quindi, se possiamo utilizzare questi metodi per accelerare l’intera pipeline, l’impatto sarebbe enorme”, ella conclude.
Immagine: Ms Tech | Science Photo Library via AP
(rp)