Un nuovo algoritmo di apprendimento del rinforzo ha imparato a ottimizzare il posizionamento dei componenti su un chip per diminuirne i consumi e migliorarne l’efficienza.
di Karen Hao
Il posizionamento dei chip è un complesso problema di progettazione tridimensionale, che richiede un’attenta configurazione di centinaia, a volte migliaia, di componenti su più livelli in un’area limitata. Tradizionalmente, gli ingegneri progettano manualmente configurazioni che riducono al minimo la quantità di fili utilizzati tra i componenti come misura per l’efficienza. Utilizzano quindi un software di automazione del design elettronico per simulare e verificare le loro prestazioni. Questo lavoro può richiedere fino a 30 ore per un solo progetto.
A causa del tempo necessario per la pianificazione, i chip dovrebbero tradizionalmente durare da due a cinque anni. Ma con il rapido sviluppo degli algoritmi di apprendimento automatico, è aumentata anche la necessità di nuove architetture di chip. Negli ultimi anni, diversi algoritmi per la disposizione ottimale dei chip hanno cercato di accelerare il processo di pianificazione, ma sono stati limitati dalle difficoltà a prendere in considerazione più obiettivi, tra cui l’assorbimento di potenza del chip, le prestazioni computazionali e l’area.
In risposta a queste sfide, i ricercatori di Google Anna Goldie e Azalia Mirhoseini hanno adottato un nuovo approccio: l’apprendimento per rinforzo. Questo tipo di algoritmi utilizzano feedback positivi e negativi per apprendere compiti complessi. Quindi i ricercatori hanno progettato la cosiddetta “funzione di ricompensa” per punire e premiare l’algoritmo in base alle sue prestazioni.
L’algoritmo ha quindi prodotto da decine a centinaia di migliaia di nuove ipotesi, ciascuna in una frazione di secondo, e le ha valutate utilizzando la funzione di ricompensa. Nel tempo, ha elaborato un piano d’azione finale per posizionare i componenti del chip in modo ottimale.
Dopo aver verificato i progetti con il software di automazione del design elettronico, i ricercatori hanno scoperto che molte delle planimetrie dell’algoritmo si sono comportate meglio di quelle progettate da ingegneri umani, insegnando loro alcune nuove strategie.
Nel corso degli anni, i progressi nell’intelligenza artificiale sono stati strettamente collegati ai progressi nella progettazione dei chip. La speranza è che questo algoritmo acceleri il processo di progettazione del chip e porti a una nuova generazione di architetture, accelerando a sua volta il progresso dell’IA.
Immagine: Un rack server con TPU utilizzato nella partita tra AlphaGo e Lee Sedol.
(rp)