Polimi, un nuovo circuito di calcolo per una AI più sostenibile

Possibile ridurre tempi e consumi per training reti neurali

FEB 12, 2020 -

Roma, 12 feb. (askanews) – Un gruppo di ricerca del Politecnico di Milano ha sviluppato un nuovo circuito di calcolo che permette di eseguire operazioni avanzate, tipiche delle reti neurali su cui si basa l’intelligenza artificiale, in una sola operazione. I risultati di performance in termini di velocità e consumo di energia pongono le basi per una nuova generazione di acceleratori di intelligenza artificiale con maggiore efficienza energetica e migliore sostenibilità a livello globale. Lo studio è stato recentemente pubblicato sulla prestigiosa “Science Advances”.

Riconoscere un viso o un oggetto, oppure interpretare correttamente una parola o un motivo musicale sono operazioni oggi possibili sui più comuni gadget elettronici, come un normale smartphone, grazie all’intelligenza artificiale. Perché avvengano, le reti neurali necessitano però di un opportuno addestramento (training) così energeticamente oneroso che, secondo alcuni studi, la carbon footprint dell’addestramento di una complessa rete neurale può eguagliare il consumo di 5 automobili in tutto il loro arco vitale.

Per ridurre i tempi e i consumi del training, – spiega Polimi – si è reso necessario sviluppare circuiti radicalmente diversi dall’approccio convenzionale e che mappano più fedelmente la struttura delle reti neurali e le caratteristiche delle sinapsi biologiche. Un tipico esempio è il concetto di computing in memoria, dove i dati vengono elaborati direttamente all’interno della memoria, esattamente come nel cervello umano.

A partire da questa intuizione, i ricercatori del Politecnico hanno sviluppato un nuovo circuito, che riesce ad eseguire una funzione cognitiva, nota come regressione, in una sola operazione. Per questo scopo è stata utilizzata una memoria resistiva, anche nota con il nome di memristor, che riesce a memorizzare un dato qualsiasi (come ad esempio il valore di un’azione in un certo istante) nel valore della sua resistenza.

Disponendo questi elementi di memoria in una matrice di dimensioni di pochi micron (milionesimi di metro), il gruppo del Politecnico di Milano è riuscito ad eseguire una regressione lineare su un gruppo di dati. Questa operazione è capace di determinare la retta che meglio descrive una sequenza di dati, permettendo ad esempio di prevedere l’andamento della borsa sulla base di un semplice modello lineare. È stata anche dimostrata la regressione logistica, che permette di classificare un dato all’interno di un database. Questa funzione è fondamentale nei cosiddetti sistemi di raccomandazione, che sono uno strumento di marketing fondamentale per gli acquisti sul web.