FermiNet: Fisica e chimica quantistica dai principi primi

 | Intelligenza-Artificiale

Sfortunatamente, l’errore dello 0,5% non è ancora sufficiente per essere utile al chimico che lavora. L’energia nei legami molecolari è solo una piccola frazione dell’energia totale di un sistema, e prevedere correttamente se una molecola è stabile può spesso dipendere solo dallo 0,001% dell’energia totale di un sistema, o da circa lo 0,2% dell’energia rimanente di “correlazione”.

Ad esempio, mentre l’energia totale degli elettroni in a molecola di butadiene è di quasi 100.000 kilocalorie per mole, la differenza di energia tra le diverse forme possibili della molecola è solo 1 kilocaloria per mole. Ciò significa che se si vuole prevedere correttamente la forma naturale del butadiene, è necessario lo stesso livello di precisione necessario per misurare la larghezza di un campo di calcio fino al millimetro.

Con l’avvento dell’informatica digitale dopo la seconda guerra mondiale, gli scienziati svilupparono un’ampia gamma di metodi computazionali che andarono oltre questa descrizione del campo medio degli elettroni. Sebbene questi metodi siano disponibili in un miscuglio di abbreviazioni, generalmente rientrano tutti in un asse che bilancia l’accuratezza con l’efficienza. Ad un estremo ci sono metodi essenzialmente esatti che scalano peggio che esponenzialmente con il numero di elettroni, rendendoli poco pratici per tutti tranne che per le molecole più piccole. All’estremo opposto ci sono metodi che scalano linearmente, ma non sono molto accurati. Questi metodi computazionali hanno avuto un enorme impatto sulla pratica della chimica: il Premio Nobel per la chimica 1998 è stato assegnato agli ideatori di molti di questi algoritmi.

Reti neurali fermioniche

Nonostante l’ampiezza degli strumenti computazionali di meccanica quantistica esistenti, abbiamo ritenuto che fosse necessario un nuovo metodo per affrontare il problema della rappresentazione efficiente. C’è una ragione per cui i più grandi calcoli chimici quantistici arrivano solo a decine di migliaia di elettroni anche per i metodi più approssimativi, mentre le tecniche di calcolo chimico classico come la dinamica molecolare possono gestire milioni di atomi.

Lo stato di un sistema classico può essere descritto facilmente: dobbiamo solo tracciare la posizione e la quantità di moto di ciascuna particella. Rappresentare lo stato di un sistema quantistico è molto più impegnativo. Ad ogni possibile configurazione delle posizioni degli elettroni deve essere assegnata una probabilità. Questo è codificato nella funzione d’onda, che assegna un numero positivo o negativo ad ogni configurazione di elettroni, e la funzione d’onda al quadrato dà la probabilità di trovare il sistema in quella configurazione.

Lo spazio di tutte le possibili configurazioni è enorme: se provassi a rappresentarlo come una griglia con 100 punti lungo ciascuna dimensione, il numero di possibili configurazioni elettroniche per l’atomo di silicio sarebbe maggiore del numero di atomi nell’universo. È proprio qui che pensavamo che le reti neurali profonde potessero aiutare.

Negli ultimi anni ci sono stati enormi progressi nella rappresentazione di distribuzioni di probabilità complesse e ad alta dimensione con le reti neurali. Ora sappiamo come addestrare queste reti in modo efficiente e scalabile. Abbiamo ipotizzato che, dato che queste reti hanno già dimostrato la loro capacità di adattare funzioni ad alta dimensione nei problemi di intelligenza artificiale, forse potrebbero essere utilizzate anche per rappresentare funzioni d’onda quantistiche.

Ricercatori come Giuseppe Carleo, Matthias Troyer e altri hanno mostrato come il moderno deep learning potrebbe essere utilizzato per risolvere problemi quantistici idealizzati. Volevamo utilizzare le reti neurali profonde per affrontare problemi più realistici in chimica e fisica della materia condensata, e ciò significava includere gli elettroni nei nostri calcoli.

C’è solo una ruga quando si ha a che fare con gli elettroni. Gli elettroni devono obbedire a Principio di esclusione di Pauliil che significa che non possono trovarsi nello stesso spazio allo stesso tempo. Questo perché gli elettroni sono un tipo di particella nota come fermioniche includono gli elementi costitutivi della maggior parte della materia: protoni, neutroni, quark, neutrini, ecc. La loro funzione d’onda deve essere antisimmetrica. Se si scambia la posizione di due elettroni, la funzione d’onda viene moltiplicata per -1. Ciò significa che se due elettroni sono uno sopra l’altro, la funzione d’onda (e la probabilità di quella configurazione) sarà zero.

Ciò ha significato dover sviluppare un nuovo tipo di rete neurale antisimmetrica rispetto ai suoi input, che abbiamo chiamato FermiNet. Nella maggior parte dei metodi di chimica quantistica, l’antisimmetria viene introdotta utilizzando una funzione chiamata determinante. Il determinante di una matrice ha la proprietà che se si scambiano due righe, l’output viene moltiplicato per -1, proprio come una funzione d’onda per i fermioni.

Quindi puoi prendere una serie di funzioni a singolo elettrone, valutarle per ogni elettrone nel tuo sistema e racchiudere tutti i risultati in un’unica matrice. La determinante di quella matrice è quindi una funzione d’onda propriamente antisimmetrica. Il limite principale di questo approccio è che la funzione risultante, nota come a Determinante di Slater – non è molto generale.

Le funzioni d’onda dei sistemi reali sono solitamente molto più complicate. Il modo tipico per migliorare questo aspetto è prendere una grande combinazione lineare di determinanti Slater – a volte milioni o più – e aggiungere alcune semplici correzioni basate su coppie di elettroni. Anche in questo caso, questo potrebbe non essere sufficiente per calcolare accuratamente le energie.

Fonte: deepmind.google

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *