Ricerca
Un nuovo strumento di intelligenza artificiale classifica gli effetti di 71 milioni di mutazioni “missense”.
Scoprire le cause profonde delle malattie è una delle sfide più grandi nel campo della genetica umana. Con milioni di possibili mutazioni e dati sperimentali limitati, è ancora in gran parte un mistero quali potrebbero dare origine alla malattia. Questa conoscenza è fondamentale per una diagnosi più rapida e per lo sviluppo di trattamenti salvavita.
Oggi rilasciamo a Catalogare di mutazioni “missense” in cui i ricercatori possono saperne di più sugli effetti che potrebbero avere. Le varianti missenso sono mutazioni genetiche che possono influenzare la funzione delle proteine umane. In alcuni casi possono portare a malattie come la fibrosi cistica, l’anemia falciforme o il cancro.
Il catalogo AlphaMissense è stato sviluppato utilizzando AlphaMissense, il nostro nuovo modello di intelligenza artificiale che classifica le varianti missenso. In un articolo pubblicato in Scienzamostriamo che ha classificato l’89% di tutti i 71 milioni di possibili varianti missenso come probabilmente patogene o probabilmente benigne. Al contrario, solo lo 0,1% è stato confermato da esperti umani.
Gli strumenti di intelligenza artificiale in grado di prevedere con precisione l’effetto delle varianti hanno il potere di accelerare la ricerca in tutti i campi, dalla biologia molecolare alla genetica clinica e statistica. Esperimenti per scoprire mutazioni che causano malattie sono costosi e laboriosi: ogni proteina è unica e ogni esperimento deve essere progettato separatamente, il che può richiedere mesi. Utilizzando le previsioni dell’intelligenza artificiale, i ricercatori possono ottenere un’anteprima dei risultati per migliaia di proteine alla volta, il che può aiutare a dare priorità alle risorse e ad accelerare studi più complessi.
Abbiamo reso tutte le nostre previsioni liberamente disponibili alla comunità di ricerca e le abbiamo rese open source codice modello per AlphaMissense.
Cos’è una variante missenso?
Una variante missenso è una sostituzione di una singola lettera nel DNA che dà come risultato un amminoacido diverso all’interno di una proteina. Se pensi al DNA come a un linguaggio, cambiare una lettera può cambiare una parola e alterare del tutto il significato di una frase. In questo caso, una sostituzione cambia l’amminoacido tradotto, il che può influenzare la funzione di una proteina.
La persona media sta trasportando più di 9.000 varianti missenso. La maggior parte sono benigni e hanno effetti scarsi o nulli, ma altri sono patogeni e possono compromettere gravemente la funzione proteica. Le varianti missenso possono essere utilizzate nella diagnosi di malattie genetiche rare, dove poche o anche una singola variante missenso possono causare direttamente la malattia. Sono importanti anche per studiare malattie complesse, come il diabete di tipo 2, che può essere causato da una combinazione di molti tipi diversi di cambiamenti genetici.
Classificare le varianti missenso è un passo importante per comprendere quali di questi cambiamenti proteici potrebbero dare origine alla malattia. Di oltre 4 milioni di varianti missenso già osservate negli esseri umani, solo il 2% è stato annotato come patogeno o benigno dagli esperti, circa lo 0,1% di tutti i 71 milioni possibili varianti missenso. Le restanti sono considerate “varianti di significato sconosciuto” a causa della mancanza di dati sperimentali o clinici sul loro impatto. Con AlphaMissense ora abbiamo il quadro più chiaro fino ad oggi classificando l’89% delle varianti utilizzando una soglia che ha prodotto una precisione del 90% su un database di varianti di malattie note.
Patogeni o benigni: come AlphaMissense classifica le varianti
AlphaMissense si basa sul nostro modello rivoluzionario AlphaFoldche prevedeva le strutture di quasi tutte le proteine conosciute dalla scienza a partire dalle loro sequenze di aminoacidi. Il nostro modello adattato può prevedere la patogenicità delle varianti missenso che alterano i singoli aminoacidi delle proteine.
Per addestrare AlphaMissense, abbiamo messo a punto AlphaFold sulle etichette che distinguono le varianti osservate nelle popolazioni di primati umani e strettamente correlate. Le varianti comunemente osservate vengono trattate come benigne, mentre le varianti mai osservate vengono trattate come patogene. AlphaMissense non prevede il cambiamento nella struttura delle proteine in seguito a mutazioni o altri effetti sulla stabilità delle proteine. Invece, sfrutta i database delle sequenze proteiche correlate e del contesto strutturale delle varianti per produrre un punteggio compreso tra 0 e 1 che valuta approssimativamente la probabilità che una variante sia patogena. Il punteggio continuo consente agli utenti di scegliere una soglia per classificare le varianti come patogene o benigne che corrisponde ai loro requisiti di accuratezza.
AlphaMissense raggiunge previsioni all’avanguardia su un’ampia gamma di benchmark genetici e sperimentali, il tutto senza una formazione esplicita su tali dati. Il nostro strumento ha sovraperformato altri metodi computazionali quando utilizzato per classificare le varianti di ClinVar, un archivio pubblico di dati sulla relazione tra varianti umane e malattie. Il nostro modello è stato anche il metodo più accurato per prevedere i risultati di laboratorio, il che dimostra che è coerente con diversi modi di misurare la patogenicità.
Costruire una risorsa comunitaria
AlphaMissense si basa su AlphaFold per promuovere la comprensione delle proteine a livello mondiale. Un anno fa abbiamo rilasciato 200 milioni di strutture proteiche previsto utilizzando AlphaFold – che sta aiutando milioni di scienziati in tutto il mondo ad accelerare la ricerca e aprire la strada a nuove scoperte. Siamo ansiosi di vedere come AlphaMissense potrà aiutare a risolvere le questioni aperte nel cuore della genomica e della scienza biologica.
Abbiamo reso le previsioni di AlphaMissense liberamente disponibili alla comunità scientifica. Insieme all’EMBL-EBI, li stiamo anche rendendo più utilizzabili per i ricercatori attraverso il Predittore dell’effetto della variante dell’insieme.
Oltre alla nostra tabella di ricerca delle mutazioni missenso, abbiamo condiviso le previsioni ampliate di tutte le possibili 216 milioni di sostituzioni di sequenze di singoli aminoacidi in più di 19.000 proteine umane. Abbiamo incluso anche la previsione media per ciascun gene, che è simile alla misurazione del vincolo evolutivo di un gene: ciò indica quanto il gene sia essenziale per la sopravvivenza dell’organismo.
Accelerare la ricerca sulle malattie genetiche
Un passo fondamentale nella traduzione di questa ricerca è la collaborazione con la comunità scientifica. Abbiamo lavorato in collaborazione con Genomics England, per esplorare come queste previsioni potrebbero aiutare a studiare la genetica delle malattie rare. Genomics England ha incrociato i risultati di AlphaMissense con i dati sulla patogenicità delle varianti precedentemente aggregati con partecipanti umani. La loro valutazione ha confermato che le nostre previsioni sono accurate e coerenti, fornendo un altro punto di riferimento nel mondo reale per AlphaMissense.
Anche se le nostre previsioni non sono progettate per essere utilizzate direttamente in clinica – e dovrebbero essere interpretate con altre fonti di prova – questo lavoro ha il potenziale per migliorare la diagnosi di malattie genetiche rare e aiutare a scoprire nuovi geni che causano malattie.
In definitiva, speriamo che AlphaMissense, insieme ad altri strumenti, consenta ai ricercatori di comprendere meglio le malattie e sviluppare nuovi trattamenti salvavita.
Fonte: deepmind.google