Un catalogo di mutazioni genetiche per aiutare a individuare la causa delle malattie

 | Intelligenza-Artificiale

Ricerca

Pubblicato
Autori

Žiga Avsec e Jun Cheng

Un nuovo strumento di intelligenza artificiale classifica gli effetti di 71 milioni di mutazioni “missense”.

Scoprire le cause profonde delle malattie è una delle sfide più grandi nel campo della genetica umana. Con milioni di possibili mutazioni e dati sperimentali limitati, è ancora in gran parte un mistero quali potrebbero dare origine alla malattia. Questa conoscenza è fondamentale per una diagnosi più rapida e per lo sviluppo di trattamenti salvavita.

Oggi rilasciamo a Catalogare di mutazioni “missense” in cui i ricercatori possono saperne di più sugli effetti che potrebbero avere. Le varianti missenso sono mutazioni genetiche che possono influenzare la funzione delle proteine ​​umane. In alcuni casi possono portare a malattie come la fibrosi cistica, l’anemia falciforme o il cancro.

Il catalogo AlphaMissense è stato sviluppato utilizzando AlphaMissense, il nostro nuovo modello di intelligenza artificiale che classifica le varianti missenso. In un articolo pubblicato in Scienzamostriamo che ha classificato l’89% di tutti i 71 milioni di possibili varianti missenso come probabilmente patogene o probabilmente benigne. Al contrario, solo lo 0,1% è stato confermato da esperti umani.

Gli strumenti di intelligenza artificiale in grado di prevedere con precisione l’effetto delle varianti hanno il potere di accelerare la ricerca in tutti i campi, dalla biologia molecolare alla genetica clinica e statistica. Esperimenti per scoprire mutazioni che causano malattie sono costosi e laboriosi: ogni proteina è unica e ogni esperimento deve essere progettato separatamente, il che può richiedere mesi. Utilizzando le previsioni dell’intelligenza artificiale, i ricercatori possono ottenere un’anteprima dei risultati per migliaia di proteine ​​alla volta, il che può aiutare a dare priorità alle risorse e ad accelerare studi più complessi.

Abbiamo reso tutte le nostre previsioni liberamente disponibili alla comunità di ricerca e le abbiamo rese open source codice modello per AlphaMissense.

AlphaMissense ha previsto la patogenicità di tutte le possibili 71 milioni di varianti missenso. Ha classificato l’89%, prevedendo che il 57% fosse probabilmente benigno e il 32% probabilmente patogeno.

Cos’è una variante missenso?

Una variante missenso è una sostituzione di una singola lettera nel DNA che dà come risultato un amminoacido diverso all’interno di una proteina. Se pensi al DNA come a un linguaggio, cambiare una lettera può cambiare una parola e alterare del tutto il significato di una frase. In questo caso, una sostituzione cambia l’amminoacido tradotto, il che può influenzare la funzione di una proteina.

La persona media sta trasportando più di 9.000 varianti missenso. La maggior parte sono benigni e hanno effetti scarsi o nulli, ma altri sono patogeni e possono compromettere gravemente la funzione proteica. Le varianti missenso possono essere utilizzate nella diagnosi di malattie genetiche rare, dove poche o anche una singola variante missenso possono causare direttamente la malattia. Sono importanti anche per studiare malattie complesse, come il diabete di tipo 2, che può essere causato da una combinazione di molti tipi diversi di cambiamenti genetici.

Classificare le varianti missenso è un passo importante per comprendere quali di questi cambiamenti proteici potrebbero dare origine alla malattia. Di oltre 4 milioni di varianti missenso già osservate negli esseri umani, solo il 2% è stato annotato come patogeno o benigno dagli esperti, circa lo 0,1% di tutti i 71 milioni possibili varianti missenso. Le restanti sono considerate “varianti di significato sconosciuto” a causa della mancanza di dati sperimentali o clinici sul loro impatto. Con AlphaMissense ora abbiamo il quadro più chiaro fino ad oggi classificando l’89% delle varianti utilizzando una soglia che ha prodotto una precisione del 90% su un database di varianti di malattie note.

Patogeni o benigni: come AlphaMissense classifica le varianti

AlphaMissense si basa sul nostro modello rivoluzionario AlphaFoldche prevedeva le strutture di quasi tutte le proteine ​​conosciute dalla scienza a partire dalle loro sequenze di aminoacidi. Il nostro modello adattato può prevedere la patogenicità delle varianti missenso che alterano i singoli aminoacidi delle proteine.

Per addestrare AlphaMissense, abbiamo messo a punto AlphaFold sulle etichette che distinguono le varianti osservate nelle popolazioni di primati umani e strettamente correlate. Le varianti comunemente osservate vengono trattate come benigne, mentre le varianti mai osservate vengono trattate come patogene. AlphaMissense non prevede il cambiamento nella struttura delle proteine ​​in seguito a mutazioni o altri effetti sulla stabilità delle proteine. Invece, sfrutta i database delle sequenze proteiche correlate e del contesto strutturale delle varianti per produrre un punteggio compreso tra 0 e 1 che valuta approssimativamente la probabilità che una variante sia patogena. Il punteggio continuo consente agli utenti di scegliere una soglia per classificare le varianti come patogene o benigne che corrisponde ai loro requisiti di accuratezza.

Un’illustrazione di come AlphaMissense classifica le varianti missenso umane. Viene immessa una variante missenso e il sistema di intelligenza artificiale la valuta come patogena o probabilmente benigna. AlphaMissense combina il contesto strutturale e la modellazione del linguaggio delle proteine ​​ed è ottimizzato sui database di frequenza delle popolazioni di varianti umane e di primati.

AlphaMissense raggiunge previsioni all’avanguardia su un’ampia gamma di benchmark genetici e sperimentali, il tutto senza una formazione esplicita su tali dati. Il nostro strumento ha sovraperformato altri metodi computazionali quando utilizzato per classificare le varianti di ClinVar, un archivio pubblico di dati sulla relazione tra varianti umane e malattie. Il nostro modello è stato anche il metodo più accurato per prevedere i risultati di laboratorio, il che dimostra che è coerente con diversi modi di misurare la patogenicità.

AlphaMissense supera gli altri metodi computazionali nella previsione degli effetti delle varianti missenso.
Sinistra: Confronto delle prestazioni di AlphaMissense e di altri metodi nella classificazione delle varianti dall’archivio pubblico Clinvar. I metodi mostrati in grigio sono stati addestrati direttamente su ClinVar e le loro prestazioni su questo benchmark sono probabilmente sovrastimate poiché alcune delle loro varianti di addestramento sono contenute in questo set di test.
Giusto: Grafico che confronta le prestazioni di AlphaMissense e di altri metodi nella previsione delle misurazioni da esperimenti biologici.

Costruire una risorsa comunitaria

AlphaMissense si basa su AlphaFold per promuovere la comprensione delle proteine ​​a livello mondiale. Un anno fa abbiamo rilasciato 200 milioni di strutture proteiche previsto utilizzando AlphaFold – che sta aiutando milioni di scienziati in tutto il mondo ad accelerare la ricerca e aprire la strada a nuove scoperte. Siamo ansiosi di vedere come AlphaMissense potrà aiutare a risolvere le questioni aperte nel cuore della genomica e della scienza biologica.

Abbiamo reso le previsioni di AlphaMissense liberamente disponibili alla comunità scientifica. Insieme all’EMBL-EBI, li stiamo anche rendendo più utilizzabili per i ricercatori attraverso il Predittore dell’effetto della variante dell’insieme.

Oltre alla nostra tabella di ricerca delle mutazioni missenso, abbiamo condiviso le previsioni ampliate di tutte le possibili 216 milioni di sostituzioni di sequenze di singoli aminoacidi in più di 19.000 proteine ​​umane. Abbiamo incluso anche la previsione media per ciascun gene, che è simile alla misurazione del vincolo evolutivo di un gene: ciò indica quanto il gene sia essenziale per la sopravvivenza dell’organismo.

Esempi di previsioni AlphaMissense sovrapposte alle strutture previste AlphaFold (rosso=previsto come patogeno, blu=previsto come benigno, grigio=incerto). I punti rossi rappresentano varianti missenso patogene note, i punti blu rappresentano varianti benigne note dal database ClinVar.
Sinistra: Proteina HBB. Le varianti di questa proteina possono causare l’anemia falciforme.
Giusto: proteina CFTR. Le varianti di questa proteina possono causare la fibrosi cistica.

Accelerare la ricerca sulle malattie genetiche

Un passo fondamentale nella traduzione di questa ricerca è la collaborazione con la comunità scientifica. Abbiamo lavorato in collaborazione con Genomics England, per esplorare come queste previsioni potrebbero aiutare a studiare la genetica delle malattie rare. Genomics England ha incrociato i risultati di AlphaMissense con i dati sulla patogenicità delle varianti precedentemente aggregati con partecipanti umani. La loro valutazione ha confermato che le nostre previsioni sono accurate e coerenti, fornendo un altro punto di riferimento nel mondo reale per AlphaMissense.

Anche se le nostre previsioni non sono progettate per essere utilizzate direttamente in clinica – e dovrebbero essere interpretate con altre fonti di prova – questo lavoro ha il potenziale per migliorare la diagnosi di malattie genetiche rare e aiutare a scoprire nuovi geni che causano malattie.

In definitiva, speriamo che AlphaMissense, insieme ad altri strumenti, consenta ai ricercatori di comprendere meglio le malattie e sviluppare nuovi trattamenti salvavita.

Fonte: deepmind.google

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *