Nel luglio 2022, abbiamo pubblicato le previsioni sulla struttura delle proteine AlphaFold per quasi tutte le proteine catalogate conosciute dalla scienza. Leggi l’ultimo blog Qui.
Oggi sono incredibilmente orgoglioso ed entusiasta di annunciare che DeepMind sta dando un contributo significativo alla comprensione della biologia da parte dell’umanità.
Quando noi annunciato AlphaFold 2 lo scorso dicembre è stato acclamato come una soluzione al problema del ripiegamento delle proteine vecchio di 50 anni. La settimana scorsa abbiamo pubblicato il carta scientifica E codice sorgente spiegando come abbiamo creato questo sistema altamente innovativo, e oggi lo condividiamo previsioni di alta qualità per la forma di ogni singola proteina del corpo umano, nonché per le proteine di altri 20 organismi su cui gli scienziati fanno affidamento per le loro ricerche.
Mentre i ricercatori cercano cure per le malattie e perseguono soluzioni ad altri grandi problemi che affliggono l’umanità – tra cui la resistenza agli antibiotici, l’inquinamento da microplastiche e il cambiamento climatico – trarranno beneficio da nuove conoscenze sulla struttura delle proteine. Le proteine sono come minuscole e squisite macchine biologiche. Nello stesso modo in cui la struttura di una macchina ci dice cosa fa, così la struttura di una proteina ci aiuta a comprenderne la funzione. Oggi condividiamo una miniera di informazioni quello raddoppia comprensione da parte dell’umanità del proteoma umanoe rivela le strutture proteiche trovate in altri 20 organismi biologicamente significativi, dall’E.coli al lievito, e dalla mosca della frutta al topo.
Questo sarà uno dei set di dati più importanti dopo la mappatura del genoma umano.
Ewan Birney, vicedirettore generale dell’EMBL e direttore dell’EMBL-EBI
Essendo un potente strumento che supporta gli sforzi dei ricercatori, riteniamo che questo sia il contributo più significativo che l’intelligenza artificiale abbia dato fino ad oggi al progresso della conoscenza scientifica, ed è un ottimo esempio dei benefici che l’intelligenza artificiale può apportare all’umanità. Queste intuizioni sosterranno molti entusiasmanti progressi futuri nella nostra comprensione della biologia e della medicina. Grazie a cinque anni instancabili di lavoro e al grande ingegno del team AlphaFold e alla stretta collaborazione degli ultimi mesi con i nostri partner presso Istituto europeo di bioinformatica dell’EMBL (EMBL-EBI)siamo in grado di condividere questa enorme e preziosa risorsa con il mondo.
Questo ultimo lavoro si basa su annunci abbiamo realizzato lo scorso dicembre, alla conferenza CASP14, quando DeepMind ha presentato una versione radicalmente nuova del nostro sistema AlphaFold, che è stato riconosciuto dagli organizzatori della valutazione come una soluzione alla grande sfida lunga 50 anni per comprendere la struttura 3D delle proteine. Determinare sperimentalmente le strutture proteiche è un’attività scrupolosa e dispendiosa in termini di tempo, ma AlphaFold ha dimostrato che l’intelligenza artificiale potrebbe prevedere con precisione la forma di una proteina, su larga scala e in pochi minuti, fino alla precisione atomica. A CASPci siamo impegnati a condividere i nostri metodi e a fornire un ampio accesso a questo insieme di conoscenze.
Questo mese abbiamo portato a termine l’enorme quantità di duro lavoro necessario per mantenere tale impegno. Abbiamo pubblicato due articoli sottoposti a peer review in Natura (1,2) E codice AlphaFold open source. Oggi, in collaborazione con EMBL-EBIsiamo incredibilmente orgogliosi di lanciare il Database della struttura delle proteine AlphaFoldche offre il quadro più completo e accurato del proteoma umano fino ad oggi, più che raddoppiando la conoscenza accumulata dall’umanità sulle strutture proteiche umane ad alta precisione.
Oltre al proteoma umano (tutte le circa 20.000 proteine espresse dal genoma umano), stiamo fornendo libero accesso ai proteomi di 20 altri organismi biologicamente significativiper un totale di oltre 350.000 strutture proteiche. La ricerca su questi organismi è stata oggetto di innumerevoli articoli di ricerca e di numerose importanti scoperte e ha portato a una comprensione più profonda della vita stessa. Nei prossimi mesi prevediamo di espandere notevolmente la copertura a quasi tutte le proteine sequenziate conosciute dalla scienza – oltre 100 milioni di strutture che coprono la maggior parte del territorio Banca dati di riferimento UniProt. È un vero e proprio almanacco delle proteine del mondo. Inoltre, il sistema e il database verranno aggiornati periodicamente mentre continuiamo a investire in futuri miglioramenti ad AlphaFold.
La cosa più entusiasmante è che, nelle mani di scienziati di tutto il mondo, questo nuovo almanacco delle proteine consentirà e accelererà la ricerca che migliorerà la nostra comprensione di questi elementi costitutivi della vita. Già, attraverso le nostre prime collaborazioni, abbiamo visto segnali promettenti da parte dei ricercatori che utilizzano AlphaFold nel proprio lavoro. Ad esempio, il Iniziativa sui farmaci per le malattie trascurate (DNDi) ha fatto avanzare la ricerca sulle cure salvavita per le malattie che colpiscono in modo sproporzionato le parti più povere del mondo, e il Centro per l’innovazione degli enzimi presso l’Università di Portsmouth (CEI) sta utilizzando AlphaFold per progettare enzimi più rapidi per riciclare alcune delle nostre plastiche monouso più inquinanti. Per quegli scienziati che si affidano alla determinazione sperimentale della struttura delle proteine, le previsioni di AlphaFold hanno contribuito ad accelerare la loro ricerca. Come altro esempio, una squadra del Università del Colorado Boulder sta trovando risultati promettenti nell’utilizzo delle previsioni AlphaFold per studiare la resistenza agli antibiotici, mentre un gruppo del Università della California San Francisco li ha usati aumentare la loro comprensione della biologia della SARS-CoV-2. E questo è solo l’inizio di quella che speriamo possa essere una rivoluzione nella bioinformatica strutturale. Con AlphaFold disponibile nel mondo, c’è un tesoro di dati in attesa di essere trasformato in progressi futuri.
AlphaFold apre nuovi orizzonti di ricerca ed è stimolante vedere una potente intelligenza artificiale all’avanguardia che consente di lavorare su malattie che si concentrano quasi esclusivamente nelle popolazioni povere.
– Ben Perry, leader dell’innovazione aperta di Discovery, Iniziativa sui farmaci per le malattie trascurate (DNDi)
Per il team AlphaFold di DeepMind, questo lavoro rappresenta il culmine di cinque anni di enormi sforzi, incluso il dover superare in modo creativo molti ostacoli impegnativi, risultando in una serie di nuove sofisticate innovazioni algoritmiche che erano tutte necessarie per risolvere finalmente il problema. Si basa sulle scoperte di generazioni di scienziati, dai primi pionieri dell’imaging e della cristallografia delle proteine, alle migliaia di specialisti di previsione e biologi strutturali che da allora hanno trascorso anni a sperimentare con le proteine. Il nostro sogno è che AlphaFold, fornendo questa comprensione fondamentale, possa aiutare innumerevoli altri scienziati nel loro lavoro e aprire strade completamente nuove alla scoperta scientifica.
Ciò che ci è voluto mesi e anni per fare, AlphaFold è stato in grado di farlo in un fine settimana.
– Professor John McGeehan, Professore di Biologia Strutturale e Direttore del Centro, Centre for Enzyme Innovation (CEI) presso l’Università di Portsmouth
In DeepMind, la nostra tesi è sempre stata che l’intelligenza artificiale può accelerare notevolmente le scoperte in molti campi della scienza e, a sua volta, far progredire l’umanità. Abbiamo costruito AlphaFold e il Database della struttura delle proteine AlphaFold per sostenere ed elevare gli sforzi degli scienziati di tutto il mondo nell’importante lavoro che svolgono. Riteniamo che l’intelligenza artificiale abbia il potenziale per rivoluzionare il modo in cui viene svolta la scienza nel 21° secolo e attendiamo con impazienza le prossime scoperte che AlphaFold potrebbe aiutare la comunità scientifica a realizzare.
Per saperne di più, vai su Nature per leggere i nostri articoli sottoposti a peer review che descrivono il nostro metodo completoe il proteoma umano. Puoi leggere di più su di loro nel nostro blog tecnico. Se vuoi esplorare il nostro sistema, ecco il codice open source per AlphaFold E Taccuino di Colab per eseguire sequenze individuali. Per esplorare le nostre strutture, EMBL-EBI, leader mondiale nei dati biologici, le ospita un database consultabile che sia aperto e gratuito per tutti.
Ci piacerebbe sentire il tuo feedback e capire come AlphaFold è stato utile nella tua ricerca. Condividi le tue storie su alphafold@deepmind.com.