Aeneas trasforma come gli storici collegano il passato

 | Intelligenza-Artificiale

Ricerca

Pubblicato
Autori

La squadra di Eneas

La scrittura era ovunque nel mondo romano, inciso su tutto, dai monumenti imperiali agli oggetti di tutti i giorni. Dai graffiti politici, poesie d'amore ed epitaffi alle transazioni commerciali, inviti di compleanno e incantesimi magici, le iscrizioni offrono agli storici moderni intuizioni ricche sulla diversità della vita quotidiana in tutto il mondo romano.

Spesso questi testi sono frammentari, alterati o deliberatamente deturpati. Il ripristino, gli appuntamenti e il posizionarli è quasi impossibile senza informazioni contestuali, specialmente quando si confrontano iscrizioni simili.

Oggi stiamo pubblicando un carta in natura che introduce EneaIl primo modello di intelligenza artificiale (AI) per contestualizzare le iscrizioni antiche.

Quando si lavorano con antiche iscrizioni, gli storici si basano tradizionalmente sulla loro esperienza e risorse specializzate per identificare i “parallelismi”, che sono testi che condividono somiglianze in formulazione, sintassi, formule standardizzate o provenienza.

Aenea accelera notevolmente questo lavoro complesso e che richiede tempo. È ragionato in migliaia di iscrizioni latine, recuperando parallelismi testuali e contestuali in pochi secondi che consentono agli storici di interpretare e basarsi sui risultati del modello.

Il nostro modello può anche essere adattato ad altre lingue, script e media antichi, da Papiri al conio, ampliando le sue capacità per aiutare a tracciare connessioni attraverso una più ampia gamma di prove storiche.

Abbiamo co-sviluppato Enea presso l'Università di Nottingham e in collaborazione con ricercatori delle università di Warwick, Oxford e Athens University of Economics and Business (AUEB). Questo lavoro faceva parte di uno sforzo più ampio per esplorare come l'intelligenza artificiale generativa può aiutare gli storici a identificare e interpretare meglio i parallelismi su vasta scala.

Vogliamo che questa ricerca tragga bene a beneficio di quante più persone possibile, quindi stiamo realizzando una versione interattiva di Aenea liberamente disponibile per ricercatori, studenti, educatori, professionisti del museo e altro PredictingThePast.com. Per supportare ulteriori ricerche, stiamo anche open sourcing Il nostro codice e set di dati.

Le capacità avanzate di Enea

Prende il nome dall'eroe errante della mitologia Graeco-Roman, Enea si basa su IthacaIl nostro lavoro precedente che utilizza l'IA per ripristinare, data e posizionare antiche iscrizioni greche.

Enea fa un passo avanti, aiutando gli storici a interpretare e contestualizzare un testo, dare significato a frammenti isolati, trarre conclusioni più ricche e mettere insieme una migliore comprensione della storia antica.

Le capacità avanzate del nostro modello includono:

  • Ricerca parallele: Cerca parallelismi attraverso una vasta collezione di iscrizioni latine. Trasformando ogni testo in una sorta di impronta digitale storica, Enea identifica profonde connessioni che possono aiutare gli storici a situare le iscrizioni nel loro più ampio contesto storico.
  • Elaborazione input multimodali: Aeneas è il primo modello a determinare la provenienza geografica di un testo usando input multimodali. Analizza sia il testo che le informazioni visive, come le immagini di un'iscrizione.
  • Ripristino lacune di lunghezza sconosciuta: Per la prima volta, Aeneas può ripristinare gli spazi vuoti in testi in cui la lunghezza mancante è sconosciuta. Questo lo rende uno strumento più versatile per gli storici che si occupano di materiale fortemente danneggiato.
  • Performance all'avanguardia: Enea stabilisce un nuovo punto di riferimento all'avanguardia nel ripristinare testi danneggiati e prevedere quando e dove sono stati scritti.

Animazione di un diploma militare in bronzo restaurato dalla Sardegna 113/14 CE (CIL XVI, 60).

Come funziona Enea

Aeneas è una rete neurale generativa multimodale che prende il testo e l'immagine di un'iscrizione come input. Per addestrare Enea, abbiamo curato un set di dati grandi e affidabili, attingendo da decenni di lavoro da parte di storici per creare collezioni digitali, in particolare il Roma di database epigrafico (EDR), Database epigrafico Heidelberg (Edh) e Database epigrafico Clauss Slaby (EDCS-ELT).

Abbiamo pulito, armonizzato e collegato questi record in un singolo set di dati ad azione-azione che chiamiamo il Set di dati epigrafici latini (LED), comprendente oltre 176.000 iscrizioni latine da tutto il mondo romano.

Il nostro modello utilizza un decodificatore basato sul trasformatore per elaborare l'ingresso testuale di un'iscrizione. Le reti specializzate gestiscono il ripristino e la datazione dei caratteri utilizzando il testo, mentre l'attribuzione geografica utilizza anche le immagini delle iscrizioni come input. Il decoder recupera iscrizioni simili dal LED, classificate per rilevanza.

Per ogni iscrizione, il meccanismo di contestualizzazione di Enea recupera un elenco di parallelismi usando una tecnica chiamata “Embeddings” – codificando le informazioni testuali e contestuali di ogni iscrizione in una sorta di impronta digitale storica contenente dettagli di ciò che dice il testo, il suo linguaggio, quando e da dove provengono e come provengono e come si riferiscono ad altre iscrizioni.

Diagramma dell'architettura di Aeneas che mostra come il modello prende input di testo e immagine per generare previsioni provinciali, data e restauro.

Performance all'avanguardia

Le iscrizioni di Aeneas raggruppa la data di scrittura molto più chiaramente rispetto ad altri modelli per scopi generali anche addestrati in latino, come mostrato nella visualizzazione seguente.

Visualizzazione di approssimazione e proiezione (UMAP) uniforme che illustra l'attribuzione cronologica degli incorporamenti storicamente ricchi di Aeneas rispetto ai generici incorporamenti testuali del modello di linguaggio di grandi dimensioni.

Aeneas ripristina le iscrizioni danneggiate con una precisione di Top-20 del 73% in lacune fino a dieci caratteri. Ciò diminuisce solo al 58% quando la lunghezza del restauro è sconosciuta, essa stessa un compito incredibilmente impegnativo. Mostra anche il suo ragionamento in modo interpretabile, fornendo mappe di salienza che evidenziano quali parti degli input hanno influenzato le sue previsioni. Grazie al suo uso di dati visivi, il nostro modello può attribuire un'iscrizione a una delle 62 antiche province romane con precisione del 72%. Per gli appuntamenti, Eneas pone un testo entro 13 anni dalle gamme di data fornite dagli storici.

Un nuovo obiettivo sui dibattiti storici

Per testare le capacità di Eneas su un dibattito di ricerca in corso, gli abbiamo dato una delle iscrizioni romane più famose: il Risultati di Augustus Il resoconto in prima persona dell'imperatore Augustus sui suoi successi.

Gli storici si sono fatti da tempo per la datazione di questa iscrizione. Invece di prevedere una singola data fissa, Enea ha prodotto una distribuzione dettagliata di possibili date, mostrando due picchi distinti, con un picco più piccolo intorno al 10-1 a.C. e un picco più grande e più sicuro tra 10-20 d.C. Questi risultati hanno catturato entrambe ipotesi di datazione prevalenti in modo quantitativo.

Istogramma che mostra la previsione di attribuzione cronologica di Eneas per il Risultatiquali modelli dibattiti accademici sugli appuntamenti di questa famosa iscrizione.

Enea ha basato le sue previsioni su sottili caratteristiche linguistiche e marcatori storici come titoli ufficiali e monumenti menzionati nel testo. Trasformando la domanda di appuntamenti in una stima probabilistica fondata su dati linguistici e contestuali, il nostro modello offre un nuovo modo quantitativo di impegnarsi con dibattiti storici di vecchia data.

Ancora più importante, Enea ha anche recuperato molti parallelismi rilevanti dai testi legali imperiali legati all'eredità di Augustus, evidenziando come l'ideologia dell'Impero è stata riprodotta attraverso i media e la geografia.

Avanzamento di ricerca storica in modo collaborativo

Per valutare l'impatto di Eneas come aiuto per la ricerca, abbiamo condotto uno storico su larga scala e uno studio collaborativo AI. Abbiamo invitato ventitré storici che lavorano regolarmente con le iscrizioni per ripristinare, data e posizionare una serie di testi usando Enea.

La nostra valutazione, riassunta nella tabella seguente, mostra come sono stati raggiunti i risultati più efficaci quando gli storici hanno usato le informazioni contestuali di Enea insieme alle sue previsioni per il ripristino e l'attribuzione delle iscrizioni romane.

Tabella che mostra la performance degli storici su tre compiti epigrafici (restauro, attribuzione geografica, appuntamenti) utilizzando 60 iscrizioni dal nostro set di test di database. I compiti sono stati prima eseguiti in modo indipendente, quindi con le informazioni parallele di Eneas, o paralleli e previsioni insieme.

Enea ha aiutato gli storici nel nostro studio a identificare nuovi parallelismi e ha aumentato la loro fiducia quando si affrontano compiti epigrafici complessi. Gli storici hanno costantemente evidenziato il valore di Enea nell'accelerare il loro lavoro e nell'espansione della gamma di iscrizioni parallele più pertinenti.

I parallelismi di Enea hanno cambiato completamente la mia percezione dell'iscrizione. Ha notato dettagli che hanno fatto la differenza per il ripristino e l'attribuzione cronologicamente del testo.

Storico anonimo dal nostro studio

Condividere gli strumenti, modellare il futuro

Eneas è progettata per integrarsi all'interno dei flussi di lavoro di ricerca esistenti degli storici. Combinando la conoscenza degli esperti con l'apprendimento automatico, apre un processo collaborativo, offrendo suggerimenti interpretabili che servono come preziosi punti di partenza per l'indagine storica.

Come parte del rilascio di oggi, stiamo aggiornando IthacaIl nostro antico modello greco, per essere alimentato da Enea e include la funzione di contestualizzazione, restauri di lunghezza sconosciuta e prestazioni migliori in generale.

Abbiamo anche co-progettato un nuovo Sistema di insegnamento Per colmare le abilità tecniche con il pensiero storico in classe. Questo programma si allinea con le iniziative di alfabetizzazione AI, comprese le Commissioni europee Framework delle competenze digitali per i cittadini (Digcomp 2.2), l'UNESCO Framework di competenza AI per gli studentie l'anteprima della Commissione europea e dell'Organizzazione per la cooperazione e lo sviluppo economico (OCSE) Ailit Framework.

Il team Aeneas continua a collaborare con diversi esperti in materia, usando Enea per aiutare a far luce sul nostro passato antico – con altri a venire.

Ulteriori informazioni su Eneas

Riconoscimenti

La ricerca è stata co-guidata da Yannis Assael e Thea SommersChield.

I collaboratori includono: Alison Cooley, Brendan Shillingford, John Pavlopoulos, Priyanka Suresh, Bailey Herms, Jonathan Prag, Alex Mullen e Shakir Mohamed. L'interfaccia Web Aeneas è stata sviluppata da Justin Grayston, Benjamin Maynard e Nicholas Dietrich ed è alimentata da Google Cloud.

Il programma è stato sviluppato da Robbe Wulgaert, Sint-Lienscollege, Gand, Belgio.

Fonte: deepmind.google

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *