Ricerca

Pubblicato
Autori

Yannis Assael, Thea Sommerschield *, Brendan Shillingford, Nando de Freitas (*autori esterni)

Restauro, posizionamento e datazione di testi antichi attraverso la collaborazione tra AI e storici

La nascita della scrittura umana ha segnato l’alba del Storia ed è fondamentale per la nostra comprensione delle civiltà passate e del mondo in cui viviamo oggi. Ad esempio, più di 2.500 anni fa, i Greci iniziarono a scrivere su pietra, ceramica e metallo per documentare qualsiasi cosa, dai contratti di locazione e leggi ai calendari e agli oracoli, fornendo una visione dettagliata della regione mediterranea. Sfortunatamente, è un record incompleto. Molte delle iscrizioni sopravvissute sono state danneggiate nel corso dei secoli o spostate dalla loro collocazione originaria. Inoltre, moderne tecniche di datazione, come datazione al radiocarbonionon possono essere utilizzati su questi materiali, rendendo le iscrizioni difficili e dispendiose in termini di tempo da interpretare.

In linea con La missione di DeepMind di risolvere l’intelligenza per far avanzare la scienza e l’umanità, abbiamo collaborato con Dipartimento di Studi Umanistici dell’Università Ca’ Foscari VeneziaIL Facoltà di Lettere Classiche dell’Università di Oxforde il Dipartimento di Informatica dell’Università di Economia e Commercio di Atene per esplorare come l’apprendimento automatico può aiutare gli storici a interpretare meglio queste iscrizioni, fornendo una comprensione più approfondita della storia antica e sbloccando il potenziale di cooperazione tra l’intelligenza artificiale e gli storici.

In un carta pubblicato oggi in Naturapresentiamo congiuntamente Ithaca, la prima rete neurale profonda in grado di ripristinare il testo mancante delle iscrizioni danneggiate, identificare la loro posizione originale e aiutare a stabilire la data in cui sono state create. Itaca prende il nome dall’isola greca di Quello di Omero Odissea e si basa e si estende Piziail nostro sistema precedente che si concentrava sul restauro testuale. Le nostre valutazioni mostrano che Ithaca raggiunge una precisione del 62% nel ripristinare i testi danneggiati, una precisione del 71% nell’identificare la loro posizione originale e può datare i testi entro 30 anni dai loro intervalli di date attendibili. Gli storici hanno già utilizzato lo strumento per rivalutare periodi significativi della storia greca.

Per rendere la nostra ricerca ampiamente disponibile a ricercatori, educatori, personale dei musei e altri soggetti, abbiamo collaborato con GoogleNuvola E Google Arte e Cultura lanciare un versione interattiva gratuita di Itaca. E per aiutare ulteriori ricerche, abbiamo anche open source il nostro codice, il modello preaddestrato e un notebook interattivo di Colaboratory.

Figura 1. Questa iscrizione restaurata (IG I3 4B) registra un decreto riguardante l’acropoli di Atene e risale al 485/4 a.C. (CC BY-SA 3.0, WikiMedia).

Figura 2. Architettura di Itaca. Le parti danneggiate di un testo sono rappresentate con un trattino “-“. Qui abbiamo corrotto artificialmente i caratteri “δημ”. Fornita di questi input, Itaca ripristina il testo e identifica il tempo e il luogo in cui il testo è stato scritto.

Strumenti collaborativi

Itaca è addestrata sul il più grande dataset digitale di iscrizioni greche dal Packard Humanities Institute. Elaborazione del linguaggio naturale i modelli vengono comunemente addestrati utilizzando le parole perché l’ordine in cui appaiono nelle frasi e le relazioni tra loro forniscono contesto e significato aggiuntivi. Ad esempio, “c’era una volta” ha più significato di ogni carattere o parola visti separatamente. Tuttavia, molte delle iscrizioni che gli storici sono interessati ad analizzare con Itaca sono danneggiate e spesso mancano pezzi di testo. Per garantire che il nostro modello funzioni ancora quando viene presentato uno di questi, lo abbiamo addestrato utilizzando sia le parole che i singoli caratteri come input. Il meccanismo di auto-attenzione sparso al centro del modello valuta questi due input in parallelo, consentendo a Ithaca di valutare le iscrizioni secondo necessità.

Figura 3. Risultati di Itaca. (a) Previsioni di restauro per 6 caratteri mancanti (trattini) in un’iscrizione ateniese (IG II2 116). Il restauro in alto, in verde, è corretto (συμμαχία, “alleanza”). Si noti come le seguenti ipotesi (ἐκκλησία, “assemblea” e προξενία, “trattato tra Stato e straniero”), evidenziate in rosso, ricorrono tipicamente nei decreti politici ateniesi, rivelando la ricettività di Itaca al contesto. (b) Attribuzione geografica di un’iscrizione proveniente da Amorgos (IG XII 7, 2). La previsione principale di Itaca è corretta e le previsioni più vicine riguardano le regioni vicine. (c) Distribuzione della data per un’iscrizione proveniente da Delo (IG XI 4, 579). L’intervallo di date attendibili 300-250 a.C. è in grigio; La distribuzione prevista di Itaca è in giallo e ha una media al 273 a.C. (in verde).

Per massimizzare il valore di Itaca come strumento di ricerca, abbiamo anche creato una serie di supporti visivi per garantire che i risultati di Itaca siano facilmente interpretabili dagli storici:

  • Ipotesi di restauro: Itaca genera diverse ipotesi di previsione per il compito di restauro del testo tra cui gli storici possono scegliere utilizzando la loro esperienza.
  • Attribuzione geografica: Itaca mostra la sua incertezza fornendo agli storici una distribuzione di probabilità su tutte le possibili previsioni – invece di un solo risultato. Di conseguenza, restituisce le probabilità per 84 diverse regioni antiche che rappresentano il suo livello di certezza. Visualizza questi risultati su una mappa per far luce sulle possibili connessioni geografiche sottostanti nel mondo antico.
  • Attribuzione cronologica: Quando si data un testo, Itaca produce una distribuzione delle date previste in tutti i decenni dall’800 a.C. all’800 d.C. Ciò può consentire agli storici di visualizzare la confidenza del modello per intervalli di date specifici, che possono offrire preziosi spunti storici.
  • Mappe di salienza: Per trasmettere i risultati agli storici, Ithaca utilizza una tecnica comunemente usata nella visione artificiale che identifica quali sequenze di input contribuiscono maggiormente a una previsione. Il risultato evidenzia le parole con diverse intensità di colore che hanno portato alle previsioni di Itaca per testo, posizione e date mancanti.

Figura 4. Questo testo (IG II2 116, Atene 361/0 aC) registra un’alleanza tra il popolo di Atene e quello della Tessaglia. Utilizzando le mappe di salienza, possiamo visualizzare Itaca “concentrata” sulle parole contestualmente importanti “Ateniesi” e “Tessali” quando si ripristina la parola corrotta “alleanza”.

Contribuire ai dibattiti storici

La nostra valutazione sperimentale mostra come le decisioni di progettazione e gli ausili per la visualizzazione di Itaca rendano più semplice per i ricercatori interpretare i risultati. Gli storici esperti con cui abbiamo lavorato hanno raggiunto una precisione del 25% quando hanno lavorato da soli per restaurare testi antichi. Ma, quando si utilizza Ithaca, le loro prestazioni aumentano al 72%, superando le prestazioni individuali del modello e mostrando il potenziale della cooperazione uomo-macchina per far avanzare l’interpretazione storica, stabilire datazioni relative per eventi storici e persino contribuire agli attuali dibattiti metodologici.

Ad esempio, gli storici attualmente non sono d’accordo sulla data di una serie di eventi importanti Decreti ateniesi realizzato in un’epoca in cui vivevano personaggi importanti come Socrate e Pericle. Per molto tempo si è pensato che i decreti fossero stati scritti prima del 446/445 a.C., anche se nuove prove suggeriscono una data intorno al 420 a.C. Sebbene possa sembrare una piccola differenza, questi decreti sono fondamentali per la nostra comprensione della storia politica dell’Atene classica.

Il nostro set di dati di addestramento contiene la cifra precedente del 446/445 a.C. Per testare le previsioni di Itaca, l’abbiamo riqualificato su un set di dati che non conteneva iscrizioni datate e quindi abbiamo inviato questi testi per l’analisi. Sorprendentemente, la data media prevista per i decreti a Itaca è il 421 a.C., in linea con le più recenti scoperte sulla datazione e mostrando come l’apprendimento automatico può contribuire ai dibattiti attorno a uno dei momenti più significativi della storia greca.

Figura 5. Le previsioni di Ithaca rispetto alle verità fondamentali del set di dati del Packard Humanities Institute (PHI) rispetto alle recenti rivalutazioni storiche. Le etichette PHI sono in media a 27 anni di distanza dalle rivalutazioni, mentre le previsioni di Ithaca sono in media a soli 5 anni di distanza dalle verità di base appena proposte.

Riteniamo che questo sia solo l’inizio per strumenti come Ithaca e per il potenziale di collaborazione tra l’apprendimento automatico e le discipline umanistiche. L’antica Grecia svolge un ruolo determinante nella nostra comprensione del mondo mediterraneo, ma è ancora solo una parte di un vasto quadro globale di civiltà. A tal fine, stiamo attualmente lavorando su versioni di Itaca addestrate su altre lingue antiche e gli storici possono già utilizzare i loro set di dati nell’architettura attuale per studiare altri sistemi di scrittura antichi, da Accadico A Demotico E ebraico A Maya. Ci auguriamo che modelli come Ithaca possano sbloccare il potenziale di cooperazione tra l’intelligenza artificiale e le discipline umanistiche, influenzando in modo trasformativo il modo in cui studiamo e scriviamo su alcuni dei periodi più significativi della storia umana.

Fonte: deepmind.google

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *