
Il modello Prithvi-100M IBM Geospatial AI Foundation per i dati di osservazione della Terra della NASA
I modelli Foundation sono algoritmi flessibili di deep learning progettati per compiti generali, anziché essere immediatamente focalizzati su compiti specifici. Addestrati su grandi quantità di dati non etichettati, possono essere applicati a una varietà di attività a valle con una messa a punto minima. I modelli di fondazione sono ben noti dall’elaborazione del linguaggio naturale (BERTGPT-x) e l’elaborazione delle immagini (DALLE).
Nell’agosto 2023, la NASA e l’IBM hanno rilasciato il Geospatial AI Foundation Model per i dati di osservazione della Terra della NASA. Il modello è disponibile open source su Abbracciare la faccia sotto il nome di Prithvi, la dea indù della Madre Terra. È stato addestrato sui dati satellitari della NASA: secondo IBM, più di 250 Petabyte di dati sono disponibili.
In questo post del blog, discutiamo
- Il set di dati Landsat Harmonized Sentinel-2 della NASA utilizzato per l’addestramento,
- L’architettura del modello di fondazione AI geospaziale Prithvi-100M,
- Il processo di addestramento sul supercomputer Vela di IBM,
- Esempi di applicazioni: inondazioni e identificazione del tipo di coltura.
Dati di allenamento
È stato effettuato l’addestramento sul modello di base dell’intelligenza artificiale geospaziale Dati armonizzati della NASA LandSat Sentinel-2.
Sentinella-2 è una missione satellitare coordinata dall’Agenzia spaziale europea, con due satelliti attualmente in orbita che acquisiscono immagini ad alta risoluzione della Terra. Si concentra su terra, aree costiere e acque aperte selezionate. I satelliti Landsat sono stati lanciati dalla NASA per registrare la riflettanza superficiale. I dati armonizzati combinano l’input di entrambi i sensori, ottenendo una risoluzione spaziale di circa 30 metri e un tempo di rivisitazione medio di due o tre giorni. Questa risoluzione è sufficiente per il monitoraggio agricolo, la classificazione dell’uso del territorio e il rilevamento dei disastri naturali.
Le fotografie standard sono composte da tre colori: rosso, verde e blu. I dati Sentinel-2 sono disponibili in un totale di 13 “colori”, cosiddetti bandeche abbraccia la gamma visibile, del vicino infrarosso e dell’infrarosso a onde corte dello spettro elettromagnetico. Le bande selezionate possono essere utilizzate per identificare cose diverse, ad esempio gli infrarossi…
Fonte: towardsdatascience.com