Come generare immagini sintetiche per attività di rilevamento di oggetti |  di Dott. Leon Eversberg |  Marzo 2024

 | Intelligenza-Artificiale

Un tutorial passo passo utilizzando Blender, Python e Risorse 3D

Immagine creata dall'autore

Non disporre di dati di addestramento sufficienti è uno dei maggiori problemi del deep learning odierno.

Una soluzione promettente per le attività di visione artificiale è la generazione automatica di immagini sintetiche con annotazioni.

In questo articolo, fornirò innanzitutto una panoramica di alcune tecniche di generazione di immagini per dati di immagini sintetiche.

Quindi, generiamo un set di dati di addestramento con zero annotazioni manuali richieste e lo utilizziamo per addestrare un modello di rilevamento di oggetti R-CNN più veloce.

Infine, testiamo il nostro modello addestrato su immagini reali.

In teoria, le immagini sintetiche sono perfette. Puoi generare un numero quasi infinito di immagini senza alcuno sforzo di annotazione manuale.

I set di dati di addestramento con immagini reali e annotazioni manuali possono contenere una quantità significativa di errori di etichettatura umana e sono spesso set di dati sbilanciati con bias (ad esempio, le immagini delle automobili sono molto probabilmente scattate di lato/davanti e su una strada).

Tuttavia, le immagini sintetiche soffrono di un problema chiamato divario tra dominio sim e reale.

Il divario tra dominio sim e reale deriva dal fatto che stiamo utilizzando immagini di addestramento sintetiche, ma vogliamo utilizzare il nostro modello su immagini del mondo reale durante la distribuzione.

Esistono diverse tecniche di generazione di immagini che tentano di ridurre il divario di dominio.

Taglia e incolla

Uno dei modi più semplici per creare immagini di allenamento sintetiche è l'approccio taglia e incolla.

Come mostrato di seguito, questa tecnica necessita di alcune immagini reali dalle quali vengono ritagliati gli oggetti da riconoscere. Questi oggetti possono quindi essere incollati su immagini di sfondo casuali per generare un gran numero di nuove immagini di allenamento.

Un'immagine che mostra l'approccio taglia e incolla: gli oggetti segmentati vengono ritagliati da immagini reali e quindi incollati su immagini di sfondo casuali per generare dati di addestramento sintetici
Per generare ulteriori immagini sintetiche di allenamento, ritaglia alcuni esempi reali dei tuoi oggetti e poi incollali sulle immagini di sfondo. Immagine da Dwibedi, Misra e Hebert (1)

Mentre Georgakis et al. (2) sostengono che la posizione di questi oggetti dovrebbe essere realistica per ottenere risultati migliori (ad esempio, un oggetto…

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *