Depth Anything: un modello di base per la stima della profondità monoculare |  di Sascha Kirch |  Marzo 2024

 | Intelligenza-Artificiale

Carta: Profondità su qualsiasi cosa: liberare la potenza dei dati senza etichetta su larga scala di Lihe Yang, Bingyi Kang, Zilong Huang, Xiaogang Xu, Jiashi Feng, HengshuangZhaoonatan Ho, Ajay Jain, Pieter Abbeel19 gennaio 2024

Codice: https://github.com/LiheYoung/Depth-Anything

Pagina del progetto: https://approfondimento-qualsiasi cosa.github.io/

Conferenza: CVPR2024

Categoria: modelli di fondazione, stima della profondità monoculare

Altre procedure dettagliate: (BYOL), (CLIP), (PERDERE), (SAM), (DINO)

  1. Contesto e sfondo
  2. Metodo
  3. Risultati qualitativi
  4. Esperimenti e ablazioni
  5. Ulteriori letture e risorse

Perché la profondità è una modalità così importante e perché utilizzare il deep learning per questo?

Illustrazione congiunta di immagine e mappa di profondità che mostra una bicicletta arancione di Sascha Kirch
Fig.1: Immagine e corrispondente mappa di profondità. Immagine di Sasha Kirch e la mappa di profondità creata con Profondità Demo del volto che abbraccia tutto.

In parole povere: per navigare nello spazio 3D, bisogna sapere dove si trovano tutte le cose e a quale distanza. Le applicazioni classiche includono la prevenzione delle collisioni, il rilevamento dello spazio percorribile, il posizionamento di oggetti in una realtà virtuale o aumentata, la creazione di oggetti 3D, la guida di un robot per afferrare un oggetto e molto altro…

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *