Il dibattito tra microservizi e monolito infuria nel software, ma si riduce a un leggero ribollire nel mondo dei dati
Non ho bisogno di spendere molte parole per convincerti che scegliere gli strumenti nello spazio dati è difficile. Ci sono centinaia, se non migliaia di modi per farlo scuoiare questo gatto.
Qualcosa che le persone trascurano è il modo in cui l’architettura influisce su queste decisioni.
Circa 20 anni fa, le applicazioni risiedevano sui computer di proprietà delle aziende che ne avevano bisogno: questo si chiama “on-premise”. Possedere questi computer è una decisione architettonica. Di conseguenza, i fornitori di software cloud non esistevano, poiché non vi era domanda di software cloud a causa della sua intrinseca incompatibilità con l’architettura dell’epoca.
Avanzando rapidamente fino al 2024, accadrà il contrario: la maggior parte delle persone è completamente nel cloud. Tuttavia, alcuni di noi utilizzano ancora i propri server. Altri hanno modelli ibridi. Ciò significa che comprendere l’impatto che la tua architettura ha sulle soluzioni scelte è più importante che mai e in questo articolo approfondiremo l’impatto dell’approccio microservizi rispetto a quello monolitico all’architettura dei dati sugli strumenti che acquisti.
Qualcosa che accade in Data è una riaccensione del microservizio e monolite discussione. Per capire di cosa si tratta:
Un’applicazione monolitica è creata come una singola unità unificata mentre un’architettura di microservizi è una raccolta di servizi più piccoli e distribuibili in modo indipendente.
All’interno di Data, le applicazioni monolitiche erano abbastanza comuni 10 anni fa. Un esempio di ciò potrebbe essere un repository Airflow di grandi dimensioni, contenente il codice di acquisizione dei dati, il codice di trasformazione dei dati e le automazioni aziendali.
Le automazioni aziendali potrebbero includere cose come l’aggiornamento dei dashboard, l’invio di report o l’invio di avvisi quando le attività non riescono.
Al contrario, l’esplosione del cloud, in parte alimentata dai fondi di capitale di rischio (cfr questo rapporto), ha dato origine ad architetture di dati che assomigliano molto ai microservizi. I microservizi includono applicazioni per la gestione dello spostamento dei dati in batch, della trasformazione dei dati e del magazzino…
Fonte: towardsdatascience.com