Data Science basata sul cloud: un approccio moderno all’analisi e alla modellazione dei dati |  di Ben Chamblee |  Novembre 2023

 | Intelligenza-Artificiale

Una guida per utilizzare il cloud in ogni fase del flusso di lavoro di data science

fotografato da Myriams-Foto SU Piaxabay

La scienza dei dati è uno dei settori in rapida crescita nel mondo, che utilizza tecnologie moderne e all’avanguardia per migliorare il modo in cui utilizziamo i dati. Tuttavia, se hai lavorato nel campo della scienza dei dati probabilmente sai che un giorno ti ritroverai inevitabilmente a fissare un foglio Excel. E non c’è niente di sbagliato in Excel, semplicemente non è il tipo di strumento che ti aspetteresti di utilizzare quando lavori in uno dei settori più moderni.

Molte organizzazioni hanno iniziato a utilizzare la moderna infrastruttura cloud, ma non nella misura massima. Molti data scientist si ritroveranno a estrarre dati da un data warehouse sul cloud solo per addestrare un modello sul proprio sistema locale. Anche in questo non c’è niente di sbagliato, ma cosa accadrebbe se potessimo portare l’intero flusso di lavoro della scienza dei dati nel cloud? Bene, possiamo!

Dalla pulizia dei dati alla distribuzione del modello, esiste uno strumento basato su cloud che puoi utilizzare per modernizzare il tuo flusso di lavoro. In questo articolo esaminerò ogni passaggio del flusso di lavoro di data science, mostrerò come trasferirlo nel cloud e fornirò alcuni esempi lungo il percorso. Sentiti libero di saltare un po’ se hai già modernizzato parte del tuo flusso di lavoro, ma se desideri un’esperienza di data science nel cloud al 100%; rimani sintonizzato!

Raccolta e archiviazione dei dati sul cloud

È probabile che tu abbia già familiarità con i vantaggi dell’archiviazione dei dati sul cloud, ma nel caso non l’avessi ancora sentito: è davvero fantastico! L’archiviazione dei tuoi dati sul cloud ti consente di accedervi da qualsiasi luogo tramite una connessione Internet, integrarli facilmente con altri servizi cloud, scalare la capacità di archiviazione in base alle tue esigenze, creare backup per il ripristino e molte altre cose molto utili.

Indipendentemente dal fatto che tu abbia bisogno o meno di un data warehouse, un data Lake o uno storage di oggetti, i tuoi dati dovranno vivere da qualche parte se desideri distribuirli ad altre applicazioni. Esistono tantissimi servizi che offrono l’archiviazione dei dati nel cloud; alcuni dei più popolari includono:

  • AWS S3
  • Archiviazione BLOB di Azure
  • Archiviazione Google Cloud
  • Hadoop

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *