Una delle piattaforme dati basate su cloud più di tendenza, Snowflake, ora incorpora funzionalità di modellazione avanzate e ho dato una possibilità a quella di previsione.
Alcuni mesi fa (23 novembre), Snowflake ha annunciato il rilascio di molteplici nuove funzionalità nello spazio di modellazione/LLM, nell’ambito di un framework chiamato “Corteccia”.
Da metà dicembre sono attive le prime due funzionalità (Previsione E Rilevazioni di anomalie) sono stati resi generalmente disponibili (Fiocco di neve 7.44 Note sulla versione).
Pertanto, Snowflake continua la sua missione di offrire una piattaforma di analisi “one-stop-shop” completamente gestita per aiutare i cittadini dei dati a sbloccare valore dal loro patrimonio di dati, oltre alle normali funzionalità di data warehouse rivolte ai team di ingegneria dei dati.
Tali funzionalità ricorderanno ad alcuni di voi il “Google BigQueryML” Quelli che sono stati rilasciati per la prima volta Agosto 2020 (sì, quattro anni fa!); tuffiamoci!
Previsione delle visite alle piscine della città locale
Oltre agli emozionanti discorsi e alle dimostrazioni su misura dello Snowday ❄️, ero ansioso di caricare un set di dati di vita reale in Snowflake e vedere come si comporta Cortex rispetto a ciò che un normale Data Citizen potrebbe ottenere con la semplice combinazione di Panda e Scikit-Learn .
Ho deciso di utilizzare le statistiche di frequentazione di una piscina locale vicino a casa mia (sono stati così gentili da rilasciare i dati in uno spirito “open data” e anche perché sono un nuotatore abituale lì 🏊♂️).
Si tratta di un dataset davvero interessante perché tutti possiamo immaginare intuitivamente tutti i motivi per cui la frequentazione di una piscina pubblica oscilla:
- nuotatori abituali contro bambini e famiglie che vengono a divertirsi di tanto in tanto,
- stagioni e temperatura,
- orari di apertura diversi durante la settimana,
- periodo di vacanze,
- pioggia o vento (o entrambi!),
- eccetera.
Quindi, come potrebbe un modello di Machine Learning cogliere tutti questi fenomeni?
Fonte: towardsdatascience.com