Ti senti ispirato a scrivere il tuo primo post su TDS? Siamo sempre aperti ai contributi di nuovi autori.
Con maggio che volge al termine e l'estate alle porte per quelli di noi che vivono nell'emisfero settentrionale, è tempo ancora una volta di guardare indietro agli articoli straordinari che abbiamo pubblicato nell'ultimo mese: quelle storie che hanno avuto maggiore risonanza tra gli studenti e professionisti di un'ampia gamma di discipline di data science e machine learning.
Siamo stati lieti di vedere una serie di post particolarmente eclettica colpire il cuore dei nostri lettori. È una testimonianza dei diversi interessi ed esperienze che gli autori di TDS portano sul tavolo, nonché della crescente domanda di professionisti dei dati a tutto tondo in grado di scrivere codice pulito, rimanere aggiornati con gli ultimi LLM e, allo stesso tempo, ci sono: sanno come raccontare una bella storia sui (e attraverso) i loro progetti. Immergiamoci subito.
Punti salienti mensili
- Python One Billion Row Challenge: da 10 minuti a 4 secondi
Con una reputazione di lunga data per la lentezza, penseresti che Python non avrebbe alcuna possibilità di fare bene nella popolare sfida “un miliardo di righe”. Dario RadečićIl post virale di mira a dimostrare che con una certa flessibilità e un pensiero fuori dagli schemi, puoi comunque ottenere notevoli risparmi di tempo dal tuo codice. - N-BEATS: il primo modello interpretabile di deep learning che ha funzionato per la previsione delle serie temporali
Chiunque ami uno sguardo approfondito al funzionamento interno di un modello dovrebbe aggiungerlo ai segnalibri Jonte Danckerdi N-BEATS, il “primo approccio di puro deep learning che ha sovraperformato gli approcci statistici consolidati” per attività di previsione di serie temporali. - Crea un sito Web con portfolio di data science con ChatGPT: tutorial completo
In un mercato del lavoro competitivo, i data scientist non possono permettersi di essere timidi riguardo ai propri risultati e alle proprie competenze. Un sito Web di portfolio può essere un modo efficace per mostrare entrambi e Natasha SelvarajLa guida per i pazienti di dimostra come crearne uno da zero con l'aiuto di strumenti di intelligenza artificiale generativa.
- Una guida completa a BERT con codice
Perché non fare un passo indietro rispetto all'ultimo brillante modello per conoscere quei precursori che hanno reso possibili le innovazioni di oggi? Bradney Smith ci invita a tornare indietro nel tempo fino al 2018 (o diversi decenni fa, ai tempi dell'intelligenza artificiale) per acquisire una profonda comprensione dell'innovativo modello BERT (Bidirection Encoder Representations from Transformers). - Perché i LLM non sono adatti alla programmazione – Parte II
Ai giorni nostri, continuiamo a sentire parlare dell'imminente obsolescenza dei programmatori mentre gli LLM continuano a migliorare. Andrea ValenzuelaL'ultimo articolo di serve come utile “non così in fretta!” interiezione, poiché si concentra sui loro limiti intrinseci quando si tratta di rimanere aggiornati con le ultime librerie e funzionalità del codice. - PCA e medie K per i dati sul traffico in Python
Quale modo migliore per completare la nostra selezione mensile se non con un tutorial pratico su un flusso di lavoro fondamentale della scienza dei dati? Nel suo post di debutto su TDS, Beth Ou Yang ci illustra un esempio reale, in questo caso i dati sul traffico di Taiwan, dell'utilizzo dell'analisi delle componenti principali (PCA) e del clustering K-means.
KAN sotto i riflettori
Se dovessimo nominare l’argomento che ha suscitato maggiore scalpore nelle ultime settimane, KAN (Kolmogorov-Arnold Networks) sarebbe una scelta facile. Ecco tre eccellenti risorse per aiutarti a familiarizzare con questo nuovo tipo di rete neurale, presentato in un articolo a larga diffusione.
- Reti di Kolmogorov-Arnold: gli ultimi progressi nelle reti neurali, spiegati in modo semplice
Per un'introduzione chiara e accessibile sui KAN, non c'è niente di meglio di Teo Lupoè un post facile da seguire. - Reti Kolmogorov-Arnold (KAN) per la previsione delle serie temporali
Guardando i KAN dalla prospettiva di un caso d’uso più specializzato, Marco Peixeiro mostra come possono essere applicati nel contesto della previsione delle serie temporali. - Comprensione delle reti Kolmogorov-Arnold (KAN)
Infine, per una guida cartacea più completa (ma comunque di facile lettura), non cercare oltre Hesam Sheikhl'articolo di debutto di TDS.
La nostra ultima coorte di nuovi autori
Ogni mese siamo entusiasti di vedere un nuovo gruppo di autori unirsi a TDS, ognuno dei quali condivide la propria voce, conoscenza ed esperienza uniche con la nostra comunità. Se stai cercando nuovi scrittori da esplorare e seguire, sfoglia il lavoro delle nostre ultime aggiunte, incluso Eyal Aharoni E Eddy Nahmias, Hesam Sheikh, Michał Marcińczuk, Ph.D., Alessandro Barriga, Sasha Korovkina, Adam Beaudet, Gurman Dhaliwal, Ankur Manikandan, Konstantin Vasilev, Nathan Reitinger, Mandy Liu, Beth Ou Yang, Maicol Nicolini, Alex Shpurov, Geremie Yeo, W Brett Kennedy, Romolo Pauliv, Ananya Bajaj, Yu-Jen Lin, sumit makashi, Subarna Tripathi, Yu-Cheng Tsai, Nika, Bradney Smith, Katia Gil Guzman, Miguel Dias, dottore di ricerca, Bao Bui, Battista Lefort, Sheref Nasereldin, Ph.D., Marco Sena, atisha rajpurohit, Jonathan Bennion, Dunya Danushka, Bernd Wessely, Lipitz bruno, Carne unica, Varun Joshi E Gauri KamatE Yu Dong.
Grazie per sostenere il lavoro dei nostri autori! Amiamo pubblicare articoli di nuovi autori, quindi se di recente hai scritto un'interessante procedura dettagliata di un progetto, un tutorial o una riflessione teorica su uno qualsiasi dei nostri argomenti principali, non esitare a farlo condividilo con noi.
Fino alla prossima variabile,
Squadra TDS
Portfolio di data science, accelerazione di Python, KAN e altre letture imperdibili è stato originariamente pubblicato in Verso la scienza dei dati su Medium, dove le persone continuano la conversazione evidenziando e rispondendo a questa storia.
Fonte: towardsdatascience.com