Una nuvola di parole animata mostra frequenze assolute di n grammi (sequenze contigue di elementi di testo campione) nel tempo come sequenza di immagini in un file video. Esso dà maggiore importanza alle parole che compaiono più frequentemente nel testo di partenza. Quanto più grande e audace viene visualizzato l’n-grammo, tanto più frequentemente apparirà nel testo. Si basa sulla logica intuitiva delle classiche nuvole di parole e aggiunge una prospettiva temporale alla visualizzazione.
Poiché oggigiorno molti set di dati testuali vengono raccolti come osservazioni di testo su più periodi, è particolarmente difficile visualizzare i cambiamenti nei dati nel tempo. Invece di creare tabelle o grafici riassuntivi per tanti periodi diversi, prepariamo un video MP4 che racconti la storia, attiri il pubblico e dia un effetto “wow” alla presentazione.
Questo articolo descriverà la generazione di nuvole di parole animate da dati di testo in Python. Ecco alcune caratteristiche uniche di Libreria WordCloud animata:
- Fornisce la visualizzazione della frequenza n-grammi di tutte le lingue dell’alfabeto latino
- Pulisce il set di dati di testo dalla punteggiatura, dai numeri e dalle stopword inclusi nel file Elenchi NLTK di parole non significative
- Genera frequenze n-grammi annuali o mensili.
Fonte: towardsdatascience.com