Mappare le connessioni dei vincitori dell’Oscar |  di Milan Janosov |  Febbraio 2024

 | Intelligenza-Artificiale

In questo breve articolo utilizzo i dati pubblici di Wikipedia, la programmazione Python e l’analisi di rete per estrarre e creare una rete di attori e attrici vincitori di Oscar.

Tutte le immagini sono state create dall’autore.

Wikipedia, in quanto la più grande enciclopedia online gratuita e in crowdsourcing, funge da fonte di dati estremamente ricca su vari domini pubblici. Molti di questi ambiti, dal cinema alla politica, coinvolgono vari strati di reti sottostanti, che esprimono diversi tipi di fenomeni sociali come la collaborazione. In vista dell’avvicinarsi della cerimonia degli Academy Awards, qui mostro l’esempio di attori e attrici vincitori di Oscar su come possiamo utilizzare semplici metodi Pythonici per trasformare i siti Wiki in reti.

Per prima cosa, diamo un’occhiata a come, ad esempio, il Elenco wiki di tutti gli attori vincitori di Oscar è strutturato:

Elenco wiki di tutti gli attori vincitori di Oscar

Questa sottopagina mostra bene tutte le persone che hanno ricevuto un Oscar e a cui è stato concesso un profilo Wiki (molto probabilmente, nessun attore e attrice è mancato ai fan). In questo articolo mi concentro sulla recitazione, che può essere trovata nelle quattro sottopagine seguenti, inclusi attori e attrici principali e secondari:

urls = { 'actor'         :'https://en.wikipedia.org/wiki/Category:Best_Actor_Academy_Award_winners',
'actress' : 'https://en.wikipedia.org/wiki/Category:Best_Actress_Academy_Award_winners',
'supporting_actor' : 'https://en.wikipedia.org/wiki/Category:Best_Supporting_Actor_Academy_Award_winners',
'supporting_actress' : 'https://en.wikipedia.org/wiki/Category:Best_Supporting_Actress_Academy_Award_winners'}

Ora scriviamo un semplice blocco di codice che controlli ciascuno di questi quattro elenchi e utilizziamo i pacchetti urlando E bellazuppaestrae il nome di tutti gli artisti:

from urllib.request import urlopen
import bs4 as bs
import re

# Iterate across the four categories
people_data = ()

for category, url in urls.items():

# Query the name listing page and…

Fonte: towardsdatascience.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *