Guida per colloqui tecnici per professionisti dei dati

Credito immagine: https://unsplash.com/@clark_fransa
Credito immagine: Arnold Francisa su Unsplash

Se aspiri e attualmente fai colloqui per ruoli come data scientist, analisti di dati e ingegneri di dati, probabilmente incontrerai uno o più colloqui tecnici che richiedono codifica in tempo reale, che di solito coinvolge SQL. Anche se le interviste successive potrebbero richiedere linguaggi di programmazione diversi come Python, che è comune nel dominio dei dati, concentriamoci sulle tipiche domande SQL che ho riscontrato durante queste interviste. Ai fini di questa discussione, presumo che tu abbia già familiarità con i concetti SQL fondamentali come SELECT, FROM, WHEREcosì come funzioni aggregate come SUM E COUNT. Entriamo nello specifico!

1. Padroneggiare i join e i tipi di tabella

Senza dubbio, la domanda SQL più comune riguarda i join di tabella. Potrebbe sembrare ovvio, ma ogni intervista a cui ho partecipato è incentrata su questo argomento. Dovresti sentirti a tuo agio con gli inner join e i left join. Inoltre, è preziosa la competenza nella gestione dei self-join e delle unioni. Altrettanto importante è la capacità di eseguire questi join in particolare su diversi tipi di tabelle fatto E dimensione tavoli. Ecco le mie definizioni vaghe per questi due termini:

Tabella dei fatti: Una tabella contenente numerose righe ma relativamente pochi attributi o colonne. Immagina un esempio in cui un rivenditore online mantiene un “ordini“tabella con colonne come: date, customer_id, order_id, product_id, units, amount. Questa tabella ha pochi attributi ma contiene un volume enorme di record.

Tabella delle dimensioni: Una tabella dimensionale con meno righe ma molti attributi. Ad esempio, lo stesso rivenditore online “cliente“La tabella potrebbe contenere una riga per cliente, con attributi come customer_id, first_name, last_name, ship_street_addr, ship_zip_code e altro ancora.

Comprendere questi due tipi di tabelle principali è importante. È fondamentale comprendere perché e come unire le tabelle dei fatti e delle dimensioni per garantire risultati accurati. Consideriamo un esempio reale: la domanda dell’intervista presenta due tabelle (“ordini” E “cliente”) e chiede:

Quanti clienti hanno acquistato almeno 3 unità nel corso della loro vita e hanno un codice postale di spedizione pari a 90210?

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *