Setup Menus in Admin Panel

School.Dataninja.it

Le quattro fasi del data journalism: osserva i tuoi dati

Osservare un insieme di dati, piccolo o grande, permette di conoscerlo meglio e di comprendere appieno le informazioni che contiene.

I dati che hai a disposizione possono dirti tante cose del fenomeno che stai osservando. Per farli parlare devi però imparare a conoscerli da vicino, entrarci in sintonia. Le possibili strade per esplorare i dati dipendono dalla loro quantità e dalla loro qualità. Tra gli elementi da tenere presenti ci sono le dimensioni che li caratterizzano, strettamente legate al loro significato, cioè al fenomeno reale a cui si riferiscono. I tuoi dati hanno una dimensione geografica e permettono un confronto tra territori? Oppure hanno una dimensione temporale tale da permettere di valutare come un fenomeno cambia nel tempo? Solo dopo averne capito a fondo la natura è utile proseguire per analizzarli al meglio.

Dati qualitativi e categorie

Si tratta di dati che definiscono le qualità di un oggetto. Prendi i prodotti alimentari come esempio: a ognuno di essi puoi associare una tipologia di cibo, una cucina regionale di riferimento, la portata durante la quale solitamente si consumano, ecc.

Dati quantitativi e misure

Sono dati (per lo più numerici) che indicano una quantità, quindi sono frutto di un processo di misura. Nel nostro esempio il peso, la durata del cibo prima che giunga la data di scadenza, ecc. Purché si riferiscano a oggetti dello stesso tipo puoi applicare a questi dati le più comuni operazioni matematiche, per esempio la somma per ottenere un peso complessivo.

Dati geografici

I tuoi dati possono contenere informazioni anche di tipo geografico. Per esempio la provenienza di un determinato alimento. O il livello di consumo di un particolare territorio. A che livello appartiene questo territorio? Nazionale, regionale, provinciale o comunale? Quali informazioni aggiuntive puoi incrociare con i tuoi dati?

Serie storiche

Misure ripetute nel tempo possono permettere di analizzare l’andamento di un fenomeno e misurarne quindi le variazioni. Il consumo di carne per esempio è aumentato o diminuito in Italia negli ultimi decenni? Può emergere un andamento regolare o molto rumoroso o ancora con casi di variazione repentina su un trend sostanzialmente regolare. Per valutarlo al meglio è cruciale scegliere con attenzione (se possibile) il periodo temporale complessivo e la distanza temporale tra un punto e il successivo. Ha senso misurare i prezzi del cibo giorno per giorno? O è più utile analizzare le variazioni mensili o addirittura annuali?

Confronti e normalizzazioni

Quando hai tra le mani dati simili, ma riferiti a oggetti diversi, puoi studiarne il confronto, per esempio il consumo di un certo alimento per regione. Ma puoi farlo anche per misure successive in un andamento temporale. Devi però fare molta attenzione a cosa confronti: intanto mai mele con pere, devi accertarti che i dati siano omogenei come tipo e come unità di misura. E poi devi valutare quando (e come) le dimensioni possono contare: per qualsiasi alimento riscontrerai un consumo maggiore in Lombardia piuttosto che nelle altre regioni d’Italia, ma solo perché si tratta della regione più grande e popolosa. E il consumo cresce con il crescere del numero di persone che consumano… La soluzione in questo esempio è semplice: ha molto più senso confrontare il consumo pro-capite, cioè il consumo diviso la popolazione.

È importante iniziare a ragionare sulla necessità di operare normalizzazioni dei dati come questa appena descritta fin dalla prima esplorazione, perché puoi così concentrarti subito sulla ricerca dei dati con cui normalizzare, per esempio la popolazione regionale italiana.

Letture: 305