Setup Menus in Admin Panel

School.Dataninja.it

Le quattro fasi del data journalism: analizza i tuoi dati

Per analizzare i dati è necessario fare alcune verifiche per sfruttarne al meglio le caratteristiche.

Per analizzare i dati, per interrogarli al meglio, devi fare alcune verifiche preliminari per decidere quali domande puoi fare e quali no, quali risposte sono facili da estrarre e quali invece richiedono più lavoro o sono impossibili da ottenere. Migliore è stato il lavoro precedente di pulizia e strutturazione dei dati, più facile, veloce e a prova di errori sarà la fase di analisi. Guardare i dati e capirne il significato può essere infatti molto semplice a patto di usare metodi e accorgimenti che ne facilitano la comprensione e permettono di mettere in luce più rapidamente i loro significati più rilevanti.

Puoi ordinarli?

Se i tuoi dati indicano una serie di valori per una dimensione quantitativa (ad esempio il numero di occupati per provincia), ordinarli dal più grande al più piccolo (o viceversa) ti permette di capire rapidamente dove l’occupazione è più o meno diffusa. Per farlo seleziona la tabella e usa l’opzione adatta per l’ordinamento, che generalmente in un foglio di calcolo di trova in “Dati” > “Ordina”, indicando a quale colonna applicare l’ordinamento.

Puoi filtrarli?

Questa operazione può servirti se la quantità di dati che hai a disposizione comincia ad essere consistente. Cogliere tutti gli aspetti salienti di un dataset di centinaia di righe al primo sguardo può essere infatti complicato. Chiediti se è possibile filtrarli e ridurne così la quantità, perché potrebbe essere utile limitare il campo ai soli dati che ti interessano in questo momento, escludendo quelli meno rilevanti su cui magari tornerai in un secondo momento. Per farlo seleziona la tabella contenente i dati da filtrare e seleziona l’opzione adatta, che generalmente in un foglio di calcolo di trova in Dati > Filtro, indicando la colonna su cui applicare il filtro e i criteri (solo alcune categorie, oppure solo i numeri maggiori di una certa soglia).

Puoi raggrupparli?

Raggruppare o aggregare i dati è una strategia che può dare ottimi risultati per studiarli con un approccio quantitativo. Non solo permette di ridurre le dimensioni di un dataset troppo grande e particolareggiato da essere trattato efficacemente (magari trovi più utile analizzare i flussi turistici per regione, anche se hai i dati per comune). Ma permette di trasformare informazioni qualitative in quantitative, per esempio contando il numero di turisti per nazione di provenienza. Per farlo devi prima identificare due dimensioni, di cui almeno una qualitativa che indicherà in base a cosa aggregare (per esempio le regioni). Poi devi specificare l’operazione di aggregazione, per esempio la somma del numero di turisti per comune. Lo strumento disponibile in tutti i software di fogli di calcolo si chiama “Tabella Pivot”: seleziona l’intera tabella, attiva l’apposita opzione (che generalmente si trova in “Dati” > “Tabella Pivot”) e inserisci “Regione” in “Campi Righe” e l’opzione “Somma Turisti” in “Campi Valori”.

Incrociare le strategie

Quasi mai l’uso di uno solo tra questi metodi è sufficiente per ottenere informazioni soddisfacenti. Ad esempio, dopo aver raggruppato i dati per “Regione” potrebbe essere utile ordinarli dal più grande al piccolo: questo di permetterà rapidamente di capire quale sia la regione con il maggior numero di turisti. Potrebbe anche essere utile filtrarli prima di raggrupparli, in modo da poterti concentrare solo su un sottoinsieme di dati (tecnicamente, un “subset”) di tuo interesse, per esempio solo i turisti accolti in hotel.

Cinque consigli pratici

Intorno a queste tre operazioni sui dati, ordinamento, filtro, aggregazione, si costruisce gran parte della cosiddetta statistica descrittiva di un dataset che può essere già sufficiente per rispondere alle nostre domande di indagine oppure fornire utili indicazioni su dove concentrare l’attenzione nelle fasi successive. Ecco quindi cinque consigli per non perdere tempo e fare le domande giuste ai tuoi dati.

  1. Non c’è una ricetta stardard: per decidere quali metodi usare devi conoscere bene i tuoi dati.
  2. Parti dal tuo obiettivo e chiediti: perché e in quali casi può essere utile Filtrare, Ordinare, Raggruppare i dati? Cosa mi aspetto di ottenere?
  3. Alleggerisci i dati, rimuovi quelli non utili alla tua ricerca e cerca di concentrarti su insiemi di dati più piccoli, ma significativi.
  4. Fai più tentativi: se possibile è meglio analizzare i dati valutando tutti i possibili metodi qui elencati, magari sperimentando diverse normalizzazioni dei dati.
  5. Cerca gli outliers: valori anomali rispetto a tutti gli altri valori del dataset.
Letture: 307