Setup Menus in Admin Panel

School.Dataninja.it

Social data storytelling: analizzare le comunità di persone su Twitter

Per analizzare le comunità di persone che su Twitter si formano con una conversazione attorno a un hashtag, devi organizzare i dati raccolti dentro un foglio di calcolo, per esempio su Google Spreadsheet.

Per costruire la rete, ti servono due tabelle: quella che definisce i nodi e quella che definisce le connessioni (edges o archi). Un rete si può rappresentare con almeno due tabelle.

Identificare i nodi della rete e costruire una tabella

Nella tabella rappresenta che i nodi ogni riga rappresenta un nodo e ogni nodo è rappresentato da una riga.

In questo caso i nodi sono: i tweet, gli utenti (gli autori dei tweet e chi viene menzionato), gli hashtag.

Le colonne: una è l’id univoco che identifica il nodo, le altre definiscono attributi che si definisco al nodo. Se parliamo di utenti, avremo l’id univoco (@nomeutente) e ad esempio il type, cioè a esempio, utente, persona.

Creo una tabella dei nodi partendo da quella in cui ho scaricato tutti i tweet. Comincio dagli ID unici dei tweet, copio i valori della colonna B e li incollo in un nuovo foglio. Nella colonna a fianco attribuisco il “type”, in questo caso “tweet”.

nodi tweet

UTENTI. Prendo gli utenti dalla colonna autori  (C) e li incollo in un nuovo foglio di Google. Poi prendo le menzioni e le incollo di fianco. Nella colonna delle menzioni ci sono nomi che si affiancano, noi vogliamo un valore per cella.

Uso la formula SPLIT(” “,) per separarli.

split

A questo punto copio le colonne delle menzioni create e incollo solo i valori sotto quella degli autori.  Nella prima colonna del foglio avremo molte celle vuote, applico un filtro per nasconderle spuntando la casella (Vuoti).

filtro

Ci saranno anche nomi utenti che si ripetono più volte. Posso creare una tabella pivot (Menù > Dati > Tabella Pivot) per raggrupparli e al tempo stesso attribuire il valore del “peso” per capire chi sono gli utenti più presenti in questa rete.

pivot people

pivot utenti

Copio la colonna e la incollo sotto quella dei tweet nel foglio dei nodi, attribuendo il valore “utente”.
Posso fare lo stesso con gli hashtag, preparando il terreno per analizzare le comunità attorno ai temi. Copio la colonna nel foglio dei tweet, poi la incollo in un nuovo foglio e separo i valori con split.

hashtag #nigeriadecides

Incollo le colonne così formate sotto la prima, metto il filtro per nascondere gli spazi vuoti, creo una tabella pivot e incollo i risultati dentro il foglio dei nodi, sotto i tweet, attribuendo il type come hashtag.

La mia tabella dei nodi è pronta. Adesso devo costruire una tabella per le connessioni.

Identificare le connessioni e costruire una tabella

Il legame tra gli utenti e tra gli hashtag sono i tweet: le persone sono collegate al tweet quando ne sono autori o quando sono menzionate in un tweet; un hashtag è collegato a un tweet se è contenuto nel testo di quel tweet. Il nodo tweet diventa la connessione tra gli altri tipi di nodi.

In una colonna mettiamo il nodo dell’id del tweet, nell’altra gli utenti (che separo seguendo il procedimento dei nodi, con formula SPLIT). Per assegnare ogni utente al nodo uso la formula IF: se la cella è vuota allora metti il valore superiore, altrimenti il contenuto della stessa cella.

connessioni id people

Ottengo un elenco di id di ogni tweet che diventano la mia “fonte”, mentre le menzioni sono il target:

source target nigeriadecides

Ora procedi allo stesso modo con gli hashtag e hai le tabelle da mettere dentro Gephi.

Letture: 330