Rappresentare i dati di rete con pandas

Analisi di reti intermedia in Python

Eric Ma

Data Carpentry instructor and author of nxviz package

File CSV per archiviare dati di rete

  • File CSV
person,party,weight
Barrett.Samuel,LondonEnemies,1
Barrett.Samuel,StAndrewsLodge,1
Marshall.Thomas,LondonEnemies,1
Eaton.Joseph,TeaParty,1
Bass.Henry,LondonEnemies,1
Analisi di reti intermedia in Python

File CSV per archiviare dati di rete

  • Vantaggi:
    • Leggibile dall’uomo
    • Analisi aggiuntive con pandas
  • Svantaggi:
    • Ripetitivo; spazio su disco
  • Due DataFrame: liste di nodi e archi
Analisi di reti intermedia in Python

Lista nodi e lista archi

  • Lista nodi
    • Ogni riga è un nodo
    • Le colonne sono metadati del nodo
  • Lista archi
    • Ogni riga è un arco
    • Le colonne sono i metadati dell’arco
Analisi di reti intermedia in Python

Pandas e grafi

list(G.nodes(data=True))
[(0, {'bipartite': 0}),
(1, {'bipartite': 0}),
(2, {'bipartite': 0}),
...]
nodelist = []

for n, d in G.nodes(data=True): node_data = dict() node_data['node'] = n
node_data.update(d)
nodelist.append(node_data)
Analisi di reti intermedia in Python

Pandas e grafi

nodelist
[{'bipartite': 0, 'node': 0},
{'bipartite': 0, 'node': 1},
{'bipartite': 0, 'node': 2},
{'bipartite': 0, 'node': 3},
{'bipartite': 0, 'node': 4},...]
Analisi di reti intermedia in Python

Pandas e grafi

import pandas as pd
pd.DataFrame(nodelist)
  bipartite  node
0           0     0
1           0     1
2           0     2
3           0     3
4           0     4
5           1     5
6           1     6
7           1     7
pd.DataFrame(nodelist).to_csv('my_file.csv')
Analisi di reti intermedia in Python

Passons à la pratique !

Analisi di reti intermedia in Python

Preparing Video For Download...