Introduzione al dataset

Analisi di reti intermedia in Python

Eric Ma

Data Carpentry instructor and author of nxviz package

Dataset e caso di studio

  • Dataset dei post nel forum universitario, 6 mesi
  • Partizioni dei nodi: studenti, forum
  • Attività del capitolo:
    • Costruire un grafo da un pandas DataFrame
    • Calcolare proiezioni unipartite di un grafo bipartito
    • Visualizzazione
    • Filtri e analisi di serie temporali
  • Ripasso funzioni già usate
Analisi di reti intermedia in Python

Grafi da DataFrame

df
   customers    products
0  customerA    product1
1  customerB    product2
...
list(G = nx.Graph())

G.add_nodes_from(df['products'], bipartite='products') G.add_nodes_from(df['customers'], bipartite='customers')
list(G.nodes())
['product1', 'customerC', 'product2', 'customerB', 'customerA']
list(G.edges())
[]
Analisi di reti intermedia in Python

Grafi da DataFrame

G.add_edges_from(zip(df['customers'], df['products']))

list(G.edges())
[('product1', 'customerC'), ('product1', 'customerA'), 
    ('customerC', 'product2'), ('product2', 'customerB')]
Analisi di reti intermedia in Python

Proiezioni bipartite

cust_nodes = [n for n in G.nodes() if G.node[n]
                 ['bipartite'] == 'customers']

prod_nodes = [n for n in G.nodes() if G.node[n] ['bipartite'] == 'products']
prodG = nx.bipartite.projected_graph(G, nodes=prod_nodes) custG = nx.bipartite.projected_graph(G, nodes=cust_nodes)
list(prodG.nodes())
['product1', 'product2']
list(custG.nodes())
['customerC', 'customerB', 'customerA']
Analisi di reti intermedia in Python

Esercizio!

Analisi di reti intermedia in Python

Preparing Video For Download...