Résumer les données

Introduction à NumPy

Izzy Weber

Core Curriculum Manager, DataCamp

Méthodes d’agrégation

 

  • .sum()
  • .min()
  • .max()
  • .mean()
  • .cumsum()
Introduction à NumPy

Nos données

 

security_breaches
array([[0, 5, 1],
       [0, 2, 0],
       [1, 1, 2],
       [2, 2, 1],
       [0, 0, 0]])

Un graphique du tableau security_breaches, avec les lignes = années et les colonnes = clients

Introduction à NumPy

Additionner les données

Un graphique du tableau security_breaches, avec les lignes = années et les colonnes = clients

security_breaches.sum()
17
Introduction à NumPy

Agrégation par lignes

un graphique où chaque colonne est surlignée et des symboles de somme en bas indiquent une somme par colonne

security_breaches.sum(axis=0)
array([ 3, 10,  4])
Introduction à NumPy

Agrégation par colonnes

un graphique où chaque ligne est surlignée et des symboles de somme à droite indiquent une somme par ligne

security_breaches.sum(axis=1)
array([6, 2, 4, 5, 0])
Introduction à NumPy

Comprendre l’argument axis

Un graphique montrant un tableau réduit en une seule colonne contenant la somme de chaque ligne

Introduction à NumPy

Valeurs minimale et maximale

Un graphique du tableau security_breaches, avec les lignes = années et les colonnes = clients

security_breaches.min()
0
security_breaches.max()
5
security_breaches.min(axis=1)
array([0, 0, 1, 1, 0])
Introduction à NumPy

Calculer la moyenne

Un graphique du tableau security_breaches, avec les lignes = années et les colonnes = clients

security_breaches.mean()
1.1333333333333333
security_breaches.mean(axis=1)
array([2., 0.6667, 1.3333, 1.6667, 0.])
Introduction à NumPy

L’argument keepdims

security_breaches.sum(axis=1)
array([6, 2, 4, 5, 0])
security_breaches.sum(axis=1, keepdims=True)
array([[6],
       [2],
       [4],
       [5],
       [0]])
Introduction à NumPy

Sommes cumulées

Un graphique du tableau security_breaches, avec les lignes = années et les colonnes = clients

security_breaches.cumsum(axis=0)
array([[ 0,  5,  1],
       [ 0,  7,  1],
       [ 1,  8,  3],
       [ 3, 10,  4],
       [ 3, 10,  4]])
Introduction à NumPy

Tracer des valeurs de synthèse

cum_sums_by_client = security_breaches.cumsum(axis=0)
plt.plot(np.arange(1, 6), cum_sums_by_client[:, 0], label="Client 1")
plt.plot(np.arange(1, 6), cum_sums_by_client.mean(axis=1), label="Average")
plt.legend()
plt.show()

Introduction à NumPy

Passons à la pratique !

Introduction à NumPy

Preparing Video For Download...