Daten zusammenfassen

Einführung in NumPy

Izzy Weber

Core Curriculum Manager, DataCamp

Aggregationsmethoden

 

  • .sum()
  • .min()
  • .max()
  • .mean()
  • .cumsum()
Einführung in NumPy

Unsere Daten

 

security_breaches
array([[0, 5, 1],
       [0, 2, 0],
       [1, 1, 2],
       [2, 2, 1],
       [0, 0, 0]])

Eine Grafik des Arrays security_breaches mit Zeilen, die als Jahre und Spalten als Kunden beschriftet sind

Einführung in NumPy

Daten zusammenfassen

Eine Grafik des Arrays security_breaches mit Zeilen, die als Jahre und Spalten als Kunden beschriftet sind

security_breaches.sum()
17
Einführung in NumPy

Zeilen zusammenfassen

Eine Grafik, in der jede Spalte markiert ist und Summensymbole unten zeigen, dass die Werte in jeder Spalte addiert werden

security_breaches.sum(axis=0)
array([ 3, 10,  4])
Einführung in NumPy

Spalten aggregieren

Eine Grafik, in der jede Zeile markiert ist und rechts davon Summensymbole stehen, um zu zeigen, dass die Werte in jeder Zeile addiert werden

security_breaches.sum(axis=1)
array([6, 2, 4, 5, 0])
Einführung in NumPy

Das Achsenargument verstehen

Eine Grafik, die ein Array zeigt und wie es aussieht, wenn es zu einer einzigen Spalte zusammengefasst wird, die die Summe aller Elemente in jeder Zeile enthält.

Einführung in NumPy

Minimal- und Maximalwerte

Eine Grafik des Arrays security_breaches mit Zeilen, die als Jahre und Spalten als Kunden beschriftet sind

security_breaches.min()
0
security_breaches.max()
5
security_breaches.min(axis=1)
array([0, 0, 1, 1, 0])
Einführung in NumPy

Den Mittelwert ermitteln

Eine Grafik des Arrays security_breaches mit Zeilen, die als Jahre und Spalten als Kunden beschriftet sind

security_breaches.mean()
1.1333333333333333
security_breaches.mean(axis=1)
array([2., 0.6667, 1.3333, 1.6667, 0.])
Einführung in NumPy

Das Argument „keepdims“

security_breaches.sum(axis=1)
array([6, 2, 4, 5, 0])
security_breaches.sum(axis=1, keepdims=True)
array([[6],
       [2],
       [4],
       [5],
       [0]])
Einführung in NumPy

Kumulative Summen

Eine Grafik des Arrays security_breaches mit Zeilen, die als Jahre und Spalten als Kunden beschriftet sind

security_breaches.cumsum(axis=0)
array([[ 0,  5,  1],
       [ 0,  7,  1],
       [ 1,  8,  3],
       [ 3, 10,  4],
       [ 3, 10,  4]])
Einführung in NumPy

Zusammenfassende Werte grafisch darstellen

cum_sums_by_client = security_breaches.cumsum(axis=0)
plt.plot(np.arange(1, 6), cum_sums_by_client[:, 0], label="Client 1")
plt.plot(np.arange(1, 6), cum_sums_by_client.mean(axis=1), label="Average")
plt.legend()
plt.show()

Einführung in NumPy

Lass uns üben!

Einführung in NumPy

Preparing Video For Download...