Gegevens samenvatten

Introductie tot NumPy

Izzy Weber

Core Curriculum Manager, DataCamp

Aggregatiemethoden

 

  • .sum()
  • .min()
  • .max()
  • .mean()
  • .cumsum()
Introductie tot NumPy

Onze data

 

security_breaches
array([[0, 5, 1],
       [0, 2, 0],
       [1, 1, 2],
       [2, 2, 1],
       [0, 0, 0]])

Een grafiek van de security_breaches-array, met rijen als jaren en kolommen als klanten

Introductie tot NumPy

Data sommeren

Een grafiek van de security_breaches-array, met rijen als jaren en kolommen als klanten

security_breaches.sum()
17
Introductie tot NumPy

Rijen aggregeren

een grafiek met elke kolom gemarkeerd en somsymbolen onderaan om aan te geven dat de array per kolom wordt gesommeerd

security_breaches.sum(axis=0)
array([ 3, 10,  4])
Introductie tot NumPy

Kolommen aggregeren

een grafiek met elke rij gemarkeerd en somsymbolen rechts van elke rij om aan te geven dat de array per rij wordt gesommeerd

security_breaches.sum(axis=1)
array([6, 2, 4, 5, 0])
Introductie tot NumPy

De axis-parameter begrijpen

Een grafiek die een array toont en hoe die wordt samengevouwen tot één kolom met de som per rij

Introductie tot NumPy

Minimum- en maximumwaarden

Een grafiek van de security_breaches-array, met rijen als jaren en kolommen als klanten

security_breaches.min()
0
security_breaches.max()
5
security_breaches.min(axis=1)
array([0, 0, 1, 1, 0])
Introductie tot NumPy

Het gemiddelde berekenen

Een grafiek van de security_breaches-array, met rijen als jaren en kolommen als klanten

security_breaches.mean()
1.1333333333333333
security_breaches.mean(axis=1)
array([2., 0.6667, 1.3333, 1.6667, 0.])
Introductie tot NumPy

De keepdims-parameter

security_breaches.sum(axis=1)
array([6, 2, 4, 5, 0])
security_breaches.sum(axis=1, keepdims=True)
array([[6],
       [2],
       [4],
       [5],
       [0]])
Introductie tot NumPy

Cumulatieve sommen

Een grafiek van de security_breaches-array, met rijen als jaren en kolommen als klanten

security_breaches.cumsum(axis=0)
array([[ 0,  5,  1],
       [ 0,  7,  1],
       [ 1,  8,  3],
       [ 3, 10,  4],
       [ 3, 10,  4]])
Introductie tot NumPy

Samenvattingen plotten

cum_sums_by_client = security_breaches.cumsum(axis=0)
plt.plot(np.arange(1, 6), cum_sums_by_client[:, 0], label="Client 1")
plt.plot(np.arange(1, 6), cum_sums_by_client.mean(axis=1), label="Average")
plt.legend()
plt.show()

Introductie tot NumPy

Laten we oefenen!

Introductie tot NumPy

Preparing Video For Download...