Meringkas data

Pengantar NumPy

Izzy Weber

Core Curriculum Manager, DataCamp

Metode agregasi

 

  • .sum()
  • .min()
  • .max()
  • .mean()
  • .cumsum()
Pengantar NumPy

Data kita

 

security_breaches
array([[0, 5, 1],
       [0, 2, 0],
       [1, 1, 2],
       [2, 2, 1],
       [0, 0, 0]])

Grafik array security_breaches, dengan baris berlabel tahun dan kolom berlabel klien

Pengantar NumPy

Menjumlahkan data

Grafik array security_breaches, dengan baris berlabel tahun dan kolom berlabel klien

security_breaches.sum()
17
Pengantar NumPy

Mengagregasi baris

grafik dengan tiap kolom disorot dan simbol jumlah di bawah untuk menunjukkan penjumlahan per kolom

security_breaches.sum(axis=0)
array([ 3, 10,  4])
Pengantar NumPy

Mengagregasi kolom

grafik dengan tiap baris disorot dan simbol jumlah di kanan tiap baris untuk menunjukkan penjumlahan per baris

security_breaches.sum(axis=1)
array([6, 2, 4, 5, 0])
Pengantar NumPy

Memahami argumen axis

Grafik yang menunjukkan sebuah array dan tampilannya saat dilipat menjadi satu kolom, berisi jumlah semua elemen tiap baris

Pengantar NumPy

Nilai minimum dan maksimum

Grafik array security_breaches, dengan baris berlabel tahun dan kolom berlabel klien

security_breaches.min()
0
security_breaches.max()
5
security_breaches.min(axis=1)
array([0, 0, 1, 1, 0])
Pengantar NumPy

Mencari mean

Grafik array security_breaches, dengan baris berlabel tahun dan kolom berlabel klien

security_breaches.mean()
1.1333333333333333
security_breaches.mean(axis=1)
array([2., 0.6667, 1.3333, 1.6667, 0.])
Pengantar NumPy

Argumen keepdims

security_breaches.sum(axis=1)
array([6, 2, 4, 5, 0])
security_breaches.sum(axis=1, keepdims=True)
array([[6],
       [2],
       [4],
       [5],
       [0]])
Pengantar NumPy

Jumlah kumulatif

Grafik array security_breaches, dengan baris berlabel tahun dan kolom berlabel klien

security_breaches.cumsum(axis=0)
array([[ 0,  5,  1],
       [ 0,  7,  1],
       [ 1,  8,  3],
       [ 3, 10,  4],
       [ 3, 10,  4]])
Pengantar NumPy

Memplot nilai ringkasan

cum_sums_by_client = security_breaches.cumsum(axis=0)
plt.plot(np.arange(1, 6), cum_sums_by_client[:, 0], label="Client 1")
plt.plot(np.arange(1, 6), cum_sums_by_client.mean(axis=1), label="Average")
plt.legend()
plt.show()

Pengantar NumPy

Ayo berlatih!

Pengantar NumPy

Preparing Video For Download...