Resumir datos

Introducción a NumPy

Izzy Weber

Core Curriculum Manager, DataCamp

Métodos de agregación

 

  • .sum()
  • .min()
  • .max()
  • .mean()
  • .cumsum()
Introducción a NumPy

Nuestros datos

 

security_breaches
array([[0, 5, 1],
       [0, 2, 0],
       [1, 1, 2],
       [2, 2, 1],
       [0, 0, 0]])

Un gráfico del array security_breaches, con filas como años y columnas como clientes

Introducción a NumPy

Sumar datos

Un gráfico del array security_breaches, con filas como años y columnas como clientes

security_breaches.sum()
17
Introducción a NumPy

Agregar filas

un gráfico con cada columna resaltada y símbolos de suma en la parte inferior para indicar que la matriz se suma por columnas

security_breaches.sum(axis=0)
array([ 3, 10,  4])
Introducción a NumPy

Agregar columnas

un gráfico con cada fila resaltada y símbolos de suma a la derecha de cada fila para indicar que la matriz se suma por filas

security_breaches.sum(axis=1)
array([6, 2, 4, 5, 0])
Introducción a NumPy

Cómo entender el argumento axis

Un gráfico que muestra una matriz y cómo se colapsa a una sola columna, con la suma de todos los elementos de cada fila

Introducción a NumPy

Valores mínimo y máximo

Un gráfico del array security_breaches, con filas como años y columnas como clientes

security_breaches.min()
0
security_breaches.max()
5
security_breaches.min(axis=1)
array([0, 0, 1, 1, 0])
Introducción a NumPy

Calcular la media

Un gráfico del array security_breaches, con filas como años y columnas como clientes

security_breaches.mean()
1.1333333333333333
security_breaches.mean(axis=1)
array([2., 0.6667, 1.3333, 1.6667, 0.])
Introducción a NumPy

El argumento keepdims

security_breaches.sum(axis=1)
array([6, 2, 4, 5, 0])
security_breaches.sum(axis=1, keepdims=True)
array([[6],
       [2],
       [4],
       [5],
       [0]])
Introducción a NumPy

Sumas acumuladas

Un gráfico del array security_breaches, con filas como años y columnas como clientes

security_breaches.cumsum(axis=0)
array([[ 0,  5,  1],
       [ 0,  7,  1],
       [ 1,  8,  3],
       [ 3, 10,  4],
       [ 3, 10,  4]])
Introducción a NumPy

Graficar valores resumen

cum_sums_by_client = security_breaches.cumsum(axis=0)
plt.plot(np.arange(1, 6), cum_sums_by_client[:, 0], label="Client 1")
plt.plot(np.arange(1, 6), cum_sums_by_client.mean(axis=1), label="Average")
plt.legend()
plt.show()

Introducción a NumPy

¡Vamos a practicar!

Introducción a NumPy

Preparing Video For Download...