Resumindo dados

Introdução ao NumPy

Izzy Weber

Core Curriculum Manager, DataCamp

Métodos de agregação

 

  • .sum()
  • .min()
  • .max()
  • .mean()
  • .cumsum()
Introdução ao NumPy

Nossos dados

 

security_breaches
array([[0, 5, 1],
       [0, 2, 0],
       [1, 1, 2],
       [2, 2, 1],
       [0, 0, 0]])

Um gráfico do array security_breaches, com linhas como anos e colunas como clientes

Introdução ao NumPy

Somando dados

Um gráfico do array security_breaches, com linhas como anos e colunas como clientes

security_breaches.sum()
17
Introdução ao NumPy

Agregando linhas

um gráfico com cada coluna destacada e símbolos de soma na parte de baixo indicando soma por coluna

security_breaches.sum(axis=0)
array([ 3, 10,  4])
Introdução ao NumPy

Agregando colunas

um gráfico com cada linha destacada e símbolos de soma à direita de cada linha indicando soma por linha

security_breaches.sum(axis=1)
array([6, 2, 4, 5, 0])
Introdução ao NumPy

Entendendo o argumento axis

Um gráfico mostrando um array e como ele fica ao ser reduzido a uma única coluna com a soma dos elementos de cada linha

Introdução ao NumPy

Valores mínimo e máximo

Um gráfico do array security_breaches, com linhas como anos e colunas como clientes

security_breaches.min()
0
security_breaches.max()
5
security_breaches.min(axis=1)
array([0, 0, 1, 1, 0])
Introdução ao NumPy

Calculando a média

Um gráfico do array security_breaches, com linhas como anos e colunas como clientes

security_breaches.mean()
1.1333333333333333
security_breaches.mean(axis=1)
array([2., 0.6667, 1.3333, 1.6667, 0.])
Introdução ao NumPy

O argumento keepdims

security_breaches.sum(axis=1)
array([6, 2, 4, 5, 0])
security_breaches.sum(axis=1, keepdims=True)
array([[6],
       [2],
       [4],
       [5],
       [0]])
Introdução ao NumPy

Somas cumulativas

Um gráfico do array security_breaches, com linhas como anos e colunas como clientes

security_breaches.cumsum(axis=0)
array([[ 0,  5,  1],
       [ 0,  7,  1],
       [ 1,  8,  3],
       [ 3, 10,  4],
       [ 3, 10,  4]])
Introdução ao NumPy

Gráficos de valores resumidos

cum_sums_by_client = security_breaches.cumsum(axis=0)
plt.plot(np.arange(1, 6), cum_sums_by_client[:, 0], label="Client 1")
plt.plot(np.arange(1, 6), cum_sums_by_client.mean(axis=1), label="Average")
plt.legend()
plt.show()

Introdução ao NumPy

Vamos praticar!

Introdução ao NumPy

Preparing Video For Download...