NumPy: Grundlegende Statistik

Einführung in Python

Hugo Bowne-Anderson

Data Scientist at DataCamp

Datenanalyse

  • Lerne deine Daten kennen

  • Wenig Daten –> durch einfaches Betrachten

  • Viele Daten / Big Data: -> ?

Einführung in Python

Stadtweite Umfrage

import numpy as np
np_city = ... # Implementation left out
np_city
array([[1.64, 71.78],
       [1.37, 63.35],
       [1.6 , 55.09],
       ...,
       [2.04, 74.85],
       [2.04, 68.72],
       [2.01, 73.57]])
Einführung in Python

NumPy

np.mean(np_city[:, 0])
1.7472
np.median(np_city[:, 0])
1.75
Einführung in Python

NumPy

np.corrcoef(np_city[:, 0], np_city[:, 1])
array([[ 1.     , -0.01802],
       [-0.01803,  1.     ]])
np.std(np_city[:, 0])
0.1992
  • sum(), sort(), ...

  • Erzwingt einen einzigen Datentyp: Läuft schneller!

Einführung in Python

Daten generieren

  • Argumente für np.random.normal()
    • Verteilungsmittelwert
    • Verteilungsstandardabweichung
    • Anzahl der Proben
height = np.round(np.random.normal(1.75, 0.20, 5000), 2)

weight = np.round(np.random.normal(60.32, 15, 5000), 2)


np_city = np.column_stack((height, weight))
Einführung in Python

Lass uns üben!

Einführung in Python

Preparing Video For Download...