Die Normalverteilung

Einführung in die Statistik in Python

Maggie Matsui

Content Developer, DataCamp

Was ist die Normalverteilung?

Dichtefunktion der Normalverteilung

Einführung in die Statistik in Python

Symmetrisch

Gestrichelte vertikale Linie in der Mitte der Normalverteilung

Einführung in die Statistik in Python

Fläche = 1

Normalverteilung mit schattierter Fläche unter der Kurve

Einführung in die Statistik in Python

Kurve trifft niemals 0

Normalverteilung mit Pfeilen, die auf die Ränder auf beiden Seiten zeigen

Einführung in die Statistik in Python

Beschrieben durch Mittelwert und Standardabweichung

 

                                                         Mittelwert: 20

                                        Standardabweichung: 3

Normalverteilung mit Mittelwert 20 und Standardabweichung 3

                         Standard-Normalverteilung

                                                         Mittelwert: 0

                                        Standardabweichung: 1

Normalverteilung mit Mittelwert 0 und Standardabweichung 1

Einführung in die Statistik in Python

Beschrieben durch Mittelwert und Standardabweichung

 

                                                         Mittelwert: 20

                                        Standardabweichung: 3

Normalverteilung mit Mittelwert 20 und Standardabweichung 3

                         Standard-Normalverteilung

                                                         Mittelwert: 0

                                        Standardabweichung: 1

Normalverteilung mit Mittelwert 0 und Standardabweichung 1

Einführung in die Statistik in Python

Flächen unterhalb der Normalverteilungskurve

68 % liegt innerhalb von 1 Standardabweichung

Normalverteilung mit hervorgehobenem Bereich zwischen -1 und 1, beschriftet mit 68 %

Einführung in die Statistik in Python

Flächen unterhalb der Normalverteilungskurve

95% liegt innerhalb von 2 Standardabweichungen

Normalverteilung mit hervorgehobenem Bereich zwischen -2 und 2, beschriftet mit 95%

Einführung in die Statistik in Python

Flächen unterhalb der Normalverteilungskurve

99,7% liegen innerhalb von 3 Standardabweichungen

Normalverteilung mit hervorgehobenem Bereich zwischen -3 und 3, beschriftet mit 99,7%

Einführung in die Statistik in Python

Viele Histogramme sehen normal aus

Normalverteilung

Standard-Normalverteilung

Körpergrößen von Frauen aus NHANES

Histogramm der Körpergröße von Frauen

Mittelwert: 161 cm        Standardabweichung: 7 cm

Einführung in die Statistik in Python

Annäherung der Daten mit der Normalverteilung

Normalkurve über dem Histogramm der Körpergröße von Frauen

Einführung in die Statistik in Python

Wie viel Prozent der Frauen sind kleiner als 154 cm?

Normalkurve, die über das Histogramm der Körpergröße von Frauen gezeichnet wurde, wobei der Bereich unter 154 schattiert ist

16 % der Frauen in der Umfrage sind kleiner als 154 cm

from scipy.stats import norm
norm.cdf(154, 161, 7)
0.158655
Einführung in die Statistik in Python

Wie viel Prozent der Frauen sind größer als 154 cm?

Normalkurve, die über das Histogramm der Körpergröße von Frauen gezeichnet wurde, wobei der Bereich rechts von 154 schattiert ist

from scipy.stats import norm
1 - norm.cdf(154, 161, 7)
0.841345
Einführung in die Statistik in Python

Wie viel Prozent der Frauen sind 154-157 cm groß?

Fläche kleiner als 157 minus Fläche kleiner als 154

norm.cdf(157, 161, 7) - norm.cdf(154, 161, 7)
Einführung in die Statistik in Python

Wie viel Prozent der Frauen sind 154-157 cm groß?

Fläche kleiner als 157 minus Fläche kleiner als 154 ist gleich Fläche zwischen 154 und 157

norm.cdf(157, 161, 7) - norm.cdf(154, 161, 7)
0.1252
Einführung in die Statistik in Python

Wie groß sind 90 % der Frauen, die kleiner sind?

Fläche weniger als 170 schattiert, beschriftet 90 %

norm.ppf(0.9, 161, 7)
169.97086
Einführung in die Statistik in Python

Wie groß sind 90 % der Frauen, die größer sind?

Fläche größer als etwa 162 schattiert, beschriftet 90 %

norm.ppf((1-0.9), 161, 7)
152.029
Einführung in die Statistik in Python

Zufällige Zahlen generieren

# Generate 10 random heights
norm.rvs(161, 7, size=10)
array([155.5758223 , 155.13133235, 160.06377097, 168.33345778,
       165.92273375, 163.32677057, 165.13280753, 146.36133538,
       149.07845021, 160.5790856 ])
Einführung in die Statistik in Python

Lass uns üben!

Einführung in die Statistik in Python

Preparing Video For Download...