De normale verdeling

Inleiding tot statistiek in R

Maggie Matsui

Content Developer, DataCamp

Wat is de normale verdeling?

Dichtheidsfunctie van de normale verdeling

Inleiding tot statistiek in R

Symmetrisch

Gestreepte verticale lijn in het midden van de normale verdeling

Inleiding tot statistiek in R

Oppervlakte = 1

Normale verdeling met gebied onder de curve gearceerd

Inleiding tot statistiek in R

Curve raakt 0 nooit

Normale verdeling met pijlen naar de staarten aan beide zijden

Inleiding tot statistiek in R

Bepaald door gemiddelde en standaardafwijking

 

                                                          Gemiddelde: 20

                                      Standaardafwijking: 3

Normale verdeling met gemiddelde 20 en sd 3

                         Standaardnormale verdeling

                                                           Gemiddelde: 0

                                      Standaardafwijking: 1

Normale verdeling met gemiddelde 0 en sd 1

Inleiding tot statistiek in R

Bepaald door gemiddelde en standaardafwijking

 

                                                          Gemiddelde: 20

                                      Standaardafwijking: 3

Normale verdeling met gemiddelde 20 en sd 3

                         Standaardnormale verdeling

                                                           Gemiddelde: 0

                                      Standaardafwijking: 1

Normale verdeling met gemiddelde 0 en sd 1

Inleiding tot statistiek in R

Oppervlakken onder de normale verdeling

68% valt binnen 1 standaardafwijking

Normale verdeling met gebied tussen -1 en 1 gemarkeerd, gelabeld met 68%

Inleiding tot statistiek in R

Oppervlakken onder de normale verdeling

95% valt binnen 2 standaardafwijkingen

Normale verdeling met gebied tussen -2 en 2 gemarkeerd, gelabeld met 95%

Inleiding tot statistiek in R

Oppervlakken onder de normale verdeling

99,7% valt binnen 3 standaardafwijkingen

Normale verdeling met gebied tussen -3 en 3 gemarkeerd, gelabeld met 99.7%

Inleiding tot statistiek in R

Veel histogrammen lijken normaal

Normale verdeling

Standaardnormale verdeling

Lengtes van vrouwen uit NHANES

Histogram van lengtes van vrouwen

  Gemiddelde: 161 cm      Standaardafwijking: 7 cm

Inleiding tot statistiek in R

Data benaderen met de normale verdeling

Normale curve over het histogram van lengtes van vrouwen

Inleiding tot statistiek in R

Welk percentage vrouwen is korter dan 154 cm?

Normale curve over het histogram van lengtes van vrouwen met gebied kleiner dan 154 gearceerd

16% van de vrouwen in de steekproef is korter dan 154 cm

pnorm(154, mean = 161, sd = 7)
0.159
Inleiding tot statistiek in R

Welk percentage vrouwen is langer dan 154 cm?

Normale curve over het histogram van lengtes van vrouwen met gebied rechts van 154 gearceerd

pnorm(154, mean = 161, sd = 7, 
      lower.tail = FALSE)
0.8413447
Inleiding tot statistiek in R

Welk percentage vrouwen is 154–157 cm?

Gebied kleiner dan 157 minus gebied kleiner dan 154

pnorm(157, mean = 161, sd = 7) - pnorm(154, mean = 161, sd = 7)
Inleiding tot statistiek in R

Welk percentage vrouwen is 154–157 cm?

Gebied kleiner dan 157 min gebied kleiner dan 154 is gelijk aan gebied tussen 154 en 157

pnorm(157, mean = 161, sd = 7) - pnorm(154, mean = 161, sd = 7)
0.1252
Inleiding tot statistiek in R

Welke lengte is 90% van de vrouwen korter dan?

Gebied kleiner dan 170 gearceerd, gelabeld 90%

qnorm(0.9, mean = 161, sd = 7)
169.9709
Inleiding tot statistiek in R

Welke lengte is 90% van de vrouwen langer dan?

Gebied groter dan ongeveer 162 gearceerd, gelabeld 90%

qnorm(0.9,
      mean = 161,
      sd = 7,
      lower.tail = FALSE)
152.03
Inleiding tot statistiek in R

Willekeurige getallen genereren

# Genereer 10 willekeurige lengtes
rnorm(10, mean = 161, sd = 7)
159.35 157.34 149.85 156.75 163.53 156.33 157.22 171.44 158.10 170.12
Inleiding tot statistiek in R

Laten we oefenen!

Inleiding tot statistiek in R

Preparing Video For Download...