Pseudowillekeurige getallen genereren

Steekproeven in R

Richie Cotton

Data Evangelist at DataCamp

Wat betekent random?

{adjective} gemaakt, gedaan, voorkomend of gekozen zonder methode of bewuste beslissing.

  • Oxford Languages
Steekproeven in R

Echte willekeurige getallen

  • Gegenereerd uit fysieke processen, zoals muntjes gooien.
  • Hotbits gebruikt radioactief verval.
  • RANDOM.ORG gebruikt atmosferische ruis.
    • In R beschikbaar via het random-pakket.
  • Echte willekeur is duur.
1 https://www.fourmilab.ch/hotbits 2 https://www.random.org
Steekproeven in R

Pseudowillekeurige getallen genereren

  • Volgend “willekeurig” getal berekend uit vorig “willekeurig” getal.
  • Het eerste “willekeurige” getal komt uit een zaad.
  • Met dezelfde zaadwaarde zijn alle volgende getallen identiek.
seed <- 1
calc_next_random(seed)
3
calc_next_random(3)
2
calc_next_random(2)
6
Steekproeven in R

Functies voor willekeurige getallen

function distribution function distribution function distribution
rbeta Beta rgeom Geometrisch rsignrank Wilcoxon signed rank
rbinom Binomiaal rhyper Hypergeometrisch rt t
rcauchy Cauchy rlnorm Lognormaal runif Uniform
rchisq Chi-kwadraat rlogis Logistisch rweibull Weibull
rexp Exponentieel rnbinom Negatieve binomiaal rwilcox Wilcoxon rank sum
rf F rnorm Normaal
rgamma Gamma rpois Poisson
Steekproeven in R

Willekeurige getallen visualiseren

rbeta(5000, shape1 = 2, shape2 = 2)
[1] 0.2788 0.7495 0.6485 0.6665 0.6546 0.1575
...

[4996] 0.84719 0.35177 0.92796 0.67603 0.53960
randoms <- data.frame(
  beta = rbeta(5000, shape1 = 2, shape2 = 2)
)
ggplot(randoms, aes(beta)) +
  geom_histogram(binwidth = 0.1)

hist-beta.png

Steekproeven in R

Zaden voor willekeurige getallen

set.seed(20000229)
rnorm(5)
-1.6538 -0.4028 -0.1654 -0.0734  0.5171
rnorm(5)
1.908  0.379 -1.499  1.625  0.693
set.seed(20000229)
rnorm(5)
-1.6538 -0.4028 -0.1654 -0.0734  0.5171
rnorm(5)
1.908  0.379 -1.499  1.625  0.693
Steekproeven in R

Een ander zaad gebruiken

set.seed(20000229)
rnorm(5)
-1.6538 -0.4028 -0.1654 -0.0734  0.5171
rnorm(5)
1.908  0.379 -1.499  1.625  0.693
set.seed(20041004)
rnorm(5)
-0.6547 -0.7854 -0.0152  0.1514  0.5285
rnorm(5)
0.748  0.974  0.174 -0.781 -0.930
Steekproeven in R

Laten we oefenen!

Steekproeven in R

Preparing Video For Download...