Hoofcomponentenanalyse

Lineaire algebra voor data science in R

Eric Eager

Data Scientist at Pro Football Focus

Big data

head(select(combine, height:shuttle))
  height weight forty vertical bench broad_jump three_cone shuttle
1     71    192  4.38     35.0    14        127       6.71    3.98
2     73    298  5.34     26.5    27         99       7.81    4.71
3     77    256  4.67     31.0    17        113       7.34    4.38
4     74    198  4.34     41.0    16        131       6.56    4.03
5     76    257  4.87     30.0    20        118       7.12    4.23
6     78    262  4.60     38.5    18        128       7.53    4.48
nrow(combine)
2885
Lineaire algebra voor data science in R

Big data - redundantie

Lineaire algebra voor data science in R

Hoofcomponentenanalyse

  • Een van de nuttigste methoden uit toegepaste lineaire algebra
  • Niet-parametrische manier om betekenis te halen uit complexe datasets
  • Vindt verborgen, laag-dimensionale structuren in je data
  • Deze structuren zijn makkelijker te visualiseren en vaak te duiden door domeinexperts
Lineaire algebra voor data science in R

Hoofcomponentenanalyse - motiverend voorbeeld

Lineaire algebra voor data science in R

Laten we oefenen!

Lineaire algebra voor data science in R

Preparing Video For Download...