Meer over eigenwaarden en eigenvectoren

Lineaire algebra voor data science in R

Eric Eager

Data Scientist at Pro Football Focus

Wat gebeurt er?

  • Als de eigenwaarden $\lambda_1, \lambda_2, ..., \lambda_n$ van $A$ verschillend zijn en $\vec{v}_1, \vec{v}_2, ..., \vec{v}_n$ een bijbehorende set eigenvectoren is, dan vormt deze set een basis voor de $n$-dimensionale vectorruimte.

  • Met andere woorden: als matrix $A$ een basis van eigenvectoren $\vec{v}_1, \vec{v}_2, ... \vec{v}_n$ heeft, met bijbehorende, verschillende eigenwaarden $\lambda_1, \lambda_2, ... \lambda_n$, dan kan elke $n$-dimensionale vector worden uitgedrukt als een lineaire combinatie van deze vectoren, d.w.z. $$\vec{x} = c_1\vec{v}_1 + c_2\vec{v}_2 + ... + c_n\vec{v}_n.$$

Lineaire algebra voor data science in R

Wat gebeurt er?

Pas matrix $A$ toe op $\vec{x}$ en gebruik dat $A\vec{v}_j = \lambda_j \vec{v}_j$. Dan krijg je de decompositie

$$A\vec{x} = c_1\lambda_1\vec{v}_1 + c_2\lambda_2\vec{v}_2 + ... + c_n\lambda_n\vec{v}_n.$$

Eigenparen maken matrixvermenigvuldiging zo tot een lineaire combinatie van scalairvermenigvuldigingen!

Lineaire algebra voor data science in R

De matrix itereren

Als we herhaaldelijk met matrix $A$ vermenigvuldigen:

$$A A\vec{x} = $$ $$ = A(c_1\lambda_1\vec{v}_1 + c_2\lambda_2\vec{v}_2 + ... + c_n\lambda_n\vec{v}_n)$$ $$ = c_1\lambda_1^2\vec{v}_1 + c_2\lambda_2^2\vec{v}_2 + ... + c_n\lambda_n^2\vec{v}_n,$$

of, in het algemeen: $$A^t\vec{x} = c_1\lambda_1^t\vec{v}_1 + c_2\lambda_2^t\vec{v}_2 + ... + c_n\lambda_n^t\vec{v}_n.$$

Dus, opeenvolgende matrixvermenigvuldiging is géén opeenvolgende scalairvermenigvuldiging (machtsverheffing)!

Als één eigenwaarde groter is dan de rest, worden die verschillen groter naarmate $t$ toeneemt.

Lineaire algebra voor data science in R

Voorbeeld met allelfrequenties

Lineaire algebra voor data science in R
print(M)

eigen(M)
      [,1]  [,2]  [,3]  [,4]
[1,] 0.980 0.005 0.005 0.010
[2,] 0.005 0.980 0.010 0.005
[3,] 0.005 0.010 0.980 0.005
[4,] 0.010 0.005 0.005 0.980
eigen() decomposition
$`values`
[1] 1.00 0.98 0.97 0.97

$vectors
     [,1] [,2]          [,3]          [,4]
[1,] -0.5  0.5  0.000000e+00  7.071068e-01
[2,] -0.5 -0.5 -7.071068e-01  1.132427e-14
[3,] -0.5 -0.5  7.071068e-01 -2.442491e-15
[4,] -0.5  0.5 -1.382228e-14 -7.071068e-01
Lineaire algebra voor data science in R
print(M)
      [,1]  [,2]  [,3]  [,4]
[1,] 0.980 0.005 0.005 0.010
[2,] 0.005 0.980 0.010 0.005
[3,] 0.005 0.010 0.980 0.005
[4,] 0.010 0.005 0.005 0.980
Lambda <- eigen(M)
v1 <- Lambda$vectors[, 1]/sum(Lambda$vectors[, 1])
print(v1)
0.25 0.25 0.25 0.25

Lineaire algebra voor data science in R

Laten we oefenen!

Lineaire algebra voor data science in R

Preparing Video For Download...