# Wykład Algorytmy w Inżynierii Danych 2021L
## Temat: Wartości własne - część 1

Opracownie: Robert Szmurło

Przykładowa deklaracja macierzy $2 \times 2$

In [1]:
A = [1 2;4 5]

2×2 Array{Int64,2}:
 1  2
 4  5

Chcemy używać funkcji z bibliotek dotyczących algebry liniowej (`eigen`) oraz statystyki (`cov`)

In [2]:
using LinearAlgebra
using Statistics

Sprawdzamy jak działa wbudowana funkcja do wyznaczania wartości własnych.

In [4]:
e,v = eigen(A)

Eigen{Float64,Float64,Array{Float64,2},Array{Float64,1}}
values:
2-element Array{Float64,1}:
 -0.4641016151377544
  6.464101615137754
vectors:
2×2 Array{Float64,2}:
 -0.806898  -0.343724
  0.59069   -0.939071

Sprawdzamy jak znaleźć maksymalną wartość co do modułu: 

$$max( |e_i| ) \text{  dla  } i=1,2,3,\ldots,n$$ 

In [5]:
maximum(abs.(e)) # promień spektralny

6.464101615137754

Liczymy przykładową wartość wektorów kierunkowych PCA i rzutujemy na nie wektor danych wejściowych. Zazwyczaj wybieramy tylko te wektory włąsne, które są związane z najwiękzymi co do modułu wartościami własnymi.

$$\Sigma ={\begin{bmatrix}\sigma _{1}^{2}&\sigma _{12}&\cdots &\sigma _{1n}\\\sigma _{21}&\sigma _{2}^{2}&\cdots &\sigma _{2n}\\\vdots &\cdots &\ddots &\vdots \\\sigma _{n1}&\sigma _{n2}&\cdots &\sigma _{n}^{2}\end{bmatrix}}$$

gdzie:

$\sigma _{i}^{2}=D^{2}X_{i}$ - wariancja zmiennej $X_i$,  
$\sigma _{ij}=\operatorname {cov} (X_{i},X_{j})$ - kowariancja między zmiennymi $X_i$ i $X_j$

Obliczone wektory własne reprezentują nam przestrzeń rzutowania PCA. Liczymy zatem: 

$$P=\text{vectors}^T \cdot X^T$$

In [6]:
X = [-2 -2; 
      0 0; 
      2 2];
C = cov(X)
values, vectors = eigen(C)
println("Wartości własne: ",values)
println("Wektory własne: ", vectors)
P = vectors' * X' # tutaj rzutujemy
P'

Wartości własne: [0.0, 8.0]
Wektory własne: [-0.7071067811865475 0.7071067811865475; 0.7071067811865475 0.7071067811865475]


3×2 Adjoint{Float64,Array{Float64,2}}:
 0.0  -2.82843
 0.0   0.0
 0.0   2.82843

Jak obliczać wartości własne za pomocą wielomianu charakterystycznego używająć wbudowanych funkcji do znajdowania pierwiastków. Samodzielnie tylko napiszemy funkcję obliczającą współczynniki wielomianu charakterystycznego korzystając z metody Faddeeva-Laverriera:

$$(-1)^n [\lambda^n - p_1 \lambda^{n-1} - p_2 \lambda^{n-2} - \ldots - p_{n-1} \lambda - p_n] = 0$$

$$\begin{align*}
[P_1] &= [A], p_1=trace [P_1]; \\
[P_2] &= [A]([P_1] - p_1[I]), p_2=\frac{1}{2}trace[P_2]; \\
[P_3] &= [A]([P_2] - p_2[I]), p_3=\frac{1}{3}trace[P_3]; \\
&\vdots \\
[P_i] &= [A]([P_{i-1}] - p_{i-1}[I]), p_i=\frac{1}{i}trace[P_i]; \\
&\vdots \\
[P_n] &= [A]([P_{n-1}] - p_{n-1}[I]), p_n=\frac{1}{n}trace[P_n];
\end{align*}$$


In [None]:
# import Pkg; Pkg.add("Polynomials")

In [45]:
using Polynomials

In [46]:
A = [12 6 -6
    6 16 2
    -6 2 16];

In [47]:
n = size(A,1) # tylko sprawdzamy czy w Julia size działa tak samo jak w MATLABie :-)

3

In [48]:
n = size(A,1);

# metoda Fadeeva-Laveriera
p = [(-1)^n];
i = 1;
P = A;
for i =1:n
    push!(p, 1/i*tr(P) );
    P = A*(P - p[i+1]*I);
end

# odwracamy współczynniki, ponieważ Polynomials w Julia 
# pierwszy element wektora traktują jako wartośc przy 
# wykładniku potęgi równym 0
coefficients = p[end:-1:1]
println(coefficients)

poly=Polynomial(coefficients)
println(poly)

# liczymy pierwiastki (zera) wielomianu charakterytycznego - czyli wartości własne
root = roots(poly)
println(root)

# sprawdźmy czy eigen zwróci to samo
eigen(A)

[1728, -564, 44, -1]
1728 - 564*x + 44*x^2 - x^3
[4.455996254682469, 18.000000000000064, 21.54400374531746]


Eigen{Float64,Float64,Array{Float64,2},Array{Float64,1}}
values:
3-element Array{Float64,1}:
  4.455996254682473
 18.000000000000004
 21.544003745317532
vectors:
3×3 Array{Float64,2}:
  0.747342  3.33067e-16   0.664439
 -0.469829  0.707107      0.528451
  0.469829  0.707107     -0.528451

Trochę brakuje w Julia funkcji `eye(n)` z MATLABA. Niby Można używać `I`, ale on jest niestety niemutowalny i tworzenie macierzy permutacji (lub obrotu jak w metodzie Jakobiego, czy też Givensa) nie jest zbyt wygodne. 

Zróbmy ją sobie zatem sami.

In [38]:
function eye(n)
    return Matrix{Float64}(I,n,n)
end

eye (generic function with 1 method)

Funkcja zwracająca indeksy (wspólrzędne indeksowe) maksymalnych co do modułu elementów pozadiagonalnych. 

In [49]:
function maxst(A)
    s = 1;
    t = 2;
    n = size(A,1);
    
    for c = 2:n
        for r = 1:c-1
            if abs(A[r,c]) > abs(A[s,t])
                s = r;
                t = c;
            end
        end
    end
    return s,t
end

maxst (generic function with 1 method)

Upewniamy sie jak działa w Julia funkcja `signum`.

In [50]:
sign(-5)

-1

Naiwna implementacja metody diagonalizacji macierzy za pomocą obrotów Jakobiego.

In [52]:
function myjacobi_eig(A)
    n = size(A,1);    
    for i = 1:15
        # find s,t
        s,t = maxst(A);
        d = sqrt((A[s,s] - A[t,t])^2 + 4*A[s,t]^2);
        sin2t = 2*A[s,t]/d;
        cos2t = (A[s,s] - A[t,t]) / d;
        dt = sqrt(2*(1+cos2t));
        sint = abs(sin2t) / dt;
        cost = abs((1+ cos2t) / dt);
        cost = sign(A[s,t]) * cost;
        
        R = eye(n);
        R[s,s] = cost;
        R[t,t] = cost;
        R[s,t] = -sint;
        R[t,s] = sint;
        A = R'*A*R;
    end
    return A
end

myjacobi_eig (generic function with 1 method)

Testujemy kod obrotów jakobiego pamiętając, że macierz musi być symetryczna!

In [55]:
A = [12 6 -6 1
    6 16 2 100
    -6 2 16 1
    1 100 1 4];
maxst(A);
AJ = myjacobi_eig(A);

# tylko obcinamy prawie zera, żeby było lepiej widać
AJ[abs.(AJ) .< 1e-10] .= 0.0;
println("Macierz diagonalna:")
display(AJ)
e,v = eigen(A);
println("Wartośći własne z eigen: ", e)


4×4 Array{Float64,2}:
 110.475   0.0     0.0        0.0
   0.0    20.3274  0.0        0.0
   0.0     0.0     7.49633    0.0
   0.0     0.0     0.0      -90.2988

Macierz diagonalna:
Wartośći własne z eigen: [-90.2987517379167, 7.496326411004787, 20.32736609356303, 110.47505923334917]


Sprawdzamy jak w Julia działa przypisywanie wartości do elementów warunkowo.

In [7]:
A[ A .> 2 ] .= 100
A

2×2 Array{Int64,2}:
   1    2
 100  100

In [8]:
A = [1 4 1;
     4 3 2;
     1 2 5]

3×3 Array{Int64,2}:
 1  4  1
 4  3  2
 1  2  5

In [15]:
x = [1;1;1;]

3-element Array{Int64,1}:
 1
 1
 1

In [19]:
x = [1;1;1;]
println(x)
for i = 1:20
    x = A*x
    x = x / norm(x)
end
println(x)
lambda = x'*A*x / (x'*x)

[1, 1, 1]
[0.4636576533697553, 0.638242619004902, 0.6145469386120278]


7.831586613814753

In [12]:
e,v = eigen(A)

Eigen{Float64,Float64,Array{Float64,2},Array{Float64,1}}
values:
3-element Array{Float64,1}:
 -2.1529137088817887
  3.321327095067036
  7.831586613814752
vectors:
3×3 Array{Float64,2}:
  0.77535   -0.428782  -0.463658
 -0.627948  -0.445339  -0.638243
  0.067182   0.786014  -0.614547

In [24]:
An = A - lambda*x*x' # deflacja

3×3 Array{Float64,2}:
 -0.683622   1.68243   -1.23153
  1.68243   -0.190225  -1.07178
 -1.23153   -1.07178    2.04226

In [26]:
x = [1;1;1;]
println(x)
for i = 1:50
    x = An*x
    x = x / norm(x)
end
println(x)
lambda = x'*An*x / (x'*x)

[1, 1, 1]
[0.42878211140134165, 0.4453394816284052, -0.7860144063852461]


3.3213270950670366

In [30]:
x = [1,1,1]
println(A)
println(x)
L,U = lu(A)
display(L)
display(U)
for i = 1:50
    x = A \ x # rozwiazuje uklad rownan!
    x = x / norm(x)
end
println(x)
lambda = x'*An*x / (x'*x)



[1 4 1; 4 3 2; 1 2 5]
[1, 1, 

3×3 Array{Float64,2}:
 1.0   0.0       0.0
 0.25  1.0       0.0
 0.25  0.384615  1.0

3×3 Array{Float64,2}:
 4.0  3.0   2.0
 0.0  3.25  0.5
 0.0  0.0   4.30769

1]
[0.7753499088552043, -0.6279483285839154, 0.0671819578971419]


-2.152913708881789

In [32]:
cond(A)

3.637668607666786

In [34]:
V = A'*A

3×3 Array{Int64,2}:
 18  18  14
 18  29  20
 14  20  30

In [36]:
x = [1,1,1]
for i = 1:50
    x = V * x 
    x = x / norm(x)
end
println(x)
lambda_max = x'*V*x / (x'*x)


[0.46365765258959585, 0.6382426181957052, 0.614546940041033]


61.333748889682425

In [40]:
V_min = V - lambda_max*eye(3)

3×3 Array{Float64,2}:
 -43.3337   18.0      14.0
  18.0     -32.3337   20.0
  14.0      20.0     -31.3337

In [41]:
x = [1,1,1]
for i = 1:50
    x = V_min * x 
    x = x / norm(x)
end
println(x)
lambda_min_dash = x'*V_min*x / (x'*x)
lambda_min = lambda_min_dash + lambda_max

[0.7757925783719438, -0.6274878002141051, 0.06636969131670403]


4.635044267854248

In [42]:
e,v = eigen(V)

Eigen{Float64,Float64,Array{Float64,2},Array{Float64,1}}
values:
3-element Array{Float64,1}:
  4.635037437891141
 11.03121367242645
 61.33374888968244
vectors:
3×3 Array{Float64,2}:
  0.77535   -0.428782  -0.463658
 -0.627948  -0.445339  -0.638243
  0.067182   0.786014  -0.614547

In [44]:
sqrt(lambda_max/lambda_min)

3.6376659275250107