<h1>Einführung in die Lineare Ausgleichsrechnung</h1>

<h2>Motivation</h2>
<font size="3" face="Verdana">
<p style="text-align:justify">Lineare Auslgeichsrechnung kann im Bereich Computer Vision dazu verwendet werden um Merkmale in einem Bild zu schätzen. In Bild 1 beispielsweise können die Kanten des Flurs durch Geraden beschrieben werden. Damit kann dann zum Beispiel der Fluchtpunkt bestimmt werden.</p>
    <figure>
            <img src="flur_linien.png" style="width:30%">
            <figcaption style="text-align:center"> Bild 1 </figcaption>
    </figure>
</font>

<h2>Lineares Gleichungssystem lösen</h2>
<font size="3" face="Verdana">
    
<p style="text-align:justify">Sind $n$ Punkte gegeben, können die Parameter einer zugehörigen linearen Funktion berechnet werden. Um eine Gerade zu beschreiben müssen beispielsweise zwei Punkte gegeben sein:</p>

\begin{align}
(x_1, y_1) \\
(x_2, y_2)
\end{align}

<p style="text-align:justify">und gesucht sind die Parameter $a$ und $b$ einer Geradengleichung:</p>

\begin{align}
f(x) = y = a x + b
\end{align}

<p style="text-align:justify">Somit können die folgenden Gleichungen aufgestellt werden:</p>

\begin{align}
x_1 a + 1 b = y_1 \\
x_2 a + 1 b = y_2
\end{align}

<p style="text-align:justify">Dies kann auch als Matrizengleichung dargestellt werden:</p>

\begin{align}
\begin{bmatrix} 
    x_1 & 1 \\
    x_2 & 1
\end{bmatrix}
\begin{bmatrix} 
    a  \\
    b 
\end{bmatrix} = 
\begin{bmatrix} 
    y_1 \\
    y_2 
\end{bmatrix}
\end{align}

<p style="text-align:justify">Also der Form:</p>

\begin{align}
A x = y
\end{align}

<p style="text-align:justify">Dies kann nun zum Beispiel mithilfe der Matrix-Inversen gelöst werden:</p>

\begin{align}
 A x &= y \\
 A^{-1} A x &= A^{-1} y \\
 I x &= A^{-1} y \\
 x &= A^{-1} y \\
\end{align}

</font>

<h2>Beispiel 1</h2>

<font size="3" face="Verdana">
    <figure>
            <img src="LinAusgl_Bsp1.png" style="width:30%">
    </figure>
<p style="text-align:justify">Gegeben sind die Punkte:</p>
    
\begin{align}
(2, 3) \\
(6, 5)
\end{align}

<p style="text-align:justify">Es soll die Geradengleichung der Geraden bestimmt werden, die durch beide Punkte verläuft. Dafür werden zunächst die zwei Gleichungen aufgestellt:</p>

\begin{align}
2 a + 1 b = 3 \\
6 a + 1 b = 5
\end{align}

<p style="text-align:justify">Daraus kann folgende Matrix abgeleitet werden:</p>

\begin{align}
\begin{bmatrix} 
    2 & 1 \\
    6 & 1
\end{bmatrix}
\begin{bmatrix} 
    a  \\
    b 
\end{bmatrix} = 
\begin{bmatrix} 
    3 \\
    5 
\end{bmatrix}
\end{align}

<p style="text-align:justify">Die Inverse der Matrix lautet:</p>

\begin{align}
\begin{bmatrix} 
    2 & 1 \\
    6 & 1
\end{bmatrix}^{-1} =
\begin{bmatrix} 
    -0.25 & 0.25 \\
    1.5 & -0.5
\end{bmatrix}
\end{align}

<p style="text-align:justify">Somit kann die Lösung berechnet werden:</p>

\begin{align}
& \begin{bmatrix} 
    a  \\
    b 
\end{bmatrix} = 
 \begin{bmatrix} 
    -0.25 & 0.25 \\
    1.5 & -0.5
\end{bmatrix}
\begin{bmatrix} 
    3  \\
    5 
\end{bmatrix} \\
& \begin{bmatrix} 
    a  \\
    b 
\end{bmatrix} = 
\begin{bmatrix} 
    0.5  \\
    2 
\end{bmatrix} 
\end{align}

<p style="text-align:justify">Also lautet die Geradengleichung: </p>

\begin{align}
f(x) = 0.5 x + 2
\end{align}

</font>

<h2>Code-Beispiel: Geradengleichung bestimmen</h2>

In [6]:
import numpy as np

# Eingabe-Matrix, kann beliebig geändert werden
# enthält alle Messpunkte
In = np.array([[2, 3], [6, 5]])

# Stelle Matrix A auf
A = np.ones((len(In), 2))
for i in range(len(In)):
    A[i][0] = In[i][0]
    
# Definiere y
y = np.zeros((len(In)))
for i in range(len(In)):
    y[i] = In[i][1]
    
# berechne x
x = np.linalg.inv(A).dot(y)

# zeige x
print(x)

# zeige die Geradengleichung
print("f(x) = ",round(x[0],5),"x + ", round(x[1],5))

[0.5 2. ]
f(x) =  0.5 x +  2.0


<h2>Überbestimmtes lineares Gleichungssystem lösen</h2>
<font size="3" face="Verdana">

<p style="text-align:justify">In einem überbestimmten linearen Gleichungssystem gibt es mehr Gleichungen als Unbekannte. Dies wäre beispielsweise der Fall, wenn eine Linie durch drei Punkte gegeben ist:</p>

\begin{align}
(x_1, y_1) \\
(x_2, y_2) \\
(x_3, y_3)
\end{align}

<p style="text-align:justify">Dies resultiert dann in folgender Gleichung:</p>

\begin{align}
\begin{bmatrix} 
    x_1 & 1 \\
    x_2 & 1 \\
    x_3 & 1
\end{bmatrix}
\begin{bmatrix} 
    a  \\
    b 
\end{bmatrix} = 
\begin{bmatrix} 
    y_1 \\
    y_2 \\
    y_3
\end{bmatrix}
\end{align}

<p style="text-align:justify">Da die Inverse nur für quadratische Matrizen definiert ist, wird in diesem Fall stattdessen die Pseudoinverse verwendet. Diese kann mithilfe der Singulärwertzerlegung berechnet werden:</p>

\begin{align}
& A = U \Sigma V^T \\
& A^+ = V \Sigma^+ U^T \\
& \Sigma^+ = \begin{cases} \frac{1}{\sigma_i}, if i=j \leq r \\ 0, else \end{cases}
\end{align}

<p style="text-align:justify">Somit kann man die Gleichung folgendermaßen Lösen:</p>

\begin{align}
x = A^+ y
\end{align}

</font>

<h2>Beispiel 2 a</h2>

<font size="3" face="Verdana">
    <figure>
            <img src="LinAusgl_Bsp2a.png" style="width:30%">
    </figure>
<p style="text-align:justify">Gegeben sind die Punkte:</p>
    
\begin{align}
(2, 3) \\
(6, 5) \\
(4, 4)
\end{align}

<p style="text-align:justify">Es soll die Geradengleichung der Geraden bestimmt werden, die durch alle Punkte verläuft. Dafür werden zunächst die drei Gleichungen aufgestellt:</p>

\begin{align}
2 a + 1 b = 3 \\
6 a + 1 b = 5 \\
4 a + 1 b = 4
\end{align}

<p style="text-align:justify">Daraus kann folgende Matrizengleichung abgeleitet werden:</p>

\begin{align}
\begin{bmatrix} 
    2 & 1 \\
    6 & 1 \\
    4 & 1
\end{bmatrix}
\begin{bmatrix} 
    a  \\
    b 
\end{bmatrix} = 
\begin{bmatrix} 
    3 \\
    5 \\
    4
\end{bmatrix}
\end{align}

<p style="text-align:justify">Die Singulärwertzerlegung der Matrix lautet:</p>

\begin{align}
A = U*\Sigma*V^T
\end{align}

\begin{align}
\begin{bmatrix} 
    2 & 1 \\
    6 & 1 \\
    4 & 1
\end{bmatrix} =
\begin{bmatrix} 
    -0.2830 & 0.8679 & -0.4082 \\
    -0.7938 & -0.4508 & -0.4082 \\
    -0.5384 & 0.2085 & 0.8165
\end{bmatrix}
\begin{bmatrix} 
    7.6544 & 0 \\
    0 & 0.64 \\
    0 & 0
\end{bmatrix}
\begin{bmatrix} 
    -0.9775 & -0.2110 \\
    -0.2110 & 0.9775
\end{bmatrix}
\end{align}

<p style="text-align:justify">Somit ist die Pseudoinverse:</p>

\begin{align}
V \Sigma^+ U^T = A^+ 
\end{align}

\begin{align}
\begin{bmatrix} 
    -0.9775 & -0.2110 \\
    -0.2110 & 0.9775
\end{bmatrix}
\begin{bmatrix} 
    \frac{1}{7.6544} & 0 & 0 \\
    0 & \frac{1}{0.64} & 0
\end{bmatrix}
\begin{bmatrix} 
    -0.2830 & -0.7938 & -0.5384 \\
    0.8679 & -0.4508 & 0.2085 \\
    -0.4082 & -0.4082 & 0.8165
\end{bmatrix} =
\begin{bmatrix} 
    0.2500 & 0.2500 & 0 \\
    1.3333 & -0.6667 & 0.3333
\end{bmatrix}
\end{align}

<p style="text-align:justify">Somit kann die Lösung berechnet werden:</p>

\begin{align}
&\begin{bmatrix} 
    a  \\
    b 
\end{bmatrix} = 
\begin{bmatrix} 
    0.2500 & 0.2500 & 0 \\
    1.3333 & -0.6667 & 0.3333
\end{bmatrix}
\begin{bmatrix} 
    3  \\
    5  \\
    4
\end{bmatrix} \\
&\begin{bmatrix} 
    a  \\
    b 
\end{bmatrix} = 
\begin{bmatrix} 
    0.5  \\
    2 
\end{bmatrix} 
\end{align}

<p style="text-align:justify">Also lautet die Geradengleichung: </p>

\begin{align}
f(x) = 0.5 x + 2
\end{align}

</font>

<h2>Beispiel 2 b: mit Messrauschen</h2>

<font size="3" face="Verdana">
    <figure>
            <img src="LinAusgl_Bsp2b.png" style="width:30%">
    </figure>
<p style="text-align:justify">Gegeben sind die Punkte: </p>  
    
\begin{align}
(2, 2.95) \\
(6, 4.9) \\
(4, 4.2)
\end{align}    
    
<p style="text-align:justify">Da die drei Punkte nicht exakt auf einer Geraden liegen, soll die Gleichung einer Geraden gefunden werden, welche die Punkte bestmöglich approximiert. Dafür werden wieder erst drei Gleichungen aufgestellt: </p>

\begin{align}
2.95 = a 2 + b \\
4.9 = a 6 + b \\
4.2 = a 4 + b
\end{align}
       
<p style="text-align:jusitfy">Somit soll folgende Matrizengleichung gelöste werden:</p>

\begin{align}
\begin{bmatrix} 
    2 & 1 \\
    6 & 1 \\
    4 & 1
\end{bmatrix} 
\begin{bmatrix} 
    a  \\
    b
\end{bmatrix} =
\begin{bmatrix} 
    2.95  \\
    4.9  \\
    4.2
\end{bmatrix}
\end{align}
       
<p style="text-align:jusitfy">Die Pseudoinverse mittels SVD ist gleich wie in Beispiel 2 a: </p>

\begin{align}
A^+ = 
\begin{bmatrix} 
0.2500 & 0.2500 & 0 \\
1.3333 & -0.6667 & 0.3333
\end{bmatrix}
\end{align}

<p style="text-align:jusitfy">Damit kann dann die Lösung berechnet werden: </p>

\begin{align}
& \begin{bmatrix} 
a \\
b
\end{bmatrix} = 
\begin{bmatrix} 
0.2500 & 0.2500 & 0 \\
1.3333 & -0.6667 & 0.3333
\end{bmatrix}
\begin{bmatrix} 
2.95 \\
4.9  \\
4.2
\end{bmatrix} \\
& \begin{bmatrix} 
a \\
b
\end{bmatrix} =
\begin{bmatrix} 
0.4875 \\
2.0667
\end{bmatrix}
\end{align}

<p style="text-align:justify">Also lautet die Geradengleichung: </p>

\begin{align}
f(x) = 0.4875 x + 2.0667
\end{align}

</font>

In [25]:
import numpy as np

# Funktion zur Berechnung der Pseudoinversen mittels Singulärwertzerlegung
def Pseudoinverse(A):
    # wenn Anzahl der Reihen kleiner als Anzahl der Spalten, berechne Eigenwerte mit AA^T und zuerst V
    if len(A) < len(A[0]):
        # Eigenwerte von AA^T berechnen
        AAT = A.dot(np.transpose(A))
        lamb, e = np.linalg.eig(AAT)
        # Eigenwerte sortieren (absteigend)
        idx = lamb.argsort()[::-1]
        lamb = lamb[idx]
        e = e[:,idx]
    
        # Sigma erstellen
        Sigma = np.zeros((len(A),len(A[0])))
        for i in range(len(A)):
            Sigma[i,i] = np.sqrt(lamb[i])
    
    
        # Eigenwerte von A^TA berechnen
        ATA = np.transpose(A).dot(A)
        lamb, e = np.linalg.eig(ATA)
    
        # Eigenwerte sortieren (absteigend)
        idx = lamb.argsort()[::-1]
        lamb = lamb[idx]
        e = e[:,idx]
    
        # V erstellen
        V = np.zeros((len(A[0]), len(A[0])))
        for i in range(len(A[0])):
            for j in range(len(A[0])):
                V[i][j] = e[i][j]
        
        # Berechnen von U
        U = np.zeros((len(A), len(A)))
        for i in range(len(A)):
            U[:,i] = np.divide(A.dot(V[:,i]),Sigma[i][i])
            
        # Berechnen der Pseudoinversen von Sigma
        Spseudo = np.zeros((len(Sigma[0]),len(Sigma)))
        for i in range(len(Sigma)):
            Spseudo[i][i] = 1/Sigma[i][i]
            
    else:
        # Eigenwerte von A^TA berechnen
        ATA = np.transpose(A).dot(A)
        lamb, e = np.linalg.eig(ATA)
        # Eigenwerte sortieren (absteigend)
        idx = lamb.argsort()[::-1]
        lamb = lamb[idx]
        e = e[:,idx]
    
        # Sigma erstellen
        Sigma = np.zeros((len(A),len(A[0])))
        for i in range(len(A[0])):
            Sigma[i,i] = np.sqrt(lamb[i])
    
    
        # Eigenwerte von AA^T berechnen
        AAT = A.dot(np.transpose(A))
        lamb, e = np.linalg.eig(AAT)
    
        # Eigenwerte sortieren (absteigend)
        idx = lamb.argsort()[::-1]
        lamb = lamb[idx]
        e = e[:,idx]
    
        # U erstellen
        U = np.zeros((len(A), len(A)))
        for i in range(len(A)):
            for j in range(len(A)):
                U[i][j] = e[i][j]
        
        # Berechnen von V
        V = np.zeros((len(A[0]), len(A[0])))
        for i in range(len(A[0])):
            V[:,i] = np.divide(np.transpose(A).dot(U[:,i]),Sigma[i][i])
            
        # Berechnen der Pseudoinversen von Sigma
        Spseudo = np.zeros((len(Sigma[0]),len(Sigma)))
        for i in range(len(Sigma[0])):
            Spseudo[i][i] = 1/Sigma[i][i]
    
    
    # Berechnen der Pseudoinversen
    Pseudo = V.dot(Spseudo.dot(np.transpose(U)))
    return Pseudo

In [27]:

# Eingabe-Matrix, kann beliebig geändert werden
# enthält alle Messpunkte
In = np.array([[2, 2.95], [6, 4.9], [4, 4.2]])

# Stelle Matrix auf
A = np.ones((len(In), 2))
for i in range(len(In)):
    A[i][0] = In[i][0]
    
# Definiere y
y = np.zeros((len(In)))
for i in range(len(In)):
    y[i] = In[i][1]

# berechne die Pseudoinverse
Apseudo = Pseudoinverse(A)
    
# berechne x
x = Apseudo.dot(y)

# zeige x
print(x)

# zeige die Geradengleichung
print("f(x) = ",round(x[0],5),"x + ", round(x[1],5))

[0.4875     2.06666667]
f(x) =  0.4875 x +  2.06667
