<a href="https://colab.research.google.com/github/deltorobarba/machinelearning/blob/master/vector.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Moduln and Vector Spaces (Linear Algebra)**

In [None]:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

#### **Moduln**

* Ein Modul ist ein n-dimensionaler Ring.

* Ein Modul ist eine algebraische Struktur, die eine Verallgemeinerung eines Vektorraums darstellt.

* **A module is similar to a vector space, except that the scalars are only required to be elements of a ring. (Gilt NICHT multiplikative Inverse und multiplikative Kommuntativität)**

* For example, the set Zn of n-dimensional vectors with integer entries forms a module, where “scalar multiplication” refers to multiplication by integer scalars.

Folgende Zahlenbereiche sind additive Gruppen und damit $\mathbb {Z}$ -Moduln:

* die ganzen Zahlen $\mathbb {Z}$ selbst

* die rationalen Zahlen $\mathbb {Q}$ 

* die reellen Zahlen $\mathbb {R}$ 

* die algebraischen Zahlen $\mathbb A$ bzw. $\mathbb A$ $\cap$ $\mathbb R$

* die komplexen Zahlen $\mathbb {C}$


https://de.m.wikipedia.org/wiki/Modul_(Mathematik)

**Basis eines Modul**

* Der Begriff der Basis eines Moduls ist im mathematischen Teilgebiet der Algebra eine Verallgemeinerung des Begriffes der Basis eines Vektorraumes. 

* Wie bei diesen wird eine Basis eines Moduls als linear unabhängiges Erzeugendensystem definiert; im Gegensatz zu Vektorräumen besitzt allerdings nicht jeder Modul eine Basis.

https://de.m.wikipedia.org/wiki/Basis_(Modul)

https://de.m.wikipedia.org/wiki/Basis_(Vektorraum)

#### **Numerische lineare Algebra**

https://www.quantamagazine.org/new-algorithm-breaks-speed-limit-for-solving-linear-equations-20210308/

Die [numerische lineare Algebra](https://de.m.wikipedia.org/wiki/Numerische_lineare_Algebra) ist ein zentrales Teilgebiet der numerischen Mathematik. Sie beschäftigt sich mit der Entwicklung und der Analyse von Rechenverfahren (Algorithmen) für Problemstellungen der linearen Algebra, insbesondere der Lösung von [linearen Gleichungssystemen](https://de.m.wikipedia.org/wiki/Lineares_Gleichungssystem) und [Eigenwertproblemen](https://de.m.wikipedia.org/wiki/Eigenwertproblem). 

1. Lösung linearer Gleichungen / Matrizen

2. Berechnung von Eigenwerten

3. Reduzierung der Grösse von Matrizen (für Recommender zB)

https://de.m.wikipedia.org/wiki/Zufallsmatrix

###### <font color="blue">**Overview**

https://en.m.wikipedia.org/wiki/System_of_linear_equations#Matrix_solution

https://de.m.wikipedia.org/wiki/Numerische_lineare_Algebra

* **Inverse: benutzt man als [Matrix Solution](https://en.m.wikipedia.org/wiki/System_of_linear_equations#Matrix_solution) zur Lösung linearer Gleichungssysteme**. man kann hier die Pseudoinverse [Moore-Penrose](https://en.m.wikipedia.org/wiki/Moore–Penrose_inverse) nutzen (QR, Cholesky, Rank decomposition, Singular Value decomposition). 'The pseudoinverse provides a least squares solution to a system of linear equations.' Siehe auch [Linear Least Squares](https://en.m.wikipedia.org/wiki/Linear_least_squares) in bezug auf Moore-Penrose.

* **Other methods to solve linear equations**: While systems of three or four equations can be readily solved by hand (see Cracovian), computers are often used for larger systems. The standard algorithm for solving a system of linear equations is based on Gaussian elimination with some modifications. 
  
  * Firstly, it is essential to avoid division by small numbers, which may lead to inaccurate results. This can be done by reordering the equations if necessary, a process known as [pivoting](https://en.m.wikipedia.org/wiki/Pivot_element). 
  
  * Secondly, the algorithm does not exactly do Gaussian elimination, but it computes the [LU decomposition](https://en.m.wikipedia.org/wiki/LU_decomposition) of the matrix A.

  * If the matrix A has some special structure, this can be exploited to obtain faster or more accurate algorithms. For instance, systems with a symmetric positive definite matrix can be solved twice as fast with the [Cholesky decomposition](https://en.m.wikipedia.org/wiki/Cholesky_decomposition). [Levinson recursion](https://en.m.wikipedia.org/wiki/Levinson_recursion) is a fast method for Toeplitz matrices. Special methods exist also for matrices with many zero elements (so-called [sparse matrices](https://en.m.wikipedia.org/wiki/Sparse_matrix)), which appear often in applications.
  
  * A completely different approach is often taken for very large systems, which would otherwise take too much time or memory. The idea is to start with an initial approximation to the solution (which does not have to be accurate at all), and to change this approximation in several steps to bring it closer to the true solution. Once the approximation is sufficiently accurate, this is taken to be the solution to the system. This leads to the class of [iterative methods](https://en.m.wikipedia.org/wiki/Iterative_method). For some sparse matrices, the introduction of randomness improves the speed of the iterative methods.
  
  * There is also a [quantum algorithm for linear systems of equations](https://en.m.wikipedia.org/wiki/Quantum_algorithm_for_linear_systems_of_equations).

* **Matrix Factorization**: sehr grosse Matrizen kleiner machen (unter möglichen Verlust von Informationen). zum Beispiel uber PCA. sehr häufig genutzt bei Recommender Systems.

* **Eigenwertberechnung**: 

https://m.youtube.com/watch?v=e50Bj7jn9IQ

https://m.youtube.com/watch?v=PFDu9oVAE-g

https://m.youtube.com/watch?v=eJWgKvrhDmE

https://en.m.wikipedia.org/wiki/Time_complexity#Polylogarithmic_time

https://en.m.wikipedia.org/wiki/Ewin_Tang

https://en.m.wikipedia.org/wiki/Low-rank_matrix_approximations

https://de.m.wikipedia.org/wiki/Normalform

https://de.m.wikipedia.org/wiki/Potenzmethode

**Liste numerischer Verfahren fur lineare Gleichungssysteme**

https://de.m.wikipedia.org/wiki/Liste_numerischer_Verfahren#Lineare_Gleichungssysteme

* Gaußsches Eliminationsverfahren (bzw. LR-Zerlegung): Ein klassisches direktes Verfahren – für große Matrizen allerdings zu aufwändig.

* Cholesky-Zerlegung: Für symmetrische positiv definite Matrizen kann ähnlich wie die LR-Zerlegung eine symmetrische Zerlegung erstellt werden bei halbem Aufwand.

* QR-Zerlegung: Ebenfalls ein direktes Verfahren mit mindestens doppelter Laufzeit im Vergleich zum Gauß-Verfahren aber besseren Stabilitätseigenschaften. Umgesetzt mittels Householdertransformationen ist besonders für lineare [Ausgleichsprobleme (Ausgleichsrechnung)](https://de.m.wikipedia.org/wiki/Ausgleichungsrechnung) geeignet.

* Splitting-Verfahren: Klassische iterative Verfahren.

  * Gauß-Seidel-Verfahren: Wird auch als Einzelschrittverfahren bezeichnet.

  * Jacobi-Verfahren: Wird auch als Gesamtschrittverfahren bezeichnet.

  * Richardson-Verfahren

  * Tschebyschow-Iteration: ein Splitting-Verfahren mit zusätzlicher Beschleunigung

  * SOR-Verfahren

  * SSOR-Verfahren

* Iterative Refinement: Iterative Verbesserung eines direkten Verfahrens, Beziehung zur Grundidee der Krylow-Unterraum-Verfahren

* Krylow-Unterraum-Verfahren: Moderne iterative Verfahren, die für große, dünnbesetzte Gleichungssysteme gedacht sind. Wichtiger Spezialfall für symmetrisch positiv definite Probleme ist das Verfahren der konjugierten Gradienten.

* Mehrgitterverfahren: Ein modernes Verfahren mit linearer Komplexität speziell für Gleichungssysteme, die von partiellen Differentialgleichungen herrühren.

* Vorkonditionierung: Eine Technik, die Kondition einer Matrix in Krylow-Unterraum-Verfahren zu verbessern.

* ILU-Zerlegung: Ein wichtiges Vorkonditionierungsverfahren.

###### <font color="blue">**Prerequisites: Inverse Matrix, Diagonalmatrix & Jordan Normalform**

**Diagonalmatrix**

https://de.m.wikipedia.org/wiki/Diagonalmatrix

**Jordan Normalform**

> Für jede lineare Abbildung eines endlichdimensionalen Vektorraums, deren charakteristisches Polynom vollständig in Linearfaktoren zerfällt, kann eine Vektorraumbasis gewählt werden, so dass die Abbildungsmatrix, die die Abbildung bezüglich dieser Basis beschreibt, [jordansche Normalform](https://de.m.wikipedia.org/wiki/Jordansche_Normalform) hat.

* Die jordansche Normalform ist ein einfacher Vertreter der Äquivalenzklasse der zu einer trigonalisierbaren Matrix ähnlichen Matrizen. Die Trigonalisierbarkeit ist gleichbedeutend damit, dass das charakteristische Polynom der Matrix vollständig in Linearfaktoren zerfällt. 

* Matrizen über einem algebraisch abgeschlossenen Körper sind immer trigonalisierbar und daher immer ähnlich einer jordanschen Normalform.

* Genutzt u.a. in der Lösung linearer Differentialgleichungen

* Die [Diagonalisierung (Diagonalmatrix)](https://de.m.wikipedia.org/wiki/Diagonalmatrix) ist ein Spezialfall der jordanschen Normalform, während die jordansche Normalform ein Spezialfall der [Weierstraß-Normalform (Frobenius-Normalform)](https://de.m.wikipedia.org/wiki/Frobenius-Normalform) ist.

Voraussetzungen: 

* Diagonalmatrix, charakteristisches Polynom, Eigenwerte & Eigenräume, geometrische und algebraische Vielfachheit, Transformationsmatrix, Basiswechsel

* Algebraische Vielfachheit: Anzahl gleicher Eigenwerte

Herangehensweise:

1. Eigenwerte bestimmen

2. Eigenräume bestimmen Kern (A - λ * I)

3. Hauptvektoren bestimmen

4. Transformationsmatrix

https://youtu.be/83SgQJekeuk

https://youtu.be/hPAQdmEPU_k

**Inverse Matrix**

https://de.m.wikipedia.org/wiki/Inverse_Matrix

**Pseudoinverse (Moore-Penrose Inverse)**

* The term generalized inverse is sometimes used as a synonym for pseudoinverse.

* A common use of the pseudoinverse is to compute a "best fit" (least squares) solution to a system of linear equations that lacks a solution (see below under § Applications). Another use is to find the minimum (Euclidean) norm solution to a system of linear equations with multiple solutions. The pseudoinverse facilitates the statement and proof of results in linear algebra.

* The pseudoinverse is defined and unique for all matrices whose entries are real or complex numbers. It can be computed using the singular value decomposition.

https://en.m.wikipedia.org/wiki/Generalized_inverse

https://en.m.wikipedia.org/wiki/Moore–Penrose_inverse

* The pseudoinverse is the generalization of the matrix inverse for square matrices to rectangular matrices where the number of rows and columns are not equal.

* It is also called the the Moore-Penrose Inverse after two independent discoverers of the method or the Generalized Inverse.

* Matrix inversion is not defined for matrices that are not square. When A has more columns than rows, then solving a linear equation using the pseudoinverse provides one of the many possible solutions.

* The pseudoinverse is denoted as A^+, where A is the matrix that is being inverted and + is a superscript. The pseudoinverse is calculated using the singular value decomposition of A:

> A^+ = VD^+U^T

Where A^+ is the pseudoinverse, D^+ is the pseudoinverse of the diagonal matrix Sigma and U^T is the transpose of U.

We can get U and V from the SVD operation.

> A = U . Sigma . V^T

The D^+ can be calculated by creating a diagonal matrix from Sigma, calculating the reciprocal of each non-zero element in Sigma, and taking the transpose if the original matrix was rectangular.



In [None]:
#          s11,   0,   0
# Sigma = (  0, s22,   0)
#            0,   0, s33

In [None]:
#        1/s11,     0,     0
# D^+ = (    0, 1/s22,     0)
#            0,     0, 1/s33

The pseudoinverse provides one way of solving the linear regression equation, specifically when there are more rows than there are columns, which is often the case. 

NumPy provides the function pinv() for calculating the pseudoinverse of a rectangular matrix. The example below defines a 4×2 matrix and calculates the pseudoinverse.

In [None]:
# Pseudoinverse
from numpy import array
from numpy.linalg import pinv

# define matrix
A = array([
	[0.1, 0.2],
	[0.3, 0.4],
	[0.5, 0.6],
	[0.7, 0.8]])
print(A)

[[0.1 0.2]
 [0.3 0.4]
 [0.5 0.6]
 [0.7 0.8]]


In [None]:
# calculate pseudoinverse
B = pinv(A)
print(B)

[[-1.00000000e+01 -5.00000000e+00  1.42385628e-14  5.00000000e+00]
 [ 8.50000000e+00  4.50000000e+00  5.00000000e-01 -3.50000000e+00]]


###### <font color="blue">**Klassische Row Reduction (Gaußverfahren, Gauß-Jordan-Algorithmus, Pivotisierung) & Cramer's Rule**</font>

For kleine lineare Gleichungssysteme / Matrizen

**Gaußsches Eliminationsverfahren**

* Das [gaußsche Eliminationsverfahren](https://de.m.wikipedia.org/wiki/Gaußsches_Eliminationsverfahren) oder einfach Gauß-Verfahren (nach Carl Friedrich Gauß) ist ein Algorithmus aus den mathematischen Teilgebieten der linearen Algebra und der Numerik. 

* Es ist ein wichtiges Verfahren zum Lösen von linearen Gleichungssystemen und beruht darauf, dass elementare Umformungen zwar das Gleichungssystem ändern, aber die Lösung erhalten. 

* Dies erlaubt es, jedes eindeutig lösbare Gleichungssystem auf Stufenform zu bringen, an der die Lösung durch sukzessive Elimination der Unbekannten leicht ermittelt oder die Lösungsmenge abgelesen werden kann.



**Pivotisierung**

* Das [Pivotelement](https://de.m.wikipedia.org/wiki/Pivotelement) (vom Französischen pivot ‚Dreh-/Angelpunkt‘; im Militärjargon bezeichnet Pivot den Flügelmann einer Formation bei einem Wendemanöver) ist dasjenige Element einer Zahlenmenge, das als Erstes von einem Algorithmus (z. B. gaußsche Eliminationsverfahren, Quicksort oder Basisaustauschverfahren) ausgewählt wird, um bestimmte Berechnungen durchzuführen.

**Gauß-Jordan-Algorithmus**

* Der [Gauß-Jordan-Algorithmus](https://de.m.wikipedia.org/wiki/Gauß-Jordan-Algorithmus) ist ein Algorithmus aus den mathematischen Teilgebieten der linearen Algebra und Numerik. Mit dem Verfahren lässt sich die Lösung eines linearen Gleichungssystems berechnen. 

* Es ist eine Erweiterung des gaußschen Eliminationsverfahrens, bei dem in einem zusätzlichen Schritt das Gleichungssystem bzw. dessen erweiterte Koeffizientenmatrix auf die reduzierte Stufenform gebracht wird. 

* Daraus lässt sich dann die Lösung direkt ablesen. Außerdem kann der Gauß-Jordan-Algorithmus zur Berechnung der Inversen einer Matrix verwendet werden.

**Cramer's rule**

Though Cramer's rule is important theoretically, it has little practical value for large matrices, since the computation of large determinants is somewhat cumbersome. (Indeed, large determinants are most easily computed using row reduction.) 

https://en.m.wikipedia.org/wiki/System_of_linear_equations#Cramer's_rule

https://en.m.wikipedia.org/wiki/Cramer%27s_rule

###### <font color="blue">**Factorization (Matrix Decomposition): Overview (Linear Equations & Eigenvalues)**

In the mathematical discipline of linear algebra, a [matrix decomposition](https://en.m.wikipedia.org/wiki/Matrix_decomposition) or matrix factorization is a factorization of a matrix into a product of matrices. There are many different matrix decompositions; each finds use among a particular class of problems.

###### <font color="blue">**Factorization (Matrix Decomposition) for Linear Equations: LU Decomposition**

**Characteristics of an LU Decomposition**

The LU decomposition is often used to simplify the **solving of systems of linear equations**, such as **finding the coefficients in a linear regression**, as well as in **calculating the determinant and inverse** of a matrix.

* Lower–upper (LU) decomposition or factorization factors a matrix as the product of a lower triangular matrix and an upper triangular matrix. 

* The product sometimes includes a permutation matrix as well. LU decomposition can be viewed as the matrix form of Gaussian elimination. 

* Computers usually solve square systems of linear equations using LU decomposition, and it is also a key step when inverting a matrix or computing the determinant of a matrix.

The **LU decomposition is for square matrices** and decomposes a matrix into L and U components. Let A be a square matrix. An LU factorization refers to the factorization of A, with proper row and/or column orderings or permutations, into two factors – a **lower triangular matrix L** and an **upper triangular matrix U**:

> A = L U

* The LU decomposition is found using an <u>iterative numerical process</u> and **can fail for those matrices that cannot be decomposed or decomposed easily**.

* In the lower triangular matrix all elements above the diagonal are zero, in the upper triangular matrix, all the elements below the diagonal are zero. For example, for a 3 × 3 matrix A, its LU decomposition looks like this:

> $\left[\begin{array}{lll}
a_{11} & a_{12} & a_{13} \\
a_{21} & a_{22} & a_{23} \\
a_{31} & a_{32} & a_{33}
\end{array}\right]=\left[\begin{array}{ccc}
l_{11} & 0 & 0 \\
l_{21} & l_{22} & 0 \\
l_{31} & l_{32} & l_{33}
\end{array}\right]\left[\begin{array}{ccc}
u_{11} & u_{12} & u_{13} \\
0 & u_{22} & u_{23} \\
0 & 0 & u_{33}
\end{array}\right]$

**Underdeterminism & Unit Triangular Matrix**

* Sometimes **equations is [underdetermined](https://en.m.wikipedia.org/wiki/Underdetermined_system)**. In this case any two non-zero elements of L and U matrices are parameters of the solution and can be set arbitrarily to any non-zero value. 

* Therefore, to find the unique LU decomposition, it is **necessary to put some restriction on L and U matrices**. For example, we can conveniently require the lower triangular matrix L to be a **unit triangular matrix** (i.e. set all the entries of its main diagonal to ones). 

**Square matrices**

* Any square matrix A admits an LUP factorization. If A is [invertible](https://en.m.wikipedia.org/wiki/Invertible_matrix), then it admits an LU (or LDU) factorization if and only if all its leading principal [minors](https://en.m.wikipedia.org/wiki/Minor_(linear_algebra)) are nonzero. 

* If A is a singular matrix of rank k, then it admits an LU factorization if the first k leading principal minors are nonzero, although the converse is not true.

* If a square, invertible matrix has an LDU (factorization with all diagonal entries of L and U equal to 1), then the factorization is unique. In that case, the LU factorization is also unique if we require that the diagonal of L (or U) consists of ones.

**Symmetric positive definite matrices**

* If A is a symmetric (or [Hermitian](https://en.m.wikipedia.org/wiki/Hermitian_matrix), if A is complex) [positive definite](https://en.m.wikipedia.org/wiki/Definite_symmetric_matrix) matrix, we can arrange matters so that U is the [conjugate transpose](https://en.m.wikipedia.org/wiki/Conjugate_transpose) of L. That is, we can write A as

> A = LL*

* This decomposition is called the **Cholesky decomposition**. The Cholesky decomposition always exists and is unique — provided the matrix is positive definite. 

* Furthermore, computing the Cholesky decomposition is more efficient and [numerically more stable](https://en.m.wikipedia.org/wiki/Numerical_stability) than computing some other LU decompositions.

**General matrices**

* For a (not necessarily invertible) matrix over any field, the exact necessary and sufficient conditions under which it has an LU factorization are known. 

* The conditions are expressed in terms of the ranks of certain submatrices. The Gaussian elimination algorithm for obtaining LU decomposition has also been extended to this most general case.

**Variations of LU Decomposition**

**LU factorization with partial pivoting (LUP Decomposition)**

A variation of this decomposition that is numerically more stable to solve in practice is called the LUP decomposition, or the **LU decomposition with partial pivoting**.

> A = P L U

The rows of the parent matrix are re-ordered to simplify the decomposition process and the **additional P matrix specifies a way to permute the result or return the result to the original order**.

It turns out that a proper permutation in rows (or columns) is sufficient for LU factorization. LU factorization with partial pivoting (LUP) refers often to LU factorization with row permutations only:

> PA = LU

where L and U are again lower and upper triangular matrices, and P is a [permutation matrix](https://en.m.wikipedia.org/wiki/Permutation_matrix)*, which, when left-multiplied to A, reorders the rows of A. It turns out that all square matrices can be factorized in this form, and the factorization is numerically stable in practice. This makes LUP decomposition a useful technique in practice.

*A permutation matrix is a square binary matrix that has exactly one entry of 1 in each row and each column and 0s elsewhere.*

**LU factorization with full pivoting**

An LU factorization with full pivoting involves both row and column permutations:

> PAQ = LU

where L, U and P are defined as before, and Q is a permutation matrix that reorders the columns of A.

**LDU Decomposition**

An LDU decomposition is a decomposition of the form

> A = LDU

where D is a diagonal matrix, and L and U are unitriangular matrices, meaning that all the entries on the diagonals of L and U are one.

Below we required that A be a square matrix, but these decompositions can all be generalized to rectangular matrices as well. In that case, **L and D are square matrices** both of which have the same number of rows as A, and U has exactly the same dimensions as A. Upper triangular should be interpreted as having only zero entries below the main diagonal, which starts at the upper left corner.

![LDU decomposition of a Walsh matrix](https://upload.wikimedia.org/wikipedia/commons/thumb/8/84/LDU_decomposition_of_Walsh_16.svg/640px-LDU_decomposition_of_Walsh_16.svg.png)

*LDU decomposition of a [Walsh matrix](https://en.m.wikipedia.org/wiki/Walsh_matrix)*

**Example**

**Define Matrix**

In [None]:
# LU decomposition
from numpy import array

# define a square matrix
A = array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(A)

[[1 2 3]
 [4 5 6]
 [7 8 9]]


**Decompose**

In [None]:
# LU decomposition
from scipy.linalg import lu
P, L, U = lu(A)

In [None]:
print(P)

[[0. 1. 0.]
 [0. 0. 1.]
 [1. 0. 0.]]


In [None]:
print(L)

[[1.         0.         0.        ]
 [0.14285714 1.         0.        ]
 [0.57142857 0.5        1.        ]]


In [None]:
print(U)

[[7.         8.         9.        ]
 [0.         0.85714286 1.71428571]
 [0.         0.         0.        ]]


**Reconstruct**

In [None]:
B = P.dot(L).dot(U)
print(B)

[[1. 2. 3.]
 [4. 5. 6.]
 [7. 8. 9.]]


In [None]:
# Check for differences between both matrices
X = B - A
print(X)

[[0. 0. 0.]
 [0. 0. 0.]
 [0. 0. 0.]]


###### <font color="blue">**Factorization (Matrix Decomposition) for Linear Equations: Rank Factorization**

* given an m × n matrix A of rank r, a rank decomposition or rank factorization of A is a factorization of A of the form A = C F, where C is an m × r matrix and F is an r × n matrix.

* Every finite-dimensional matrix has a rank decomposition

* One can also construct a full rank factorization of A by using its singular value decomposition

###### <font color="blue">**Factorization (Matrix Decomposition) for Linear Equations: Cholesky Decomposition**

https://en.m.wikipedia.org/wiki/Cholesky_decomposition

The Cholesky decomposition is for square symmetric matrices where all eigenvalues are greater than zero, so-called [positive definite matrices](https://en.wikipedia.org/wiki/Definite_symmetric_matrix). For our interests in machine learning, we will focus on the Cholesky decomposition for real-valued matrices and ignore the cases when working with complex numbers.

> A = LL^T

Where A is the matrix being decomposed, L is the lower triangular matrix and L^T is the transpose of L.

The decompose can also be written as the product of the upper triangular matrix, for example:

> A = U^T . U

* Where U is the upper triangular matrix.

* The Cholesky decomposition is used for solving linear least squares for linear regression, as well as simulation and optimization methods.

* When decomposing symmetric matrices, the Cholesky decomposition is nearly twice as efficient as the LU decomposition and should be preferred in these cases.

* While symmetric, positive definite matrices are rather special, they occur quite frequently in some applications, so their special factorization, called Cholesky decomposition, is good to know about. When you can use it, Cholesky decomposition is about a factor of two faster than alternative methods for solving linear equations.

**Define Matrix**

In [None]:
from numpy import array

# define a 3x3 matrix
A = array([[2, 1, 1], [1, 2, 1], [1, 1, 2]])
print(A)

[[2 1 1]
 [1 2 1]
 [1 1 2]]


**Decompose**

In [None]:
# Cholesky decomposition
from numpy.linalg import cholesky
L = cholesky(A)
print(L)

[[1.41421356 0.         0.        ]
 [0.70710678 1.22474487 0.        ]
 [0.70710678 0.40824829 1.15470054]]


**Reconstruct**

In [None]:
B = L.dot(L.T)
print(B)

[[2. 1. 1.]
 [1. 2. 1.]
 [1. 1. 2.]]


###### <font color="blue">**Factorization (Matrix Decomposition) for Linear Equations: QR Decomposition**

https://de.m.wikipedia.org/wiki/QR-Algorithmus

* The QR decomposition is for m x n matrices (not limited to square matrices) and decomposes a matrix into Q and R components.

> A = Q R

* Where A is the matrix that we wish to decompose, Q a matrix with the size m x m, and R is an upper triangle matrix with the size m x n.

* **Q is an orthogonal (Q<sup>T</sup> Q = I) or unitary matrix** (Q ∗ Q = I) and **R is an upper triangular matrix**. The QR decomposition is a special case of the [Iwasawa decomposition](https://en.m.wikipedia.org/wiki/Iwasawa_decomposition).

* The QR decomposition is found using an iterative numerical method that can fail for those matrices that cannot be decomposed, or decomposed easily.

* Like the LU decomposition, the QR decomposition is often used to solve systems of linear equations, although is not limited to square matrices.

* By default, the qr function returns the Q and R matrices with smaller or ‘reduced’ dimensions that is more economical. We can change this to return the expected sizes of m x m for Q and m x n for R by specifying the mode argument as ‘complete’, although this is not required for most applications.

Such a decomposition always exists and can be calculated using various algorithms. The best known are

* [Householder transformations](https://de.m.wikipedia.org/wiki/Householdertransformation)
* [Givens rotations](https://de.m.wikipedia.org/wiki/Givens-Rotation)
* [Gram-Schmidtsch's orthogonalization method](https://de.m.wikipedia.org/wiki/Gram-Schmidtsches_Orthogonalisierungsverfahren)

**Define Matrix**

In [None]:
from numpy import array

# define a 3x2 matrix
A = array([[1, 2], [3, 4], [5, 6]])
print(A)

[[1 2]
 [3 4]
 [5 6]]


**Decompose**

In [None]:
# QR decomposition
from numpy.linalg import qr
Q, R = qr(A, 'complete')

In [None]:
print(Q)

[[-0.16903085  0.89708523  0.40824829]
 [-0.50709255  0.27602622 -0.81649658]
 [-0.84515425 -0.34503278  0.40824829]]


In [None]:
print(R)

[[-5.91607978 -7.43735744]
 [ 0.          0.82807867]
 [ 0.          0.        ]]


**Reconstruct**

In [None]:
B = Q.dot(R)
print(B)

[[1. 2.]
 [3. 4.]
 [5. 6.]]


###### <font color="blue">**Factorization (Matrix Decomposition) for Eigenvalues: Eigendecomposition (spectral decomposition)**

[Summary of Eigendecomposition](https://en.m.wikipedia.org/wiki/Matrix_decomposition#Decompositions_based_on_eigenvalues_and_related_concepts)

See also article about [Eigenvalue algorithms (Overview & List)](https://en.m.wikipedia.org/wiki/Eigenvalue_algorithm) and [List of Eigenvalue Algorithms](https://en.m.wikipedia.org/wiki/List_of_numerical_analysis_topics#Eigenvalue_algorithms)

* [Eigendecomposition](https://en.m.wikipedia.org/wiki/Eigendecomposition_of_a_matrix) or sometimes spectral decomposition is the factorization of a matrix into a canonical form, whereby the matrix is represented in terms of its eigenvalues and eigenvectors. Only diagonalizable matrices can be factorized in this way.

* Suppose that we want to compute the eigenvalues of a given matrix. If the matrix is small, we can compute them symbolically using the characteristic polynomial. However, this is often impossible for larger matrices, in which case we must use a numerical method. In practice, eigenvalues of large matrices are not computed using the characteristic polynomial. Therefore, general algorithms to find eigenvectors and eigenvalues are iterative.

  * Iterative numerical algorithms for approximating roots of polynomials exist, such as **Newton's method**, but in general it is impractical to compute the characteristic polynomial and then apply these methods. One reason is that small round-off errors in the coefficients of the characteristic polynomial can lead to large errors in the eigenvalues and eigenvectors: the roots are an extremely ill-conditioned function of the coefficients.

  * A simple and accurate iterative method is the [power iteration method](https://en.m.wikipedia.org/wiki/Power_iteration): a random vector v is chosen and a sequence of unit vectors is computed as $\frac{\mathbf{A} \mathbf{v}}{\|\mathbf{A} \mathbf{v}\|}, \frac{\mathbf{A}^{2} \mathbf{v}}{\left\|\mathbf{A}^{2} \mathbf{v}\right\|}, \frac{\mathbf{A}^{3} \mathbf{v}}{\left\|\mathbf{A}^{3} \mathbf{v}\right\|}, \ldots$. This sequence will almost always converge to an eigenvector corresponding to the eigenvalue of greatest magnitude, provided that v has a nonzero component of this eigenvector in the eigenvector basis (and also provided that there is only one eigenvalue of greatest magnitude). **This simple algorithm is useful in some practical applications; for example, Google uses it to calculate the page rank of documents in their search engine.**
  
  * Also, the power method is the starting point for many more sophisticated algorithms. For instance, by keeping not just the last vector in the sequence, but instead looking at the span of all the vectors in the sequence, one can get a better (faster converging) approximation for the eigenvector, and this idea is the basis of Arnoldi iteration. Alternatively, the important QR algorithm is also based on a subtle transformation of a power method.

  * Once the eigenvalues are computed, the eigenvectors could be calculated by solving the equation $\left(\mathbf{A}-\lambda_{i} \mathbf{I}\right) \mathbf{v}_{i, j}=\mathbf{0}$ using Gaussian elimination or any other method for solving matrix equations.

* However, in practical large-scale eigenvalue methods, the eigenvectors are usually computed in other ways, as a byproduct of the eigenvalue computation. In power iteration, for example, the eigenvector is actually computed before the eigenvalue (which is typically computed by the Rayleigh quotient of the eigenvector). In the QR algorithm for a Hermitian matrix (or any normal matrix), the orthonormal eigenvectors are obtained as a product of the Q matrices from the steps in the algorithm. (For more general matrices, the QR algorithm yields the Schur decomposition first, from which the eigenvectors can be obtained by a backsubstitution procedure.) For Hermitian matrices, the Divide-and-conquer eigenvalue algorithm is more efficient than the QR algorithm if both eigenvectors and eigenvalues are desired.

https://en.m.wikipedia.org/wiki/Iterative_method

https://en.m.wikipedia.org/wiki/Power_iteration

* The power iteration method is especially suitable for sparse matrices

* Some of the more advanced eigenvalue algorithms can be understood as variations of the power iteration. For instance, the inverse iteration method applies power iteration to the matrix $A^{-1}$

https://en.m.wikipedia.org/wiki/PageRank

###### <font color="blue">**Factorization (Matrix Decomposition) for Eigenvalues: Schur Decomposition**

Schur decomposition

https://de.m.wikipedia.org/wiki/Schur-Zerlegung

Real Schur decomposition

QZ decomposition (Generalized Schur)

https://en.m.wikipedia.org/wiki/Matrix_decomposition#Schur_decomposition

###### <font color="blue">**Factorization (Matrix Decomposition) for Eigenvalues: Singular-Value Decomposition (SVD)**

https://towardsdatascience.com/understanding-singular-value-decomposition-and-its-application-in-data-science-388a54be95d

singular value decomposition can be used to compute the moore-penrose-inverse (to solvw linear equations)

* Matrix decomposition, also known as matrix factorization, involves describing a given matrix using its constituent elements.

* Perhaps the most known and widely used matrix decomposition method is the Singular-Value Decomposition, or SVD. All matrices have an SVD, which makes it more stable than other methods, such as the eigendecomposition. As such, it is often used in a wide array of applications including compressing, denoising, and data reduction.

* **The Singular-Value Decomposition, or SVD for short, is a matrix decomposition method for reducing a matrix to its constituent parts in order to make certain subsequent matrix calculations simpler.**

* For the case of simplicity we will focus on the SVD for real-valued matrices and ignore the case for complex numbers.

> A = U . Sigma . V^T

* Where A is the real m x n matrix that we wish to decompose, U is an m x m matrix, Sigma (often represented by the uppercase Greek letter Sigma) is an m x n diagonal matrix, and V^T is the  transpose of an n x n matrix where T is a superscript.

* The diagonal values in the Sigma matrix are known as the singular values of the original matrix A. The columns of the U matrix are called the left-singular vectors of A, and the columns of V are called the right-singular vectors of A.

* The SVD is calculated via iterative numerical methods. We will not go into the details of these methods. Every rectangular matrix has a singular value decomposition, although the resulting matrices may contain complex numbers and the limitations of floating point arithmetic may cause some matrices to fail to decompose neatly.

* The singular value decomposition (SVD) provides another way to factorize a matrix, into singular vectors and singular values. The SVD allows us to discover some of the same kind of information as the eigendecomposition. However, the SVD is more generally applicable.

* The SVD is used widely both in the calculation of other matrix operations, such as matrix inverse, but also as a data reduction method in machine learning. SVD can also be used in least squares linear regression, image compression, and denoising data.

* The SVD can be calculated by calling the svd() function. The function takes a matrix and returns the U, Sigma and V^T elements. The Sigma diagonal matrix is returned as a vector of singular values. The V matrix is returned in a transposed form, e.g. V.T.

**Define a Matrix**

In [None]:
from numpy import array
A = array([[1, 2], [3, 4], [5, 6]])
print(A)

[[1 2]
 [3 4]
 [5 6]]


**Decompose**

In [None]:
# Calculate Singular-Value Decomposition
from scipy.linalg import svd
U, s, VT = svd(A)

In [None]:
print(U)

[[-0.2298477   0.88346102  0.40824829]
 [-0.52474482  0.24078249 -0.81649658]
 [-0.81964194 -0.40189603  0.40824829]]


In [None]:
print(s)

[9.52551809 0.51430058]


In [None]:
print(VT)

[[-0.61962948 -0.78489445]
 [-0.78489445  0.61962948]]


**Reconstruct**

* The original matrix can be reconstructed from the U, Sigma, and V^T elements.
* The U, s, and V elements returned from the svd() cannot be multiplied directly.
* The s vector must be converted into a diagonal matrix using the diag() function. By default, this function will create a square matrix that is n x n, relative to our original matrix. This causes a problem as the size of the matrices do not fit the rules of matrix multiplication, where the number of columns in a matrix must match the number of rows in the subsequent matrix.
* After creating the square Sigma diagonal matrix, the sizes of the matrices are relative to the original m x n matrix that we are decomposing, as follows:

> U (m x m) . Sigma (n x n) . V^T (n x n)

* Where, in fact, we require:

> U (m x m) . Sigma (m x n) . V^T (n x n)

* We can achieve this by creating a new Sigma matrix of all zero values that is m x n (e.g. more rows) and populate the first n x n part of the matrix with the square diagonal matrix calculated via diag().

In [None]:
from numpy import diag
from numpy import dot
from numpy import zeros

# create m x n Sigma matrix
Sigma = zeros((A.shape[0], A.shape[1]))

# populate Sigma with n x n diagonal matrix
Sigma[:A.shape[1], :A.shape[1]] = diag(s)

# reconstruct matrix
B = U.dot(Sigma.dot(VT))
print(B)

[[1. 2.]
 [3. 4.]
 [5. 6.]]


The above complication with the Sigma diagonal only exists with the case where m and n are not equal. The diagonal matrix can be used directly when reconstructing a square matrix, as follows.

In [None]:
# Reconstruct SVD
from numpy import array
from numpy import diag
from numpy import dot
from scipy.linalg import svd

# define a matrix
A = array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(A)
# Singular-value decomposition
U, s, VT = svd(A)
# create n x n Sigma matrix
Sigma = diag(s)
# reconstruct matrix
B = U.dot(Sigma.dot(VT))
print(B)

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[1. 2. 3.]
 [4. 5. 6.]
 [7. 8. 9.]]


###### <font color="blue">**Factorization (Matrix Decomposition) for Eigenvalues: Weitere Verfahren**

*Numerische Verfahren zur Berechnung von Eigenwerten*

https://de.m.wikipedia.org/wiki/Liste_numerischer_Verfahren#Berechnung_von_Eigenwerten

* QR-Algorithmus: Berechnung aller Eigenwerte, allerdings mit hohen Kosten verbunden.

* LU-Algorithmus: Auch Treppeniteration genannt, Vorläufer des QR-Verfahrens, aber weniger zuverlässig.

* Potenzmethode: Diese erlaubt die Berechnung des betragsgrößten Eigenwertes.

* Unterraumiteration: Diese ist eine mehrdimensionale Erweiterung der Potenzmethode und erlaubt die gleichzeitige Berechnung mehrerer der betragsgrößten Eigenwerte.

* Inverse Iteration: Diese erlaubt die schnelle Berechnung von Eigenwerten nahe einem Shift.

* Rayleigh-Quotienten-Iteration: Eine spezielle sehr schnell konvergierende Variante der Inversen Iteration mit Shift.

* Lanczos-Verfahren: Berechnung einiger Eigenwerte von großen dünnbesetzten Matrizen.

* Arnoldi-Verfahren: Berechnung einiger Eigenwerte von großen dünnbesetzten Matrizen.

* Jacobi-Verfahren: Berechnung aller Eigenwerte und Eigenvektoren von kleinen symmetrischen Matrizen.

* Jacobi-Davidson-Verfahren: Berechnung einiger Eigenwerte von großen dünnbesetzten Matrizen.

* Folded Spectrum Method (Spektrumsfaltung): Berechnung eines Eigenwertes und des zugehörigen Eigenvektors nahe einem Shift (aus der Mitte des Spektrums).

**Overview**

* Not to be confused with Matrix factorization of a polynomial.
* In the mathematical discipline of linear algebra, a matrix decomposition or matrix factorization is a factorization of a matrix into a product of matrices. 

* There are many different matrix decompositions; each finds use among a particular class of problems.

###### <font color="blue">**Factorization (Matrix Decomposition) for other decompositions**

https://en.m.wikipedia.org/wiki/Matrix_decomposition#Other_decompositions

###### <font color="blue">**Factorization (Matrix Decomposition) for Recommender Systems (large matrices)**

There are plenty of papers and articles out there talking about the use of matrix factorization for collaborative filtering. We can use Principal Component Analysis (PCA), Probabilistic Matrix Factorization (PMF), SVD, or NMF matrix decomposition techniques, depending on the specific use case. (https://heartbeat.fritz.ai/applications-of-matrix-decompositions-for-machine-learning-f1986d03571a)

https://towardsdatascience.com/various-implementations-of-collaborative-filtering-100385c6dfe0

https://en.m.wikipedia.org/wiki/Matrix_factorization_(recommender_systems)

https://en.m.wikipedia.org/wiki/Collaborative_filtering

In recent years a number of neural and deep-learning techniques have been proposed. **Some generalize traditional Matrix factorization algorithms via a non-linear neural architecture,** or leverage new model types like Variational Autoencoders.

Neural Collaborative Filtering: https://dl.acm.org/doi/10.1145/3038912.3052569

###### <font color="blue">**Principal component analysis**

https://en.m.wikipedia.org/wiki/Principal_component_analysis

###### <font color="blue">**Non-negative matrix factorization**

SVD vs NMF (In SVD, we decompose our matrices with the constraint that resultant matrices are orthogonal. Rather than constraining our factors to be orthogonal, another idea would be to constrain them to be non-negative): https://heartbeat.fritz.ai/applications-of-matrix-decompositions-for-machine-learning-f1986d03571a

* [Non-negative matrix factorization](https://en.m.wikipedia.org/wiki/Non-negative_matrix_factorization) (NMF or NNMF), also non-negative matrix approximation is a **group of algorithms** in multivariate analysis and linear algebra where a matrix V is factorized into (usually) two matrices W and H, with the property that all three matrices have no negative elements. 

* This non-negativity makes the resulting matrices easier to inspect. Also, in applications such as processing of audio spectrograms or muscular activity, non-negativity is inherent to the data being considered. 

* Since the problem is not exactly solvable in general, it is commonly approximated numerically.

![NNMF](https://upload.wikimedia.org/wikipedia/commons/f/f9/NMF.png)

*Illustration of approximate non-negative matrix factorization: the matrix V is represented by the two smaller matrices W and H, which, when multiplied, approximately **reconstruct V**.*

###### <font color="blue">**Sehr grosse, dünnbesetzte Matrizen**

* In der [numerischen Mathematik](https://de.m.wikipedia.org/wiki/Numerische_Mathematik) bezeichnet man als [dünnbesetzte oder schwachbesetzte Matrix (englisch sparse matrix)](https://de.m.wikipedia.org/wiki/Dünnbesetzte_Matrix) eine Matrix, bei der so viele Einträge aus Nullen bestehen, dass man nach Möglichkeiten sucht, dies insbesondere hinsichtlich Algorithmen sowie Speicherung auszunutzen.

* Die Diskretisierung von partiellen Differentialgleichungen führt meistens auf dünnbesetzte Matrizen, etwa auf Bandmatrizen, ebenfalls die Darstellung von vielen typischen Graphen (bei beschränktem Knotengrad, Planarität o. Ä.) über ihre Adjazenzmatrix. 

* Zu beachten ist, dass die Inverse einer dünnbesetzten Matrix im Regelfall vollbesetzt ist, ebenso wie die LR-Zerlegung. Eine Ausnahme bilden dabei die Bandmatrizen, bei denen eine solche Zerlegung ebenfalls dünnbesetzt sein kann.

* Dünnbesetzte Matrizen haben die Eigenschaft, dass sie effizient abgespeichert werden können, indem man nur Position und Wert der Nicht-Null-Einträge abspeichert. Die Position der Nichtnulleinträge wird auch als Besetzungsstruktur oder Sparsity Pattern bezeichnet. Die Auswertung eines dünnbesetzten Matrix-Vektor-Produkts kann ebenfalls effizient erfolgen, indem die Nullen in der Berechnung des Produkts nicht berücksichtigt werden.



https://de.m.wikipedia.org/wiki/Dünnbesetzte_Matrix

[Krylow-Unterraum-Verfahren](https://de.m.wikipedia.org/wiki/Krylow-Unterraum-Verfahren): Moderne iterative Verfahren, die für große, dünnbesetzte Gleichungssysteme gedacht sind. Wichtiger Spezialfall für symmetrisch positiv definite Probleme ist das Verfahren der [konjugierten Gradienten](https://de.m.wikipedia.org/wiki/CG-Verfahren). Krylow-Unterraum-Verfahren sind iterative Verfahren zum Lösen großer, dünnbesetzter linearer Gleichungssysteme, wie sie bei der Diskretisierung von partiellen Differentialgleichungen entstehen, oder von Eigenwertproblemen.

#### **Eigenwertproblem**

###### <font color="blue">**Skalar & Determinante**

*Determinante*

* **Die Determinante ist das Produkt der Eigenwerte** (und Hauptdiagonalelemente / spur ist die summe der eigenwerte)

* nur für quadratische Matrizen

**Lineare Abhängigkeit von Vektoren = kein Volumen oder Fläche = Determinante gleich Null = Eigenwert existiert**

  * lineare Abhängigkeit: **die Determinante ist null, wenn die beiden Vektoren  v  und  w  linear abhängig sind**. Es kann zB keine Flache zwischen den Vektoren aufgespannt werden, weil sie sich auf derselben Linie befinden. Es existiert dann minestens ein Eigenwert und Rand < n.
  
  (daher gleich null fur eigenwerte, weil die eigenvektoren orthogonal zueinander sind)

  * Rang kleiner n (kein voller Rang - eine Zeile/Spalte nur aus Nullen besteht): Es gilt, dass die Determinante einer Matrix genau dann 0 ist, wenn ihr Rang kleiner n ist. Hat eine Matrix Determinante 0, so hat sie nicht vollen Rang.

  * Eine **quadratische Matrix A besitzt einen Kern, wenn ihre Determinante gleich Null ist**. Wäre die Determinante der quadratischen Matrix A ungleich Null, so enthielte der Kern der Matrix nur den Nullvektor.

  * zwei Zeilen/Spalten gleich sind

  * es existieren Eigenwerte (eine Zeile/Spalte ist eine Linearkombination anderer Zeilen/Spalten)








**Determinante nicht gleich Null**

  * Matrix invertierbar: Die Determinante einer Matrix A ist genau dann ungleich Null, wenn A invertierbar ist (“invertierbar” und “regulär” ist äquivalent)

  *  Gleichungssystem ist  eindeutig lösbar (wenn die Determinante der Koeffizientenmatrix ungleich null ist).

  * es gibt keine Eigenwerte

**Determinanten, Rang & Eigenwert**

* Ausführliches zur Rangberechnung gibt es hier (link), kurz zusammengefasst noch einmal, der Rang ist die Anzahl linear unabhängiger Zeilen- oder Spaltenvektoren einer Matrix. Bei einer quadratischen (n×n)-Matrix bedeutet dies, er ist höchstens n. 

* **Es gilt, dass die Determinante einer Matrix genau dann 0 ist, wenn ihr Rang kleiner n ist.**

* Im Zwei- oder Dreidimensionalen haben wir sogar eine anschauliche Begründung aus dem vorigen Abschnitt, **hier berechnet die Determinante die Fläche des aufgespannten Parallelogramms beziehungsweise das Volumen des Parallelpetids**. 

> **Sind im ℝ2 die zwei Vektoren linear abhängig, so spannen diese eben keine Fläche auf (sondern nur eine Linie).**

* Ebenso fehlt bei drei Vektoren umgangssprachlich gesagt, zum Beispiel "die Höhe" (in die dritte Dimension), das Volumen des aufgespannten Parallelpetids ist daher Null.

* Determinanten und Eigenwerte
In der linearen Algebra gibt es den Satz, dass die Determinante einer Matrix A genau das Produkt der Eigenwerte λi beträgt. 

> Eng verwandt mit der vorigen Aussage ist die folgende: **Hat eine Matrix Determinante 0 so ist mindestens ein Eigenwert 0 und umgekehrt**. Das hat natürlich zur Folge, dass in Kombination mit dem Begriff des Ranges gilt, ist der Rang einer (n×n)-Matrix kleiner n so hat sie mindestens einen Eigenwert gleich 0 und umgekehrt.

![ggg](https://raw.githubusercontent.com/deltorobarba/repo/master/eigenwert_determinante.png)

https://www.mathematik.de/algebra/74-erste-hilfe/algebra/matrizen/2427-folgerungen-aus-und-folgerungen-für-die-determinante

* zB Flächeninhalt bestimmen: zwei positiv orientierte Vektoren  ( v , w ) erzeugen das Dreieck  0 ,  v ,  w  mit dem Flächeninhalt  F = 1

* Eine [Determinante](https://de.m.wikipedia.org/wiki/Determinante) ist eine spezielle Funktion, eine Zahl (ein [Skalar](https://de.m.wikipedia.org/wiki/Skalar_(Mathematik))), die einer **quadratischen Matrix** eine Zahl zuordnet.

* Diese Zahl gibt Auskunft über einige Eigenschaften der Matrix:

  * Sie gibt an, wie sich das **Volumen** bei der durch die Matrix beschriebenen linearen Abbildung ändert (**Faktor der Flachen- bzw. Volumenanderung**).
  
  * <u>**det A = 4 bedeutet zB dass die Matrix den Flächeninhalt stets vervierfacht** (angefangen bei der Orthonormal-Basis</u>.
  
  * Die Determinante einer Matrix ( oder ) gibt an, wie sich das Volumen einer aus Eckpunkten zusammengesetzten Geometrie skaliert, wenn diese durch die Matrix abgebildet wird. Ist die Determinante negativ, so ändert sich zusätzlich die Orientierung der Eckpunkte.

  * Mit Hilfe von Determinanten kann man beispielsweise feststellen, ob ein lineares Gleichungssystem eindeutig lösbar ist, und kann die Lösung mit Hilfe der [Cramerschen Regel](https://de.m.wikipedia.org/wiki/Cramersche_Regel) explizit angeben. **Das Gleichungssystem ist genau dann eindeutig lösbar, wenn die Determinante der Koeffizientenmatrix ungleich null ist**. 

    * Die Cramersche Regel oder Determinantenmethode ist eine mathematische Formel für die Lösung eines linearen Gleichungssystems. Sie ist bei der theoretischen Betrachtung linearer Gleichungssysteme hilfreich. 
    
    * Für die Berechnung einer Lösung ist der Rechenaufwand jedoch in der Regel zu hoch, da dabei verhältnismäßig viele Determinanten auftreten. Deshalb kommen dazu andere [Verfahren aus der numerischen Mathematik](https://de.m.wikipedia.org/wiki/Liste_numerischer_Verfahren#Lineare_Gleichungssysteme) zum Einsatz.
  
  * Entsprechend ist eine quadratische Matrix mit Einträgen aus einem Körper genau dann **invertierbar**, wenn ihre Determinante ungleich null ist.

  * Schreibt man $n$ Vektoren im $\mathbb {R} ^{n}$ als Spalten einer quadratischen Matrix, so kann die Determinante dieser Matrix gebildet werden. Bilden bei dieser Festlegung die $n$ Vektoren eine Basis, so kann das Vorzeichen der Determinante dazu verwendet werden, die **Orientierung** von euklidischen Räumen zu definieren. Der Absolutbetrag dieser Determinante entspricht zugleich dem **Volumen** des n-Parallelotops (auch Spat genannt), das durch diese Vektoren aufgespannt wird.
  
  * Eine weitere wichtige Anwendung ist die Berechnung des charakteristischen Polynoms und damit der Eigenwerte der Matrix.

  *  Allgemeiner kann man jeder linearen Selbstabbildung [(Endomorphismus) eine Determinante](https://de.m.wikipedia.org/wiki/Determinante#Determinante_eines_Endomorphismus) zuordnen. (Da ähnliche Matrizen die gleiche Determinante haben, kann man die Definition der Determinante von quadratischen Matrizen auf die durch diese Matrizen dargestellten linearen Selbstabbildungen (Endomorphismen) übertragen.)


*Loesung*

* Es gibt geschlossene Formeln zur Berechnung der Determinanten, wie den Laplace’schen Entwicklungssatz oder die [Leibniz-Formel](https://de.m.wikipedia.org/wiki/Determinante#Leibniz-Formel). Diese Formeln sind jedoch eher von theoretischem Wert, da ihr Aufwand bei größeren Matrizen stark ansteigt. 

* In der Praxis kann man Determinanten am leichtesten berechnen, indem man die Matrix mit Hilfe des [Gauß-Algorithmus](https://de.m.wikipedia.org/wiki/Gau%C3%9Fsches_Eliminationsverfahren) in obere oder untere Dreiecksform bringt, die Determinante ist dann einfach das Produkt der [Hauptdiagonalelemente](https://de.m.wikipedia.org/wiki/Hauptdiagonale).

  * Will man das Lösen eines quadratischen eindeutig lösbaren Gleichungssystems Ax=b als Computerprogramm umsetzen, bietet es sich an, den Gaußalgorithmus als [LR-Zerlegung (auch LU-Zerlegung oder Dreieckszerlegung genannt)](https://de.m.wikipedia.org/wiki/Gau%C3%9Fsches_Eliminationsverfahren#LR-Zerlegung) zu interpretieren.

* Eine Alternative hierzu ist der [Gauß-Jordan-Algorithmus](https://de.m.wikipedia.org/wiki/Gau%C3%9F-Jordan-Algorithmus), bei dem nicht nur die unteren Teile eliminiert werden, sondern auch die oberen, so dass eine Diagonalform entsteht, bei der dann der oben genannte zweite Schritt entfällt.



*Schreibweisen*

Übliche Schreibweisen für die Determinante einer quadratischen Matrix $A$ sind $\operatorname{det}(A), \operatorname{det} A$ oder $|A|$. Zum Beispiel kann die Determinante einer $2 \times 2$ -Matrix

>$
A=\left(\begin{array}{ll}
a & c \\
b & d
\end{array}\right)
$

mit der Formel berechnet werden:

>$
\operatorname{det} A=\left|\begin{array}{ll}
a & c \\
b & d
\end{array}\right|=a d-b c
$

*Die 2x2-Determinante **ist gleich dem orientierten Flächeninhalt** des von ihren Spaltenvektoren aufgespannten Parallelogramms*

![ggg](https://upload.wikimedia.org/wikipedia/commons/thumb/a/ad/Area_parallellogram_as_determinant.svg/440px-Area_parallellogram_as_determinant.svg.png)

*Skalar*

https://de.m.wikipedia.org/wiki/Skalar_(Mathematik)

###### <font color="blue">**Eigenwertproblem**

**Eigenwertproblem & charakteristisches Polynom ("Eigen~" hat immer was mit Stabilität zu tun)**

Es sei eine quadratische Matrix $A$ gegeben. Die Suche nach einem Vektor $v \neq 0$ und einer Zahl $\lambda$
sodass folgende Gleichung erfüllt ist, nennt man Eigenwertproblem:

>$
A \cdot v=\lambda \cdot v
$

*Man wendet eine Matrix als Transformation an einen Vektor an, und dieser Vektor wird nur verlangert und verkurzt (und bleibt gleich), aber verandert nicht seine Richtung. Z.B. die Hauptachse bei einer Rotation*.

* $A$ is the matrix representing some transformation
* Den Faktor $\lambda$  nennt man dann den zugehörigen **Eigenwert** (reell oder komplex), 
* der Vektor $v$ heißt dann **Eigenvektor** (darf nicht der Nullvektor sein). 
* Die Menge der Eigenwerte einer Matrix wird als **Spektrum** der Matrix bezeichnet.

Matrix-Vector-Multiplication $
A \cdot v$ gives same result as just scaling the Eigenvector $\lambda \cdot v$. 

**Calculating via determinant: The tweaked transformation squishes space into a lower dimension.** (Daher muss rang < n sein)!)

![ggg](https://raw.githubusercontent.com/deltorobarba/repo/master/eigenwert_determinante.png)

**Charakteristika von Eigenwerten**

* Die Multiplikation einer Matrix  mit einem Vektor ergibt wieder einen Vektor. **Für quadratische Matrizen gibt es bestimmte Vektoren, die man an die Matrix multiplizieren kann, sodass man den selben Vektor als Ergebnis erhält, nur mit einem Vorfaktor multipliziert**. Einen solchen Vektor nennt man Eigenvektor  und der Vorfaktor heißt Eigenwert einer Matrix.

* Ein rotierender Körper ohne äußere Kräfte verbleibt in seiner Bewegung, wenn er um seine **Symmetrieachse** rotiert

* Some vectors are just stretched or squeezed out, but ramin on their span. they are called Eigenvectors, and the degree to which each of them got stretched during the transformation (=change of basis!) is called Eigenvalue.

* Wenn eine Basis aus Eigenvektoren existiert, so ist die Darstellungsmatrix bezüglich dieser Basis eine **Diagonalmatrix**

* im Fall des Trägheitstensors sind die Hauptträgheitsachsen dann eine **Basis aus Eigenvektoren**

* Aber nicht zu jeder Matrix existiert eine Basis aus Eigenvektoren

* eine solche Basis aus Eigenvektoren stets dann existiert, wenn die Matrix symmetrisch ist

* der nullvektor ist kein Eigenvektor, Null darf hingegen ein Eigenwert sein.

* Der **Eigenraum** zu einem Eigenwert besteht aus allen Eigenvektoren plus dem Nullvektor


Will man Eigenwerte berechnen, so ist es häufig nützlich, wenn man ein paar Eigenschaften darüber kennt. Daher sollen im Folgenden ein paar derer aufgezählt werden. Mit Kenntnis dieser Eigenschaften lassen sich häufig Eigenwerte bestimmen, ohne dabei viel rechnen zu müssen.

* Sei $\lambda$ ein Eigenwert der invertierbaren Matrix $A$ mit dem Eigenvektor $v$. Dann ist auch $\frac{1}{\lambda}$ ein Eigenwert der inversen Matrix von A zum Eigenvektor $v$,

* Seien $\lambda_{i}$ die Eigenwerte der Matrix $A \in \mathbb{C}^{n \times n}$. Dann gilt:

  1. $\sum_{i=1}^{n} \lambda_{i}=\operatorname{Spur}(A)$ (die Summe aller Eigenwerte ist die Spur)

  2. $\prod_{i=1}^{n} \lambda_{i}=\operatorname{det}(A)$ (das Produkt aller Eigenwerte ist die Determinante)

* Ist $\lambda$ ein Eigenwert einer Matrix $A$, so ist er auch ein Eigenwert der transponierten Matrix $A^{T}$ und umgekehrt. Das Spektrum von $A$ stimmt also mit dem Spektrum der Transponierten $A^{T}$ überein.

* Jeder Eigenwert einer reellen symmetrischen Matrix ist reell. Im Allgemeinen können aber
auch komplexe Eigenwerte durchaus auftreten.

**Praktische Beispiele fur Eigenvektoren** (aus [diesem Video](https://www.youtube.com/watch?app=desktop&v=9P__qyOAPCg))

Eigenvektor: Vektoren, die bei einer Transformation mit einer Matrix ihre Richtung nicht ändern. 

* Z.B. Rotationen um eine Achse = Achse bleibt fest und ist Eigenvektor (bei einfachen Rotationen Eigenwert = 1). 

* in mechanik: trägheitsmoment gegenüber rotationen. Hauptachsen mit Tensorrechnung. die hauptachsen sind diejenigen richtungen, in die die drehungen stabile verlaufen. drehimpuls und winkelgeschwindigkeit haben gleiche richtung. keine schwankungen der drehachsen, sie sind stabil. (https://www.grund-wissen.de/physik/mechanik/kinematik/kreisfoermige-bewegungen.html)

* In der Theorie der elastischen Körper gibt es die Möglichkeit die Deformationen von Körpern aufzuteilen in Scherungen und Schubspannungen und Streckungen, und das fuhrt auch zu einer Hauptachsentransformation.

* Oder Hauptachsentransformation (=entlang derer die Eigenvektoren liegen) bei Bildbearbeitung: wenn Bild in eine Richtung verzerrt ist, kann man es entzerren., wenn man Verzerrungsrichtung findet.

Wenn man die Transformation auf diese Hauptachsen macht, dann ist die ganze Abbildung nur noch eine Diagonalmatrix (und keine Nebendiagonalelemente mehr). Mit solchen Matrizen kann man sehr einfach rechnen. Nennt man dann Hauptachsentransformation (=Hauptachsen sind Eigenvektorrichtungen). 

* Stabilitätsprobleme: suche nach Eigenwerten (wirschaftssysteme, wettervorhersage). Zw 2 geschäften wandern kunden hin und her. Will man verhindern dass kunden komplett abwandern in ein geschäft, sucht man eigenwerte. 

* Physik: kopplung von schwingungen bei 2 objekten. Eigenschwingung des systems wenn bei parallel oder antiparallel schwingen.

* Quantenmechanik: hermetische Operatoren. Diese führen zu Eigenwerten und Eigenvektoren. 

	* Interessant ist bei solchen Operatoren bzw. bei den linearen Abbildungen bei den symmetrischen Matrizen im Reellen: Eigenvektoren stehen im reellen senkrecht aufeinander. (Bilden eine Orthonormalbasis). 

	* Man kann Vektorraum mit diesen Eigenvektoren aufspannen und jeden Vektor als Linearkombination dieser Eigenvektoren darstellen.

	* **Dann ist das Verhalten der Abbildungen quasi reduziert auf das Verhalten der Eigenvektoren mit ihren entsprechenden Eigenwerten, so dass dann jeder Vektor wenn man ihn in die Basis der Eigenvektoren schreibt, relativ einfach transformiert werden kann**, indem man einfach die entsprechenden Eigenvektor-Skalierungen beachtet und später die Summe immer wieder bildet (ist ja alles linear).

Spezielle Vektoren der Quantenmechanik:

* Hamilton-Operator (Energie-Operator): Die Eigenzustaende dieses Energieoperators sind dann die Energiezustaende, die stabil sind. In der Atomphysik sind das dann die Zustande, die die Elektronen in den Orbitalen beschreiben

* Genauso gibt es Eigenvektoren zu den Drehimpuls-Operatoren (und zu anderen Dingen). Hier kommt Eigenwert-Theorie zum blühen. Die entsprechende Orthonormal-Basis ist dann auch die Basis in der man jede beliebigen Zustand des Systems beschreiben kann. 

**Beispiele, warum man Eigenvektoren und Eigenwerte in der Praxis braucht:**

> eigenvektoren = orthonormalbasis, man kann alle andere vektoren (und damit lösungen) daraus rekonstruieren (ist das so korrekt??)

> Zum Beispiel: A complex-valued square matrix $\mathrm{A}$ is normal (meaning $\mathrm{A}^{*} \mathrm{~A}=\mathrm{AA}^{*}$, where $\mathrm{A}^{*}$ is the conjugate transpose) if and only if it can be decomposed as $
\mathbf{A}=\mathbf{U} \mathbf{\Lambda} \mathbf{U}^{*}
$ where $\mathrm{U}$ is a unitary matrix (meaning $\mathrm{U}^{*}=\mathrm{U}^{-1}$ ) and $\boldsymbol{\Lambda}=\operatorname{diag}\left(\lambda_{1}, \ldots, \lambda_{n}\right)$ is a diagonal matrix. **The columns $\mathrm{u}_{1}, \ldots, \mathrm{u}_{n}$ of $\mathrm{U}$ form an orthonormal basis and are eigenvectors of $\mathrm{A}$ with corresponding eigenvalues $\lambda_{1}, \ldots, \lambda_{n}$.**

Wie berechnet man am einfachsten, den Zustand des Systems zu einem vorgegebenen Zeitpunkt $t_{k}$ in der ferneren Zukunft; sagen wir $k=1000 ?$

* Wir nehmen an, dass der Anfangszustand $\boldsymbol{v}_{0}$ ein Eigenvektor von $A$ zum Eigenwert $\lambda$ ist, d. h., es gilt $\boldsymbol{v}_{1}=A \boldsymbol{v}_{0}=\lambda \boldsymbol{v}_{0}$ 

* Erklarung: die Transformation (Multiplikation) eines Zustands mit dem Vektors ${v}_{0}$ mit einer Transition-Matrix $A$ in einen neuen Zustand ${v}_{1}$ ist das gleiche wie die Multiplikation des Vektors ${v}_{0}$ mit dem Eigenwert.

* Daraus ergibt sich $\boldsymbol{v}_{2}=A \boldsymbol{v}_{1}=\lambda A \boldsymbol{v}_{0}=\lambda^{2} \boldsymbol{v}_{0}$ und allgemein $
\boldsymbol{v}_{k}=A^{k} \boldsymbol{v}_{0}=\lambda^{k} \boldsymbol{v}_{0} \text { . }
$

* Wir haben damit eine geschlossene Formel für den Zustand $\boldsymbol{v}_{k}$, damit können wir also den Zustand des Systems zum Zeitpunkt $t_{k}=1000$ leicht bestimmen, $
v_{1000}=\lambda^{1000} v_{0}
$

Welches Langzeitverhalten hat das System? Beispielsweise erhebt sich die Frage, ob der komponentenweise zu verstehende Grenzwert $\lim _{k \rightarrow \infty} v_{k}$ existiert, ob die Einträge von $v_{k}$ über alle Grenzen wachsen, ob sie periodisch oszillieren, usw.

* Auch die zweite Frage wird dadurch beantwortet: Ist $|\lambda|<1$, so konvergiert $v_{k}$ komponentenweise gegen $\mathbf{0}=(0, \ldots, 0 .$ Ist $|\lambda|>1$, so wachsen die Komponenten von $v_{k}$ über alle Grenzen, wenn die entsprechende Komponente von $v_{0}$ nicht gerade gleich null ist. 

* $\operatorname{Im}$ Fall $\lambda=1$ ist die Folge stationär: $\boldsymbol{v}_{k}=\boldsymbol{v}_{0}$ für alle $k \in \mathbb{N}_{0} . \operatorname{Im}$ Fall $\lambda=-1$ oszilliert sie:
$v_{2 k}=v_{0}$ und $v_{2 k+1}=-v_{0}$.

**Kriterien fur die Existenz von Eigenwerten**

(*Wenn eine dieser Aussagen wahr ist, dann alle. Und wenn eine falsch, dann sind alle falsch*)

1. $\operatorname{rg}(B) < n$

2. $\operatorname{det}(B) = 0$ -> dieses Kriterium zu prufen ist am einfachsten und daher am haufigsten!

3. $B^{-1}$ existiert nicht

4. $B \vec{X}$ = 0 hat mehr als nur die Losung $\vec{x}$ = 0

5. $\lambda$ = 0 ist ein Eigenwert von $B$

**Die Determinante ist das Produkt der Eigenwerte, die Spur die Summe der Eigenwerte** 

(die Determinante ist null, wenn die beiden Vektoren  v  und  w  linear abhängig sind).

Der Zusammenhang zwischen Spur, Determinante und den Eigenwerten einer Matrix: 

Ist $A \in \mathbb{K}^{n \times n}$ und zerfällt das charakteristische Polynom von $A$ in seine $n$ Linearfaktoren, d. h.

* $
\chi_{A}=\left(\lambda_{1}-X\right) \cdots\left(\lambda_{n}-X\right)
$

* So gilt: $
\text { Sp } A=\lambda_{1}+\cdots+\lambda_{n}, \quad \text { det } A=\lambda_{1} \cdots \lambda_{n}
$



**Herleitung der Lösung des Eigenwertproblems**

Wie gelangt man zu dieser Berechnungsvorschrift? Dazu betrachten wir erst einmal das Eigenwertproblem, das es zu lösen gilt:

$
A \cdot v=\lambda \cdot v
$

Diese Gleichung lässt sich mithilfe der Einheitsmatrix $E_{n}$ umformulieren:

> $
\begin{array}{l}
A \cdot v-\lambda \cdot v=0 \\
\left(A-\lambda\right) \cdot v=0
\end{array}
$

**Problem: Man kann eine Matrix A nicht mit einer Zahl verknupfen, daher benutzt man die Einheitsmatrix $E_{n}$**

> $(A-\lambda E_{n}) \cdot v=0$

Gibt es nun eine Zahl $\lambda$ und einen Vektor $v$, sodass dieser durch Multiplikation mit der Matrix
$\left(A-\lambda E_{n}\right)$ auf den Nullvektor abgebildet wird, so ist diese Matrix nicht von vollem Rang und die Multiplikation mit einem Vektor nicht injektiv. Dass die Matrix $\left(A-\lambda E_{n}\right)$ keinen vollen Rang besitzt ist gleichbedeutend damit, dass ihre Determinante Null ist. Wenn es
also eine Lösung des Eigenwertproblems gibt, muss gelten:

$
\operatorname{det}\left(A-\lambda E_{n}\right)=0
$

Um das Eigenwertproblem zu lösen, müssen also die Nullstellen des charakteristischen
Polynoms

$
\chi_{A}(\lambda)=\operatorname{det}\left(A-\lambda E_{n}\right)
$

ermittelt werden, genau wie es der Algorithmus vorschreibt.

**Berechnung der Eigenwerte, Eigenräume und Eigenvektoren**

Es sei die $n \times n$ -Matrix $A$ vorgegeben und zu dieser wollen wir die Eigenwerte berechnen. Folgende Schritte musst du dabei durchführen. 

> Zum Beispiel fur die Matrix $A=\left(\begin{array}{lll}2 & 1 & 2 \\ 1 & 2 & 2 \\ 1 & 1 & 3\end{array}\right)$





1. Bilde die Matrix $\left(A-\lambda E_{n}\right)$. $E_{n}$ steht für die **Einheitsmatrix**. Du musst also in der Matrix $A$ auf der Diagonalen immer den Wert $\lambda$ abziehen.

> $\left(A-\lambda E_{n}\right)=\left(\begin{array}{lll}2 & 1 & 2 \\ 1 & 2 & 2 \\ 1 & 1 & 3\end{array}\right)-\left(\begin{array}{ccc}\lambda & 0 & 0 \\ 0 & \lambda & 0 \\ 0 & 0 & \lambda\end{array}\right)=\left(\begin{array}{ccc}2-\lambda & 1 & 2 \\ 1 & 2-\lambda & 2 \\ 1 & 1 & 3-\lambda\end{array}\right)$

2. Berechne die **Determinante** dieser Matrix. Diese nennt man das **charakteristische Polynom** $\chi_{A}(\lambda)=\operatorname{det}\left(A-\lambda E_{n}\right)$ der Matrix $A .$ Es ist ein Ausdruck in Abhängigkeit von $\lambda$.

> $\operatorname{det}\left(A-\lambda E_{n}\right)=\operatorname{det}\left(\begin{array}{ccc}2-\lambda & 1 & 2 \\ 1 & 2-\lambda & 2 \\ 1 & 1 & 3-\lambda\end{array}\right)$
$=(2-\lambda)^{2} \cdot(3-\lambda)+2+2-2 \cdot(2-\lambda)-2 \cdot(2-\lambda)-(3-\lambda)$
$=-\lambda^{3}+7 \lambda^{2}-11 \lambda+5$ **(=Polynom)**

3. Bestimme die Nullstellen des [**charakteristischen Polynoms**](https://de.m.wikipedia.org/wiki/Charakteristisches_Polynom) $\chi_{A}(\lambda)=0$. Das sind genau die gesuchten Eigenwerte der Matrix. (**weil dann die Determinante oben Null wird, und das ist was wir wollen**)

> Durch Ausprobieren erhalten wir schnell die erste Nullstelle $\lambda_{1}=1$. Klammern wir dann den Faktor $(\lambda-1)$ aus, erhalten wir:
$
-\lambda^{3}+7 \lambda^{2}-11 \lambda+5=(\lambda-1) \cdot\left(-\lambda^{2}+6 \lambda-5\right)
$

> Die restlichen Nullstellen sind also Nullstellen des Polynoms $-\lambda^{2}+6 \lambda-5 .$ Diese lassen sich mithilfe der [Mitternachtsformel](https://de.m.wikipedia.org/wiki/Quadratische_Gleichung#Lösungsformel_für_die_allgemeine_quadratische_Gleichung_(a-b-c-Formel)) bestimmen:
$
\lambda_{2,3}=\frac{-6 \pm \sqrt{36-20}}{-2}=3 \mp 2
$


> Somit lauten die drei Eigenwerte der $3 \times 3$ -Matrix $\lambda_{1}=\lambda_{2}=1, \lambda_{3}=5$.

Berechnung der Eigenwerte, Eigenräume und Eigenvektoren mit dem charakterischen Polynom, dass man wiederum mit der Determinante erklären kann

* Hat eine Matrix A nicht gerade Dreiecks- oder Diagonalgestalt, so bestimmt man im Allgemeinen die Eigenwerte von $A$ systematisch durch Berechnen der Nullstellen des charakteristischen Polynoms $\chi_{A}$ von $A$.

* Eigenwerte sind Nullstellen des charakteristischen Polynoms

* Eine Matrix $A \in \mathbb{K}^{n \times n}$ hat genau dann den Eigenwert $\lambda$, wenn das homogene lineare Gleichungssystem $\left(A-\lambda \mathbf{E}_{n}\right) v=\mathbf{0}$ eine Lösung $\boldsymbol{v} \neq \mathbf{0}$ besitzt.

* Achtung Das homogene lineare Gleichungssystem $\left(A-\lambda \mathrm{E}_{n}\right) v=0$ mit $\lambda \in \mathbb{K}$ hat auf jeder Fall die Lösung $v=0$ - unabhängig von $\lambda$. Wir sind aber gerade an den nichttrivialer Lösungen $v \neq 0$ interessiert. Wir suchen also die $\lambda \in \mathbb{K}$, für die solche nichttrivialer Lösungen existieren. Hierzu ist die Determinante das Mittel der Wahl.

* das homogene lineare Gleichungssystem  ( A - λ E n ) v = 0  genau dann eine Lösung  v ≠ 0, **wenn die Determinante der folgenden Koeffizientenmatrix des homogen linearen Gleichungssystems den Wert  0  hat. Und die Determinante ist null, wenn zwei Vektoren v und w linear abhängig sind**.
  
> $
\begin{array}{rcccc} 
& a_{11}-\lambda & a_{12} & \cdots & a_{1 n} \\
\left|\boldsymbol{A}-\lambda \mathbf{E}_{n}\right|=\mid & a_{21} & a_{22}-\lambda & & \vdots \\
& \vdots & & \ddots & \\
& a_{n 1} & \cdots & & a_{n n}-\lambda
\end{array}
$





Durch sukzessives Entwickeln dieser Determinante nach den ersten
Spalten und Zusammenfassen aller Terme mit der gleichen $\lambda$ -Potenz erhält man daraus eine Gleichung $n$ -ten Grades für $\lambda$,

$
\left(-1 \lambda^{n}+c_{n-1} \lambda^{n-1}+\ldots+c_{1} \lambda+c_{0}=0\right.
$ mit $c_{0}, c_{1}, \ldots, c_{n-1} \in \mathbb{K}$

Das Polynom

$
\begin{array}{rlr}
\chi_{A} & := & \left|A-X \mathbf{E}_{n}\right| \\
& =\left(-1 X^{n}+c_{n-1} X^{n-1}+\cdots+c_{1} X+c_{0} \in \mathbb{K}[X]\right.
\end{array}
$

vom Grad $n$ heißt charakteristisches Polynom der Matrix $A \in \mathbb{K}^{n \times n} .$ Es gilt:

$
\lambda \in \mathbb{K} \text { ist ein Eigenwert von } A \Leftrightarrow \chi_{A}(\lambda)=0 .
$

Die Matrix $A$ hat höchstens $n$ Eigenwerte.

**Eigenwerte sind eng mit Diagonalisierbarkeit und Matrizen  verbunden**

Kriterium für Diagonalisierbarkeit : 

Eine Matrix $A \in \mathbb{K}^{n \times n}$ ist genau dann diagonalisierbar, wenn es eine Basis $B$ des $\mathbb{K}^{n}$ aus Eigenvektoren von $A$ gibt.

Ist $B=\left(b_{1}, \ldots, b_{n}\right)$ eine geordnete Basis des $\mathbb{K}^{n}$ aus Eigenvektoren der Matrix $A$, so ist die Matrix

$
D=S^{-1} A S
$

mit $S=\left(\left(b_{1}, \ldots, b_{n}\right)\right)$ eine Diagonalmatrix.

Eigenwertproblem einfach erklart: https://www.youtube.com/watch?v=eJWgKvrhDmE

https://www.youtube.com/watch?v=PFDu9oVAE-g

![ggg](https://raw.githubusercontent.com/deltorobarba/repo/master/eigenvalue_01.png)

Useful for example to know the axis of rotation (where the Eigenvalue would be 1, since rotation is neither stretching nor squishing).

> Rotate $30^{\circ}$ around $\left[\begin{array}{l}2 \\ 3 \\ 1\end{array}\right]$ = $\left[\begin{array}{ccc}\cos (\theta) \cos (\phi) & -\sin (\phi) & \cos (\theta) \sin (\phi) \\ \sin (\theta) \cos (\phi) & \cos (\theta) & \sin (\theta) \sin (\phi) \\ -\sin (\phi) & 0 & \cos (\phi)\end{array}\right]$

![ggg](https://raw.githubusercontent.com/deltorobarba/repo/master/eigenvalue_02.png)

*Eigenvektor*

* Ein [Eigenvektor](https://de.m.wikipedia.org/wiki/Eigenwertproblem) einer Abbildung ist in der linearen Algebra ein vom Nullvektor verschiedener Vektor, dessen Richtung durch die Abbildung nicht verändert wird. 

* Ein Eigenvektor wird also nur skaliert und man bezeichnet den Skalierungsfaktor als Eigenwert der Abbildung.

* Eigenwerte charakterisieren wesentliche Eigenschaften linearer Abbildungen, etwa ob ein entsprechendes lineares Gleichungssystem eindeutig lösbar ist oder nicht. 

*Eigenraum*

* [Eigenraum](https://de.m.wikipedia.org/wiki/Eigenraum) ist ein Begriff aus der linearen Algebra. Er bezeichnet die lineare Hülle der Eigenvektoren zu einem bestimmten Eigenwert eines Endomorphismus. Die Eigenvektoren spannen damit einen Untervektorraum auf.

* Eine Verallgemeinerung des Eigenraums ist der Hauptraum. Hat ein Eigenwert die algebraische Vielfachheit 1, so sind für diesen Eigenwert Eigenraum und Hauptraum gleich.

###### <font color="blue">**Spur & Spektrum**

**Spur**

* Die Spur einer Matrix ist die Summe ihrer Eigenwerte

* Die [Spur](https://de.m.wikipedia.org/wiki/Spur_(Mathematik)) (Spurfunktion, Spurabbildung) ist ein Konzept in den mathematischen Teilgebieten der Linearen Algebra sowie der Funktionalanalysis und wird auch in der Theorie der Körper und Körpererweiterungen verwendet.

* In der linearen Algebra bezeichnet man als die Spur einer quadratischen $n\times n$ Matrix A über einem Körper K die Summe der Hauptdiagonalelemente dieser Matrix

$
A=\left(\begin{array}{cccc}
a_{11} & a_{12} & \cdots & a_{1 n} \\
a_{21} & a_{22} & \cdots & a_{2 n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{n 1} & a_{n 2} & \cdots & a_{n n}
\end{array}\right)
$

$
\operatorname{Spur}(A)=\sum_{j=1}^{n} a_{j j}=a_{11}+a_{22}+\cdots+a_{n n} \in K
$


$
\text { Gilt Spur }(A)=0 \text { , so bezeichnet man die Matrix } A \text { als spurfrei. }
$

Die Spur einer Matrix ist die **Summe ihrer Eigenwerte** (mit algebraischer Vielfachheit). Für diagonalisierbare Matrizen sind algebraische Vielfachheit und geometrische Vielfachheit identisch, so dass die Vielfachheit eines Eigenwertes der Anzahl seiner zugehörigen (linear unabhängigen) Eigenvektoren entspricht.

Unter der Spur dürfen Matrizen vertauscht werden.

Zwei zueinander ähnliche Matrizen haben die gleiche Spur. Die Spur ist somit invariant unter Basistransformationen.

https://de.m.wikipedia.org/wiki/Spektralsatz

https://de.m.wikipedia.org/wiki/Spurklasseoperator

https://en.m.wikipedia.org/wiki/Spectrum_(functional_analysis)

https://en.m.wikipedia.org/wiki/Spectral_theory

https://en.m.wikipedia.org/wiki/Operator_(physics)#Operators_in_quantum_mechanics

https://en.m.wikipedia.org/wiki/Mathematical_formulation_of_quantum_mechanics

https://de.m.wikipedia.org/wiki/Selbstadjungierter_Operator

https://de.m.wikipedia.org/wiki/Eigenmode

https://de.m.wikipedia.org/wiki/Resonanz

https://en.m.wikipedia.org/wiki/Hearing_the_shape_of_a_drum

https://en.m.wikipedia.org/wiki/Dirichlet_eigenvalue

https://youtu.be/Mx75Kiqyaik

**Spurklasseoperator (Spur in der Funktionalanalysis)**

Das Konzept der Spur in der linearen Algebra kann auch auf unendlichdimensionale Räume ausgedehnt werden. Falls diese existiert. Die Endlichkeit dieser Summe ist abhängig von der Wahl der Orthonormalbasis. Operatoren, für die dies immer der Fall ist (diese sind immer kompakt), also deren Spur über alle Orthonormalbasen endlich ist, werden Spurklasseoperatoren genannt.

In der Quantenmechanik beziehungsweise der Quantenstatistik verallgemeinert man den Begriff der Spur so, dass auch Operatoren erfasst werden, die keine Spurklasseoperatoren sind. Und zwar brauchen diese Operatoren, wie zum Beispiel der grundlegende Hamiltonoperator (Energie-Operator) $\mathcal {H}$ des Systems, nur selbstadjungiert zu sein. Sie besitzen dann eine [Spektraldarstellung](https://de.m.wikipedia.org/wiki/Spektralsatz) (Der Name leitet sich vom „Spektrum“ der Eigenwerte her).

* In der Quantenmechanik hat der Spektralsatz („Entwicklungssatz“) eine zentrale Bedeutung, da messbare physikalische Größen, sogenannte „Observablen“, durch selbstadjungierte Operatoren auf einem Hilbertraum dargestellt werden.

* Die möglichen Messwerte einer Observablen entsprechen ihrem Spektrum, welches in Punktspektrum (oder ${ }_{n}$ diskretes Spektrum") und kontinuierliches Spektrum zerfällt. Die Elemente des Punktspektrums werden auch Eigenwerte genannt. 

* Für eine diskrete Observable, d. h. eine Observable ohne kontinuierliches Spektrum, ist die Wahrscheinlichkeit, für einen gegebenen quantenmechanischen Zustand $|\psi\rangle$ den Messwert $\lambda_{j}$ zu erhalten, gegeben durch das Betragsquadrat des Skalarproduktes $\left\langle\phi_{j} \mid \psi\right\rangle$, wobei $\phi_{j}$ die Eigenfunktion zum Eigenwert $\lambda_{j}$ ist.



https://de.m.wikipedia.org/wiki/Spurklasseoperator

https://de.m.wikipedia.org/wiki/Spektralsatz

**Definition Spektrum**

[Spektraldarstellung](https://de.m.wikipedia.org/wiki/Spektralsatz): Der Name leitet sich vom „Spektrum“ der Eigenwerte her).

Das Spektrum eines Operators $T$ ist die Menge aller Elemente $\lambda$ des Zahlenkörpers (meistens die komplexen Zahlen), für die die Differenz des Operators mit dem $\lambda$ -fachen der identischen Abbildung

> $T-\lambda$ id

nicht beschränkt-invertierbar ist, das heißt, dass es keine Inverse gibt oder diese nicht beschränkt sind.
Das Spektrum des Operators wird mit $\sigma(T)$ bezeichnet und die Elemente des Spektrums heißen Spektralwerte.

**Beispiel: Matrixen in der linearen Algebra**

In der linearen Algebra bilden die nxn-Matrizen mit komplexen Einträgen eine Algebra bezüglich der üblichen Addition und Skalarmultiplikation (komponentenweise) sowie der Matrizenmultiplikation. Die $(n \times n)$ -Matrizen können daher sowohl als Beispiel für eigentliche Operatoren in ihrer Eigenschaft als lineare Abbildungen des $\mathbb{C}^{n} \rightarrow \mathbb{C}^{n}$ angesehen werden, als auch als Beispiel einer Operatoralgebra, wobei es in diesem Kontext unerheblich ist, welche Operatornorm für die Matrizen gewählt wird. Da alle linearen Abbildungen eines endlichdimensionalen Raumes auf sich automatisch beschränkt sind, kann dieser Begriff in der Definition hier außer Acht gelassen werden.

* Eine Matrix $A$ ist invertierbar, wenn es eine Matrix $B$ gibt, so dass $A \cdot B=B \cdot A=I$ ([Einheitsmatrix](https://de.wikipedia.org/wiki/Einheitsmatrix)) ist. Dies ist genau dann der Fall, wenn die Determinante nicht verschwindet: det $A \neq 0$. 

  * Sei $
A=\left(\begin{array}{ll}
a & b \\
c & d
\end{array}\right)
$ ist eine $2 \times 2$ -Matrix.

  * Die Determinante $D(A)$ (bzw. $\operatorname{det}(A)$ oder $\operatorname{Det}(A)$ ) von $A$ ist gleich $a d-b c$ also:

  * $
\operatorname{Det}(A)=\left|\begin{array}{cc}
a & b \\
c & d
\end{array}\right|=a d-b c
$

* **Daher ist eine Zahl $z \in \mathbb{C}$ dann ein Spektralwert, wenn $\operatorname{det}(A-z I)=0$ gilt, also wenn die Determinante verschwindet, was bedeutet, dass keine Invertierbarkeit vorliegt.**

* Da dies aber gerade das charakteristische Polynom der Matrix $A$ in $z$ ist, ist $z$ genau dann ein Spektralwert, wenn $z$ ein Eigenwert der Matrix ist. 

* **In der linearen Algebra bezeichnet das Spektrum einer Matrix daher die Menge der Eigenwerte.**

**Beispiel: Funktionen**

Die stetigen Funktionen auf dem Intervall [0,1] mit Werten in den komplexen Zahlen ( C bilden (z. B. mit der Supremumsnorm als Norm, die hier aber nicht von
Belang ist) eine Banachalgebra, wobei die Summe zweier Funktionen und das
Produkt zweier Funktionen punktweise definiert wird:

$
(f+g)(x)=f(x)+g(x) \quad(f \cdot g)(x)=f(x) \cdot g(x)
$

Eine Funktion $f$ heißt dann in dieser Algebra invertierbar, wenn es eine andere Funktion $g$ gibt, so dass $f \cdot g(=g \cdot f)=1$ (Einsfunktion) ist, das heißt, wenn es
eine Funktion $g$ gibt, deren Werte gerade die Kehrwerte von $f$ sind. Man sieht nun schnell ein, dass **eine Funktion genau dann invertierbar ist, wenn sie nicht den
Funktionswert 0 besitzt** und die Inverse in diesem Fall punktweise die inversen
Funktionswerte (Kehrwerte) der ursprünglichen Funktion besitzt:

> $
f^{-1}(x)=(f(x))^{-1}=1 / f(x), \text { wenn } f(x) \neq 0 \text { überall. }
$

**Eine Zahl $z \in \mathbb{C}$ ist also ein Spektralwert, wenn die Funktion $f-z$ nicht invertierbar ist, also den Funktionswert 0 besitzt**. Dies ist natürlich genau dann der Fall, wenn $z$ ein Funktionswert von $f$ ist. **Das Spektrum einer Funktion ist daher
genau ihr Bild.**

**Die Spektraltheorie linearer Operatoren aus der Funktionalanalysis ist eine Verallgemeinerung der [Eigenwerttheorie](https://de.wikipedia.org/wiki/Eigenwertproblem) aus der linearen Algebra.**

* Das [Spektrum](https://de.wikipedia.org/wiki/Spektrum_(Operatortheorie)) eines linearen Operators ist ein Begriff aus der Funktionalanalysis, einem Teilgebiet der Mathematik. 

* In der endlichdimensionalen linearen Algebra betrachtet man Endomorphismen, die durch Matrizen dargestellt werden, und ihre Eigenwerte. Die Verallgemeinerung ins Unendlichdimensionale wird in der Funktionalanalysis betrachtet. 

* **Das Spektrum eines Operators kann man sich als Menge verallgemeinerter Eigenwerte vorstellen. Diese werden Spektralwerte genannt.**

Sei $A \in \mathcal{L}(\mathcal{H})$. Eine Zahl $\lambda \in \mathbb{C}$ heißt ein **Eigenwert** von $A$, wenn es einen Vektor $x$ $\in$ $\mathcal{H} \backslash\{0\}$ gibt mit

$
A x=\lambda x
$

Der Vektor $x$ heißt dann **Eigenvektor** von $A$ zum Eigenwert $\lambda$. 

Der Vektorraum $N(A-\lambda I)$ heißt der Eigenraum von A zum Eigenwert $\lambda$,

> $
P_{\{\lambda\}}:=P_{N(A-\lambda I)}
$

die zu $\lambda$ gehörende **Eigenprojektion**.

https://www.uni-math.gwdg.de/mkohlma/Documents/VL_WS16_17.pdf

**Zusammenhang der Spektraltheorie mit der Eigenwerttheorie**

* Die Spektraltheorie linearer Operatoren aus der Funktionalanalysis ist eine Verallgemeinerung der Eigenwerttheorie aus der linearen Algebra. 

* In der linearen Algebra werden Endomorphismen auf endlichdimensionalen Vektorräumen betrachtet. Die Zahlen $\lambda \in \mathbb{C},$ für die die Gleichung

> $
A x=\lambda x
$

Lösungen $x \neq 0,$ also ungleich dem Nullvektor, hat, werden Eigenwerte genannt, wobei $A$ eine Darstellungsmatrix des gewählten Endomorphismus ist. 

* Eigenwerte sind also Zahlen $\lambda,$ für die das Inverse $(A-\lambda I)^{-1}$ mit der Einheitsmatrix $I$ nicht existiert, das heißt, die Matrix $A-\lambda I$ nicht bijektiv ist. Das ist im Endlichdimensionalen damit gleichzusetzen, dass der Endomorphismus nicht injektiv und damit auch nicht surjektiv sind. 

* Betrachtet man jedoch unendlichdimensionale Räume, so ist es notwendig zu unterscheiden, ob der Operator $(A-\lambda I)$ invertierbar, nicht iniektiv und/oder nicht suriektiv ist. Im unendlichdimensionalen Fall folgt aus der Injektivität eines Endomorphismus nicht automatisch die Suriektivität, wie dies im endlichdimensionalen Fall ist. Im Folgenden wird der Begriff Spektrum in der Funktionalanalysis erlăutert.

#### **Vektorraum: Lineare Abbildungen zwischen endlichdimensionalen Vektorräumen**

###### **Properties of Vector Spaces & Scalars**

**Properties of Vector Spaces : Vector Spaces form a commutative group under addition**

$
\begin{array}{l}
\text { Addition: } \quad \vec{v}, \vec{w} \text { are vectors } \Longrightarrow \vec{v}+\vec{w} \text { is a vector }\\
\text { Commutativity: } \quad \vec{v}+\vec{w}=\vec{w}+\vec{v}\\
\text { Zero vector: } \quad 0\\
\text { Identity element: } \quad \mathbf{0}+\vec{v}=\vec{v}+\mathbf{0}=\vec{v}\\
\text { Inverses: } \quad \vec{v}+(-\vec{v})=(-\vec{v})+\vec{v}=0\\
\text { Associativity: } \quad \vec{v}+(\vec{w}+\vec{z})=(\vec{v}+\vec{w})+\vec{z}
\end{array}
$



**Properties of Scalars**

Distributive Properties:

$
\begin{array}{l}
c \cdot(\vec{v}+\vec{w})=c \cdot \vec{v}+c \cdot \vec{w} \\
(c+d) \cdot \vec{v}=c \cdot \vec{v}+d \cdot \vec{v}
\end{array}
$

Associative Property:

$
c \cdot(d \cdot \vec{v})=(c \times d) \cdot \vec{v}
$

Action of 1: 

$\quad 1 \cdot \vec{v}=\vec{v}$

Polynome vom Grad 5 zB sind auch Vektorraume !!

**Module Space vs Vector Space**

1. Module = Vector Space with a **ring** of scalars

2. Vector Space = Module with a **field** of scalars (commutative under multiplication)

Remember: A Field is a Ring whose non-zero elements form a commutative Group under multiplication (In short a field is a commutative ring with unity with all its non zero elements having multiplicative inverse.)

**Vector Space**

* Abelian group $V$ of vectors

* Field $F$ of "scalars"

* $f \cdot v$ is a "scaled vector"

Distributive properties:
$f \cdot\left(v_{1}+v_{2}\right)=f \cdot v_{1}+f \cdot v_{2}$
$\left(f_{1}+f_{2}\right) \cdot v=f_{1} \cdot v+f_{2} \cdot v$

Associative property:

$\left(f_{1} \cdot f_{2}\right) \cdot v=f_{1} \cdot\left(f_{2} \cdot v\right)$
$1 \cdot v=v$

**(Left or Right) Module**

* Abelian group $M$ of "elements"

* Ring $R$ of "scalars"

* $r \cdot m$ is a "scaled element"

Distributive properties:

$r \cdot\left(m_{1}+m_{2}\right)=r \cdot m_{1}+r \cdot m_{2}$
о $\left(r_{1}+r_{2}\right) \cdot m=r_{1} \cdot m+r_{2} \cdot m$

Associative property:

$\left(r_{1} \cdot r_{2}\right) \cdot m=r_{1} \cdot\left(r_{2} \cdot m\right)$
$1 \cdot m=m$

**Example of a Module:**

Group: $M=\mathbb{R}^{3}=\{(x, y, z) \mid x, y, z \in \mathbb{R}\}$ under $+$

Scalar Ring: $R=\left\{\left(\begin{array}{lll}a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33}\end{array}\right) \mid a_{i j} \in \mathbb{R}\right\}$

$R$ is not a field:
* Not every matrix is invertible 
* Not commutative 
* Does have an identity: $\left(\begin{array}{cc}1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1\end{array}\right)$

https://youtu.be/IvukAijXgLE

https://www.mathe-online.at/lernpfade/lin_alg_glatz/?kapitel=1

**Lineare Algebra**

* Konkrete form of vectors don't matter (matrices, vectors, functions, pie transforms etc). All what matters are the 8 axioms which define a vector space:

![cc](https://raw.githubusercontent.com/deltorobarba/repo/master/vectorspace_axioms.png)

https://www.youtube.com/watch?v=TgKwz5Ikpc8&list=WL&index=33&t=638s

3 most important pillars of linear algebra: https://www.youtube.com/watch?v=Ww_aQqWZhz8&t=194s

https://de.m.wikipedia.org/wiki/Vektorraum

https://de.m.wikipedia.org/wiki/Lineare_Algebra

https://de.wikipedia.org/wiki/Lineare_Abbildung

Ein Vektorraum u ̈ber einem Körper $\mathbb K$ ist eine abelsche Gruppe mit der Eigenschaft, dass es zu jedem Element k von $\mathbb K$ (”Skalar“) eine einstellige Operation (”Skalarmultiplikation“ )

Oder anders: 
* Körper: Plus oder Mal im Körper: zwei Körperelemente, und dann kommt wieder Körperelement heraus
* Vektorraum: (Mal heisst nur strecken und stauchen = Skalarmultiplikation: Vektor multipliziert mit Körperelement

* Ein Vektorraum ist ein n-dimensionaler Körper.

* A vector space is an algebraic structure with operations of addition and multiplication by scalars. Gilt zusätzlich multiplikative Inverse und multiplikative Kommuntativität

* The scalars are required to be elements of a field, such as the real numbers R. The basic example of a vector space is the set Rn of all vectors with n entries.

* Ein Vektorraum oder linearer Raum ist eine algebraische Struktur, die in vielen Teilgebieten der Mathematik verwendet wird. 

* Vektorräume bilden den zentralen Untersuchungsgegenstand der linearen Algebra. 

* Die Elemente eines Vektorraums heißen Vektoren. 

* Sie können addiert oder mit Skalaren (Zahlen) multipliziert werden, das Ergebnis ist wieder ein Vektor desselben Vektorraums.

* Die **Skalare, mit denen man einen Vektor multiplizieren kann, stammen aus einem Körper**. Deswegen ist ein Vektorraum immer ein Vektorraum über einem bestimmten Körper. Sehr oft handelt es sich dabei um den Körper 
$\mathbb {R}$ der reellen Zahlen oder den Körper 
$\mathbb {C}$ der komplexen Zahlen. Man spricht dann von einem reellen Vektorraum bzw. einem komplexen Vektorraum.

https://de.m.wikipedia.org/wiki/Vektorraum

**K-Algebra (Algebra über einem Körper) & Algebra über einem kommutativen Ring.**

* ist ein Vektorraum über einem Körper K, der um eine mit der Vektorraumstruktur verträgliche Multiplikation erweitert wurde. 

* Je nach Kontext wird dabei mitunter zusätzlich gefordert, dass die Multiplikation das Assoziativgesetz oder das Kommutativgesetz erfüllt oder dass die Algebra bezüglich der Multiplikation ein Einselement besitzt.

* Allgemeiner kann K ein kommutativer Ring sein, dann ist „Vektorraum“ durch „Modul“ zu ersetzen, und man erhält eine [Algebra über einem kommutativen Ring](https://de.m.wikipedia.org/wiki/Algebra_über_einem_kommutativen_Ring).

https://de.m.wikipedia.org/wiki/Algebra_über_einem_Körper

**Verallgemeinerung der K-Algebra**

* Allgemeiner kann $K$ ein kommutativer Ring sein, dann ist „Vektorraum“ durch „Modul“ zu ersetzen, und man erhält eine [Algebra über einem kommutativen Ring](https://de.m.wikipedia.org/wiki/Algebra_%C3%BCber_einem_kommutativen_Ring).

**Körpererweiterungen**

https://de.m.wikipedia.org/wiki/Vektorraum#K%C3%B6rpererweiterungen

**Assoziative Algebra**

* [Assoziative Algebra](https://de.m.wikipedia.org/wiki/Assoziative_Algebra)

* Es handelt sich um eine algebraische Struktur, die den Begriff des Vektorraums bzw. des Moduls dahingehend erweitert, dass zusätzlich zur Vektoraddition eine **assoziative Multiplikation** als innere Verknüpfung definiert wird.

[Numerische Verfahren:](https://de.m.wikipedia.org/wiki/Liste_numerischer_Verfahren) lineare Gleichungssysteme, Eigenwerte etc

* Lineare Abbildung zwischen Vektorräumen

* Erfüllt Bedingung der Homogenität und der Additivität (siehe unter Morphismen das Thema "Vektorraumhomomorphismus")

https://de.m.wikipedia.org/wiki/Lineares_Gleichungssystem#Matrixform

https://de.m.wikipedia.org/wiki/Lineare_Algebra#Wichtige_Sätze_und_Ergebnisse

https://mathepedia.de/Lineare_Abbildungen.html

https://de.m.wikibooks.org/wiki/Mathematik:_Lineare_Algebra

https://de.m.wikipedia.org/wiki/Diagonalmatrix

###### **Basis, Orthonormalbasis & Orthogonalprojektion**

*Basis*

* Jeder Vektorraum hat mindestens eine [Basis](https://de.wikipedia.org/wiki/Basis_(Vektorraum)).

*Orthonormalbasis*

* **Orthogonalisieren**: zwei (oder mehr) Vektoren orthogonal zueinander bringen

* **Orthonormalisieren**: diese auch noch auf Lange 1 zu normalisieren

* Ziel: Vereinfachung des Rechnens mit Vektoren

* Eine [Orthonormalbasis](https://de.wikipedia.org/wiki/Orthonormalbasis) (ONB) oder ein vollständiges Orthonormalsystem (VONS) in den mathematischen Gebieten lineare Algebra und Funktionalanalysis **ist eine Menge von Vektoren aus einem Vektorraum mit Skalarprodukt (Innenproduktraum), welche auf die Länge eins normiert und zueinander orthogonal sind** (daher Ortho-normal-basis) und deren lineare Hülle dicht im Vektorraum liegt. 

* Im endlichdimensionalen Fall ist dies eine Basis des Vektorraums. Im unendlichdimensionalen Fall handelt es sich nicht um eine Vektorraumbasis im Sinn der linearen Algebra.

* Verzichtet man auf die Bedingung, dass die Vektoren auf die Länge eins normiert sind, so spricht man von einer **Orthogonalbasis**.

* Der Begriff der Orthonormalbasis ist sowohl im Fall endlicher Dimension als auch für unendlichdimensionale Räume, insbesondere Hilberträume, von großer Bedeutung.

* Siehe auch [Gram-Schmidtsches Orthogonalisierungsverfahren
](https://de.wikipedia.org/wiki/Gram-Schmidtsches_Orthogonalisierungsverfahren) und [Video dazu](https://www.youtube.com/watch?v=SLEElig-C9w)

*Orthogonalprojektion*

* Eine [Orthogonalprojektion](https://de.m.wikipedia.org/wiki/Orthogonalprojektion) bzw. orthogonale Projektion oder senkrechte Projektion ist eine Abbildung eines Punkts auf eine Gerade oder eine Ebene, sodass die Verbindungslinie zwischen dem Punkt und seinem Abbild mit dieser Gerade oder Ebene einen rechten Winkel bildet

* Das Abbild hat dann von allen Punkten der Gerade oder Ebene den kürzesten Abstand zum Ausgangspunkt. 

* Eine Orthogonalprojektion ist damit ein Spezialfall einer Parallelprojektion, bei der die Projektionsrichtung gleich der Normalenrichtung der Gerade oder Ebene ist.

*Orthogonalprojektion eines Punkts P auf eine Ebene E: Der Verbindungsvektor zwischen dem Punkt und seinem Abbild $P'$ bildet mit der Ebene einen rechten Winkel.*

![ggg](https://upload.wikimedia.org/wikipedia/commons/thumb/d/da/Orthogonal_Projection_qtl3.svg/440px-Orthogonal_Projection_qtl3.svg.png)

###### **Reelle Matrizen**

**Singuläre & reguläre Matrix**

* Eine [reguläre, invertierbare oder nichtsinguläre Matrix](https://de.m.wikipedia.org/wiki/Reguläre_Matrix) ist in der Mathematik eine quadratische Matrix, die eine Inverse besitzt

* Singuläre Matrizen besitzen keine inverse

**Transponierte Matrix**

* bijektive, selbstinverse Abbildung einer reellen Matrix

* Die [transponierte Matrix](https://de.m.wikipedia.org/wiki/Transponierte_Matrix), gespiegelte Matrix oder gestürzte Matrix ist in der Mathematik diejenige Matrix, die durch Vertauschen der Rollen von Zeilen und Spalten einer gegebenen Matrix entsteht.

* die transponierte Matrix entsteht also durch Spiegelung der Ausgangsmatrix an ihrer Hauptdiagonale. 

* Unterschied zu symmetrischen Matrizen: diese sind quadratisch, transponierte Matrizen koennen auch zB 2x3 Matrizen sein, und symmetrische haben die gleiche Werte in der quadratischen Matrix auf den gegenuberliegenden Seiten (wahrend transponierte Matrizen auch quadratisch sein koennen, aber jeweils andere Werte bei der Speigelung)

  * **Eine symmetrische Matrix ist eine quadratische Matrix, die gleich ihrer Transponierten ist**

  * **Eine orthogonale Matrix ist eine quadratische Matrix, deren Transponierte gleich ihrer Inversen ist**

* Viele Kenngrößen von Matrizen, wie Spur, Rang, Determinante und Eigenwerte, bleiben unter Transponierung erhalten. (zB der Rang und die Spur der transponierten Matrix gleich dem der Ausgangsmatrix)

![ggg](https://upload.wikimedia.org/wikipedia/commons/e/e4/Matrix_transpose.gif)

**Symmetrische Matrix**

* sehr wichtig in Naturwissenschaften

* [Symmetrische Matrizen](https://de.m.wikipedia.org/wiki/Symmetrische_Matrix) ist eine quadratische Matrix, deren **Einträge spiegelsymmetrisch bezüglich der Hauptdiagonale sind**. 

* Eine symmetrische Matrix stimmt demnach mit ihrer transponierten Matrix überein (ändern sich nicht durch Transponieren)

* symmetrische Matrizen muessen nicht unbedingt invertierbar sein (So ist etwa jede Nullmatrix symmetrisch, aber keinesfalls invertierbar.)

* Reelle symmetrische Matrizen weisen eine Reihe weiterer besonderer Eigenschaften auf:

  * So ist eine reelle symmetrische Matrix **stets selbstadjungiert** (mit sich selbst  transponiert + conjugiert (=alle Vorzeichen umgekehrt)), sie besitzt nur reelle Eigenwerte und sie ist **stets orthogonal diagonalisierbar**. 
  
  * Für komplexe symmetrische Matrizen gelten diese Eigenschaften im Allgemeinen nicht; das entsprechende Gegenstück sind dort **hermitesche Matrizen**. 

*Symmetriemuster einer symmetrischen (5×5)-Matrix:*

![gg](https://upload.wikimedia.org/wikipedia/commons/thumb/3/32/Matrix_symmetry_qtl1.svg/220px-Matrix_symmetry_qtl1.svg.png)

**Inverse Matrix (Invertierbarkeit)**

* Die [inverse Matrix](https://de.m.wikipedia.org/wiki/Inverse_Matrix), Kehrmatrix oder kurz Inverse einer quadratischen Matrix ist eine ebenfalls **quadratische Matrix**, die **mit der Ausgangsmatrix multipliziert die Einheitsmatrix ergibt**. 

  * Aber: nicht jede quadratische Matrix besitzt eine Inverse; 

  * Allgemeiner ist jede Matrix, die eine Nullzeile enthält, nicht invertierbar.

  * Allgemeiner sind Matrizen mit zwei gleichen Zeilen niemals invertierbar.

* die invertierbaren Matrizen werden **reguläre Matrizen** genannt. Matrizen, die nicht invertierbar sind, heißen **singulär** .

* Ist eine Matrix invertierbar, gibt es eine Lösung

  * So ist etwa  A genau dann invertierbar, wenn  det⁡ A ≠ 0  gilt (Determinante)

  * Matrix ist invertierbar (=regulär), wenn [Rang](https://de.m.wikipedia.org/wiki/Rang_(Mathematik)) = n (Dimension der Matrix ohne Nullzeile ist)

  * Bestimmung der Inversen einer invertierbaren Matrix: Algorithmus von Gauß und Jordan zur Lösung von Gleichungssystemen

Die Inverse der reellen $(2 \times 2)$ -Matrix

$
A=\left(\begin{array}{ll}
2 & 1 \\
6 & 4
\end{array}\right)
$

ist

$
A^{-1}=\left(\begin{array}{cc}
2 & -0,5 \\
-3 & 1
\end{array}\right)
$

denn es gilt

$
A \cdot A^{-1}=\left(\begin{array}{ll}
2 & 1 \\
6 & 4
\end{array}\right) \cdot\left(\begin{array}{cc}
2 & -0,5 \\
-3 & 1
\end{array}\right)=\left(\begin{array}{cc}
4-3 & -1+1 \\
12-12 & -3+4
\end{array}\right)=\left(\begin{array}{ll}
1 & 0 \\
0 & 1
\end{array}\right)=I
$

**Orthogonale Matrix**

* sehr wichtig in Naturwissenschaften

* Eine [orthogonale Matrix](https://de.m.wikipedia.org/wiki/Orthogonale_Matrix) ist eine quadratische, reelle Matrix, deren Zeilen- und Spaltenvektoren orthonormal bezüglich des Standardskalarprodukts sind. **Damit ist die Inverse einer orthogonalen Matrix gleichzeitig ihre Transponierte**.

> Eine reelle quadratische Matrix $Q \in \mathbb{R}^{n \times n}$ heißt orthogonal, wenn das Produkt mit ihrer transponierten Matrix $Q^{T}$ die Einheitsmatrix $I$ ergibt, also $Q^{T} \cdot Q=I$

* sind invertierbar, symmetrische nicht unbedingt (So ist etwa jede Nullmatrix symmetrisch, aber keinesfalls invertierbar.)

* stellen Kongruenzabbildungen im euklidischen Raum, also Drehungen, Spiegelungen und Kombinationen daraus, dar.

  * [Drehmatrizen](https://de.m.wikipedia.org/wiki/Drehmatrix), also Matrizen, die eine Drehung um den Koordinatenursprung in der euklidischen Ebene beschreiben, sind orthogonal. 

  * [Spiegelungsmatrizen](https://de.m.wikipedia.org/wiki/Spiegelungsmatrix), also Matrizen, die eine (senkrechte) Spiegelung an einer Ursprungsgerade in der euklidischen Ebene beschreiben, sind orthogonal.

  * [Permutationsmatrizen](https://de.m.wikipedia.org/wiki/Permutationsmatrix), also Matrizen, bei denen genau ein Eintrag pro Zeile und Spalte gleich eins ist und alle anderen Einträge null sind, sind orthogonal. 

* werden beispielsweise bei der numerischen Lösung linearer Gleichungssysteme oder Eigenwertprobleme eingesetzt

* Der analoge Begriff bei komplexen Matrizen ist die unitäre Matrix.

*Durch Multiplikation mit einer orthogonalen Matrix Q können Vektoren gedreht (links) oder gespiegelt (rechts) werden. Die Länge der Vektoren und der Winkel zwischen den Vektoren bleiben dabei erhalten*

![gg](https://upload.wikimedia.org/wikipedia/commons/thumb/d/de/Orthogonal_transformation_qtl1.svg/240px-Orthogonal_transformation_qtl1.svg.png)
![gg](https://upload.wikimedia.org/wikipedia/commons/thumb/b/b5/Orthogonal_transformation_qtl2.svg/240px-Orthogonal_transformation_qtl2.svg.png)

Die Matrix

$
Q=\left(\begin{array}{ll}
0 & 1 \\
1 & 0
\end{array}\right)
$

ist orthogonal, denn es gilt

$
Q^{T} Q=\left(\begin{array}{ll}
0 & 1 \\
1 & 0
\end{array}\right) \cdot\left(\begin{array}{ll}
0 & 1 \\
1 & 0
\end{array}\right)=\left(\begin{array}{ll}
0 \cdot 0+1 \cdot 1 & 0 \cdot 1+1 \cdot 0 \\
1 \cdot 0+0 \cdot 1 & 1 \cdot 1+0 \cdot 0
\end{array}\right)=\left(\begin{array}{ll}
1 & 0 \\
0 & 1
\end{array}\right)=I \text { . }
$

Auch die Matrix

$
Q=\frac{1}{5}\left(\begin{array}{cc}
3 & 4 \\
-4 & 3
\end{array}\right)
$

ist orthogonal, denn es gilt

$
Q^{T} Q=\frac{1}{5}\left(\begin{array}{cc}
3 & -4 \\
4 & 3
\end{array}\right) \cdot \frac{1}{5}\left(\begin{array}{cc}
3 & 4 \\
-4 & 3
\end{array}\right)=\frac{1}{25}\left(\begin{array}{cc}
9+16 & 12-12 \\
12-12 & 16+9
\end{array}\right)=\frac{1}{25}\left(\begin{array}{cc}
25 & 0 \\
0 & 25
\end{array}\right)=\left(\begin{array}{ll}
1 & 0 \\
0 & 1
\end{array}\right)=I
$

**Selbstadjungierte Matrix**

* Eine [selbstadjungierte Matrix](https://de.m.wikipedia.org/wiki/Selbstadjungierte_Matrix) ist eine spezielle Art von **quadratischen Matrizen.**

* Sind die Koeffizienten reell, so ist sie gerade eine **symmetrische Matrix**

  * Eine reelle Matrix ist genau dann selbstadjungiert, wenn sie symmetrisch ist, also wenn $A=A^{T}$

* Sind die Koeffizienten komplex, so ist sie eine **hermitesche Matrix.**

  * eine komplexe Matrix genau dann selbstadjungiert, wenn sie hermitesch ist, also wenn $A=A^{*}$

  * Die [Pauli-Matrizen](https://de.m.wikipedia.org/wiki/Pauli-Matrizen) sind selbstadjungiert (zur Beschreibung des Spins, Basis des 4-dimensionalen komplexen Vektorraums aller komplexen & hermetischen 2×2-Matrizen)

* Jede selbstadjungierte Matrix ist auch normal, das heißt, es gilt $A^{{*}}\cdot A=A\cdot A^{{*}}$. Die Umkehrung gilt im Allgemeinen nicht.

**Normale Matrix**

* eine [normale Matrix](https://de.m.wikipedia.org/wiki/Normale_Matrix) ist eine Matrix, die mit ihrer adjungierten Matrix kommutiert

  * eine komplexe Matrix $A\in {\mathbb  {C}}^{{n\times n}}$ ist normal, wenn $A^{{*}}\cdot A=A\cdot A^{{*}}$

  * eine reelle Matrix $B\in {\mathbb  {R}}^{{n\times n}}$ ist normal, wenn $B^{{T}}\cdot B=B\cdot B^{{T}}$

* Der [Spektralsatz](https://de.m.wikipedia.org/wiki/Spektralsatz) besagt, dass eine Matrix A genau dann normal ist, wenn es eine unitäre Matrix U gibt (orthogonal in komplex), so dass $A=UDU^{{{\rm {*}}}}$, wobei D eine Diagonalmatrix ist. 

* Normale Matrizen haben also die Eigenschaft, dass sie unitär diagonalisierbar sind. Es existiert daher eine Orthonormalbasis aus Eigenvektoren von A. Die Hauptdiagonalelemente von D sind genau die Eigenwerte von A. 

* Insbesondere sind jede reelle symmetrische Matrix und jede komplexe hermitesche Matrix normal. Zudem ist jede unitäre Matrix normal.

* [**Normaler Operator**](https://de.m.wikipedia.org/wiki/Normaler_Operator): Verallgemeinerung der normalen Matrix. Ein "normaler Operator" ist basisunabhängig definiert und im unendlichdimensionalen Raum.

###### **Komplexwertige Matrizen**

**Conjugierte Matrizen**

* Vertauschen der Vorzeichen

**Adjungierte Matrix** 

* = transponiert + conjugiert

* komplexwertige Matrix, die transponiert + (komplex) conjugiert ist (Vorzeichen umgekehrt)

* Eine adjungierte Matrix muss nicht quadratisch sein (kann also zB auch 2x3 Matrix sein) und auch nicht symmetrisch sein

$
\begin{aligned}
B=\left(\begin{array}{ll}
0 & i \\
0 & 0
\end{array}\right)
\\
B^{T}=\left(\begin{array}{ll}
0 & 0 \\
i & 0
\end{array}\right) \\
B^{*} &=\left(\begin{array}{cc}
0 & 0 \\
-i & 0
\end{array}\right)
\end{aligned}
$

**Hermetisch**

* selbstadjunktiert = symmetrisch

* also wenn man die adjunktierte von A* bildet, kommt wieder A raus: A* = A

* Spiegelung an der Diagonalen. Matrix muss quadratisch sein

* im reellen ist es die Symmetrie

**Normal**

* A* A = A A*

* Einheitsmatrix

**Unitär**

* Orthogonalität

* Eine Matrix die invertierbar ist, ist durch die adjunktierte Matrix gegeben: A<sup>-1</sup> = A*

* eine unitäre Matrix ändert nichts an den Längen / Abständen / Winkeln von Vektoren zB bei Rotationen im Raum

* Verallgemeinerung von orthogonalen Matrizen in der komplexen Welt

**Polarzerlegung**

* Die [Polarzerlegung](https://de.m.wikipedia.org/wiki/Polarzerlegung) ist eine spezielle Zerlegung in ein Produkt von Matrizen mit reellen oder komplexen Einträgen, und in Verallgemeinerung von linearen Operatoren auf einem Hilbert-Raum. 

https://youtu.be/uf-rooMdDME

###### **Linear, Bilinear & Dual**

*Lineare Abbildung*

https://www.youtube.com/watch?v=KK_fHodz-lQ&t=932s

* Eine [lineare Abbildung](https://de.wikipedia.org/wiki/Lineare_Abbildung) ist ein Vektorraum-Homomorphismus

> $\varphi: V \longrightarrow \omega$

Eigenschaften:

> $\varphi\left(v_{1}+v_{2}\right)=\varphi\left(v_{c}\right)+\varphi\left(v_{2}\right)$

> $\varphi(\lambda \cdot v)=\lambda \cdot \varphi(v)$

* Eine lineare Abbildung $f\colon V\to V$ (also ein Endomorphismus) eines endlichdimensionalen Vektorraumes $V$ ist bereits invertierbar, wenn sie injektiv oder surjektiv ist. 

* Dies ist wiederum genau dann der Fall, wenn ihre Determinante ungleich null ist. 

* Hieraus folgt, dass die Eigenwerte eines Endomorphismus genau die Nullstellen seines charakteristischen Polynoms sind. 

* Eine weitere wichtige Aussage über das charakteristische Polynom ist der Satz von Cayley-Hamilton.

*Linearform (= Funktional im endlichdimensionale Vektorraum)*

* Eine [Linearform](https://de.wikipedia.org/wiki/Linearform) ist ein Objekt aus dem mathematischen Teilgebiet der linearen Algebra. Es handelt sich dabei um eine lineare Abbildung von einem Vektorraum in den zugrundeliegenden Körper.

* Es sei $K$ ein Körper und $V$ ein $K$ -Vektorraum. Eine Abbildung $f: V \rightarrow K$ heißt Linearform, wenn für alle Vektoren $x, y \in V$ und Skalare $\alpha \in K$ gilt:

  1. $f(x+y)=f(x)+f(y)$ (**Additivität**);

  2. $f(\alpha x)=\alpha f(x)$ (**Homogenität**).

* Im Kontext der Funktionalanalysis, das heißt im Falle eines topologischen $\mathbb {R}$ - oder $\mathbb {C}$-Vektorraums, sind die betrachteten Linearformen meistens stetige lineare Funktionale.

* Linearform als Tensor: Eine Linearform $f$ ist ein kovarianter Tensor erster Stufe; man nennt sie deshalb manchmal auch [1-Form (Pfaffsche Form)](https://de.wikipedia.org/wiki/Pfaffsche_Form). 1-Formen bilden die Grundlage für die Einführung von Differentialformen. **Pfaffsche Formen sind die natürlichen Integranden für Wegintegrale**.

* 
Eine Abbildung, die linear oder semilinear in mehr als einem Argument ist, ist eine [Sesquilinearform](https://de.wikipedia.org/wiki/Sesquilinearform), eine [Bilinearform](https://de.wikipedia.org/wiki/Bilinearform), oder allgemein eine [Multilinearform](https://de.wikipedia.org/wiki/Multilinearform) (zB kann man Winkel nicht mit linearen Abbildungen beschreiben, weil es dafur 2 Vektoren braucht. Dafur hat man Bilinearform! Eine bilinearform ordnet praktisch zwei Vektoren ein Zahl zu (zB Winkel).

* 'Linear form' is a more modern and abstract concept of 'functional'

* Im Kontext der Funktionalanalysis, das heißt im Falle eines topologischen 
$\mathbb {R}$ - oder $\mathbb {C}$-Vektorraums, sind die betrachteten Linearformen meistens [stetige lineare Funktionale](https://de.m.wikipedia.org/wiki/Funktional#Stetige_lineare_Funktionale).

* **Übergang zu Dualraum**: Die Menge aller Linearformen (= stetigen, linearen Abbildungen) über einem gegebenen Vektorraum $V$ bildet dessen Dualraum $V^{*}$ und damit selbst wieder in natürlicher Weise einen $K$ -Vektorraum.

*Linearkombination*

* Unter einer [Linearkombination](https://de.m.wikipedia.org/wiki/Linearkombination) versteht man in der linearen Algebra einen Vektor, der sich durch gegebene Vektoren unter Verwendung der Vektoraddition und der skalaren Multiplikation ausdrücken lässt.



*Bilineare Abbildung*

* Bilinear = gemischtes Assoziativgesetz & Distributivgesetz

* [Bilineare Abbildungen](https://de.m.wikipedia.org/wiki/Bilineare_Abbildung) verallgemeinern die verschiedensten Begriffe von Produkten (im Sinne einer Multiplikation). 

* Die Bilinearität entspricht dem Distributivgesetz bei der normalen Multiplikation:

>$
a \cdot(b+c)=a \cdot b+a \cdot c
$

* Beispiel: 

  * Sämtliche gemeinhin übliche Produkte sind bilineare Abbildungen: die Multiplikation in einem Körper (reelle, komplexe, rationale Zahlen) oder einem Ring (ganze Zahlen, Matrizen), 
  
  * aber auch das Vektor- oder Kreuzprodukt, 
  
  * und das Skalarprodukt auf einem reellen Vektorraum.


*Bilinearformen*

https://www.youtube.com/watch?v=TjAFH6hWg1I

* man kann Winkel nicht mit linearen Abbildungen beschreiben, weil es dafur 2 Vektoren braucht. Dafur hat man Bilinearform

* **Ein Spezialfall der bilinearen Abbildungen sind die Bilinearformen (Winkel sind wichtiger Anwendungsfall dafur).** 

* **Jedes Skalarprodukt ist wiederum eine spezielle Bilinearform** (es gelten noch weitere Eigenschaften: symmetrisch <v,w> = <w,v>, und positiv definit). Genauso Integral.

* Input sind zwei Vektoren (zB in R2 und in R3), aber Ziel ist nicht Vektorraum (wie bei linearen Abbildungen), sondern ein Koerper (zB reelle Zahlen R allgemein). Eine bilinearform ordnet praktisch zwei Vektoren ein Zahl zu (zB Winkel)

* Bei diesen ist der Wertebereich $G$ mit dem Skalarkörper $K$ der Vektorräume $E$ und $F$ identisch.

> $
f: E \times F \rightarrow K
$

> $\langle\cdot, \cdot \rangle\ : V \times W \longrightarrow K$

$\langle\cdot, \cdot \rangle\$ 

fur zwei Vektoren ist wie 

$\varphi$

bei einem Vektor.

* Bilinearformen sind für die analytische Geometrie und [Dualitätstheorie](https://de.m.wikipedia.org/wiki/Dualität_(Mathematik)) wichtig.

* Als [Bilinearform](https://de.m.wikipedia.org/wiki/Bilinearform#) bezeichnet man in der linearen Algebra eine Funktion, welche zwei Vektoren einen Skalarwert zuordnet und die linear in ihren beiden Argumenten ist.

[Bilinearform](https://de.wikipedia.org/wiki/Bilinearform): cross product of two vectors, normal and tangent, see [Frenet–Serret_formulas](https://en.m.wikipedia.org/wiki/Frenet–Serret_formulas).

*Projektion*

https://de.m.wikipedia.org/wiki/Projektion_(Lineare_Algebra)

*Dualraum*

https://www.youtube.com/watch?v=2vvjrBbcTZU&t=480s

###### **Faktorraum & Untervektorraum**

* Jeder Vektorraum hat mindestens eine Basis. Je zwei Basen eines Vektorraumes haben gleich viele Elemente; nur deshalb ist es sinnvoll, von der Dimension eines Vektorraumes zu sprechen. 

* Für Summen und Durchschnitte von [Untervektorräumen](https://de.wikipedia.org/wiki/Untervektorraum) gilt die Dimensionsformel und für die Dimensionen von [Faktorräumen](https://de.wikipedia.org/wiki/Faktorraum) die Formel $\dim V/U=\dim V-\dim U$.

*Lineare Hülle (Span)*

https://de.wikipedia.org/wiki/Lineare_Hülle

###### **Homomorphiesatz & Rangsatz**

* Jede lineare Abbildung $f\colon V\to W$ ist durch die Angabe der Bilder einer Basis von $V$ eindeutig festgelegt. 

* Für lineare Abbildungen gelten der [Homomorphiesatz](https://de.wikipedia.org/wiki/Homomorphiesatz) und der [Rangsatz](https://de.wikipedia.org/wiki/Rangsatz). 

* Lineare Abbildungen können bezüglich fest gewählter Basen durch Matrizen dargestellt werden. Dabei entspricht der Hintereinanderausführung von linearen Abbildungen die Multiplikation ihrer Darstellungsmatrizen.

Eine weitreichende Verallgemeinerung des Rangsatzes ist die Aussage, dass die alternierende Summe der Dimensionen der einzelnen Komponenten eines [Kettenkomplexes](https://de.wikipedia.org/wiki/Kettenkomplex) gleich der alternierenden Summe der Dimensionen seiner Homologiegruppen ist. Siehe dazu die [Euler-Charakteristik eines Kettenkomplexes](https://de.wikipedia.org/wiki/Kettenkomplex#Euler-Charakteristik).

###### **Produkte**

*Skalarprodukt (Dot Product)*

* Das [Skalarprodukt](https://de.m.wikipedia.org/wiki/Skalarprodukt) (auch inneres Produkt oder Punktprodukt) ist eine mathematische Verknüpfung, die zwei Vektoren eine Zahl (Skalar) zuordnet.

* Es ist Gegenstand der analytischen Geometrie und der linearen Algebra. Historisch wurde es zuerst im euklidischen Raum eingeführt. 

* Geometrisch berechnet man das Skalarprodukt zweier Vektoren $\vec {a}$ und $\vec {b}$ nach der Formel

>$
\vec{a} \cdot \vec{b}=|\vec{a}||\vec{b}| \cos \triangleleft(\vec{a}, \vec{b})
$

* Dabei bezeichnen $|\vec{a}|$ und $|\vec{b}|$ jeweils die Längen (Beträge) der Vektoren. Mit $\cos \triangleleft(\vec{a}, \vec{b})=\cos \varphi$ wird der Kosinus des von den beiden Vektoren eingeschlossenen Winkels $\varphi$ bezeichnet. Das Skalarprodukt zweier Vektoren gegebener Länge ist damit null, wenn sie senkrecht zueinander stehen, und maximal, wenn sie die gleiche Richtung haben.

In einem **kartesischen Koordinatensystem** berechnet sich das Skalarprodukt zweier Vektoren $\vec{a}=\left(a_{1}, a_{2}, a_{3}\right)$ und $\vec{b}=\left(b_{1}, b_{2}, b_{3}\right)$ als

>$
\vec{a} \cdot \vec{b}=a_{1} b_{1}+a_{2} b_{2}+a_{3} b_{3}
$

Kennt man die kartesischen Koordinaten der Vektoren, so kann man mit dieser Formel das Skalarprodukt und daraufhin mit der Formel aus dem vorhergehenden Absatz den Winkel $\varphi=\alpha(\vec{a}, \vec{b})$ zwischen den beiden Vektoren ausrechnen, indem diese nach $\varphi$ aufgelöst wird:

>$
\varphi=\arccos \frac{\vec{a} \cdot \vec{b}}{|\vec{a}||\vec{b}|}
$

*Das Skalarprodukt zweier Vektoren im euklidischen Anschauungsraum hängt von der Länge der Vektoren und dem eingeschlossenen Winkel ab.*

![gg](https://upload.wikimedia.org/wikipedia/commons/thumb/f/fc/Dot-product-1.svg/440px-Dot-product-1.svg.png)

*In allen drei Beispielen gilt $|\vec{a}|=5$ und $|\vec{b}|=3 .$ Die Skalarprodukte ergeben sich mithilfe der speziellen Kosinuswerte $\cos 0^{\circ}=1, \cos 60^{\circ}=\frac{1}{2}$ und $\cos 90^{\circ}=0$ :*

![gg](https://raw.githubusercontent.com/deltorobarba/repo/master/skalarprodukt.png)

Algebraische Eigenschaften des Skalarprodukt:

1. Es ist symmetrisch (Kommutativgesetz):
$\vec{a} \cdot \vec{b}=\vec{b} \cdot \vec{a}$ für alle Vektoren $\vec{a}$ und $\vec{b}$

2. Es ist homogen in jedem Argument (gemischtes Assoziativgesetz):
$(r \vec{a}) \cdot \vec{b}=r(\vec{a} \cdot \vec{b})=\vec{a} \cdot(r \vec{b})$ für alle Vektoren $\vec{a}$ und $\vec{b}$ und alle Skalare $r \in \mathbb{R}$

3. Es ist additiv in jedem Argument (Distributivgesetz):
$\vec{a} \cdot(\vec{b}+\vec{c})=\vec{a} \cdot \vec{b}+\vec{a} \cdot \vec{c}$ und
$(\vec{a}+\vec{b}) \cdot \vec{c}=\vec{a} \cdot \vec{c}+\vec{b} \cdot \vec{c}$ für alle Vektoren $\vec{a}, \vec{b}$ und $\vec{c}$.

Die Eigenschaften 2 und 3 fasst man auch zusammen zu: Das Skalarprodukt ist [bilinear](https://de.m.wikipedia.org/wiki/Bilineare_Abbildung).

*Kreuzprodukt*

* Verknüpfung von zwei Vektoren, deren Ergebnis wieder ein Vektor ist

* Das [Kreuzprodukt](https://de.m.wikipedia.org/wiki/Kreuzprodukt), auch Vektorprodukt, vektorielles Produkt oder äußeres Produkt, ist eine Verknüpfung im dreidimensionalen euklidischen Vektorraum, die zwei Vektoren wieder einen Vektor zuordnet. Um es von anderen Produkten, insbesondere vom Skalarprodukt, zu unterscheiden, wird es im deutsch- und englischsprachigen Raum mit einem Malkreuz 
×
\times  als Multiplikationszeichen geschrieben

*Spatprodukt*

* Das [Spatprodukt](https://de.m.wikipedia.org/wiki/Spatprodukt), auch gemischtes Produkt genannt, ist das Skalarprodukt aus dem Kreuzprodukt zweier Vektoren und einem dritten Vektor. 

* Siehe auch [Parallelepiped (Spat)](https://de.m.wikipedia.org/wiki/Parallelepiped)

*Direktes Produkt*

* ein [direktes Produkt](https://de.m.wikipedia.org/wiki/Direktes_Produkt) ist eine mathematische Struktur, die mit Hilfe des kartesischen Produkts aus vorhandenen mathematischen Strukturen gebildet wird. 

* Wichtige Beispiele sind das direkte Produkt von Gruppen, Ringen und anderen algebraischen Strukturen, sowie direkte Produkte von nichtalgebraischen Strukturen wie topologischen Räumen.

###### **Beispiele fur Vektorraume**

https://de.m.wikipedia.org/wiki/Vektorraum#Vektorr%C3%A4ume_mit_zus%C3%A4tzlicher_Struktur

**Funktionenraum**

https://de.m.wikipedia.org/wiki/Funktionenraum

**Folgenraum**

https://de.m.wikipedia.org/wiki/Folgenraum

**Polynomräume**

https://de.m.wikipedia.org/wiki/Vektorraum#Polynomr%C3%A4ume

#### **Vektorraum: Lineare Abbildungen zwischen unendlichdimensionalen Vektorräumen**

* Insbesondere in der Funktionalanalysis betrachtet man [lineare Abbildungen zwischen unendlichdimensionalen Vektorräumen](https://de.m.wikipedia.org/wiki/Lineare_Abbildung#Lineare_Abbildungen_zwischen_unendlichdimensionalen_Vektorr%C3%A4umen). 

* In diesem Kontext nennt man die linearen Abbildungen meist [lineare Operatoren](https://de.m.wikipedia.org/wiki/Linearer_Operator). 

* Die betrachteten Vektorräume tragen meist noch die zusätzliche Struktur eines [normierten](https://de.m.wikipedia.org/wiki/Normierter_Raum) vollständigen Vektorraums. Solche Vektorräume heißen [Banachräume](https://de.m.wikipedia.org/wiki/Banachraum). 

* Im Gegensatz zum endlichdimensionalen Fall reicht es nicht, lineare Operatoren nur auf einer Basis zu untersuchen. Nach dem baireschen Kategoriensatz hat nämlich eine Basis eines unendlichdimensionalen Banachraums überabzählbar viele Elemente und die Existenz einer solchen Basis lässt sich nicht konstruktiv begründen, das heißt nur unter Verwendung des [Auswahlaxioms](https://de.m.wikipedia.org/wiki/Auswahlaxiom) (Zermelo-Fraenkel-Mengenlehre). 

* Man verwendet daher einen anderen Basisbegriff, etwa [Orthonormalbasen](https://de.m.wikipedia.org/wiki/Orthonormalbasis) oder allgemeiner [Schauderbasen](https://de.m.wikipedia.org/wiki/Schauderbasis). 

  * In der Funktionalanalysis wird eine Folge $\left(b_{n}\right)_{n \in \mathbb{N}}$ eines Banachraums als Schauderbasis bezeichnet, falls jeder Vektor bezüglich ihr eine eindeutige Darstellung als (unendliche) Linearkombination hat. 
  
  * Sie ist zu unterscheiden von der [Hamelbasis](https://de.m.wikipedia.org/wiki/Basis_(Vektorraum)), von der verlangt wird, dass sich jeder Vektor als endliche Linearkombination der Basiselemente darstellen lässt.--

* Damit können gewisse Operatoren wie zum Beispiel [Hilbert-Schmidt-Operatoren](https://de.m.wikipedia.org/wiki/Hilbert-Schmidt-Operator) mithilfe „unendlich großer Matrizen“ dargestellt werden, wobei dann auch unendliche Linearkombinationen zugelassen werden müssen.

