# 解けない連立方程式

これまで解ける連立方程式の理論を学んできましたが，現実的には解けない連立方程式に遭遇する状況が多くあります．
それらの問題を「解無し」と済ましてしまうと，役に立たない線形代数になってしまいます．

線形代数の理論においては，解けない連立方程式に対して最適な近似解を求める理論を提供しています．

## 変数が1つの連立方程式

非常にシンプルな例題を提示します．

あるレアメタル発掘場において，その土壌にはほぼ均等にレアメタルが含まれているとのことです．
掘り出した土石の量と，そこに含まれるレアメタルの含有量を計測しました．

| 発掘ケース | 土石量 | レアメタル含有量 |
| :---: | :---: | :---:|
| 1 | $a_1$ | $b_1$ | 
| 2 | $a_2$ | $b_2$ |
| 3 | $a_3$ | $b_3$ |
| 4 | $a_4$ | $b_4$ |

この結果から，土石量に対するレアメタルの含有量の比率を求めます．

この測定結果を連立方程式にすると次のようになります．

$ \left\{ \begin{array}{c}
a_1x = b_1 \\
a_2x = b_2 \\
a_3x = b_3 \\
a_4x = b_4 \\
\end{array} \right. $

この方程式に現れるベクトルを
${\bf a} =
\left(\begin{array}{c}
a_1 \\ a_2 \\ a_3 \\ a_4 \\
\end{array}\right)$，
${\bf b} =
\left(\begin{array}{c}
b_1 \\ b_2 \\ b_3 \\ b_4 \\
\end{array}\right)$ 
としたとき，この連立方程式が解を持つためには，ある定数$k$があって${\bf b} = k{\bf a}$ が成立することです．
すなわち，ベクトル$\bf a$と$\bf b$が線形従属である必要があります．
しかし，本質的に2つの変量の間に線形関係があったとしても，現実的には様々な誤差の影響で線形従属は成立しません．

## 近似解のアプローチ

現実的な方法は，連立方程式の近似解を求めることです．

最適な近似解を$\tilde{\bf x}$としたとき，望まれることは，誤差が最小になることです．
誤差の評価方法は，連立方程式の左辺に近似解を代入したときの値を$\tilde{\bf b}$とし，$\tilde{\bf b}$と$\bf b$との差を誤差として評価します．

$ \left\{ \begin{array}{c}
a_1\tilde{x} = \tilde{b}_1 \\
a_2\tilde{x} = \tilde{b}_2 \\
a_3\tilde{x} = \tilde{b}_3 \\
a_4\tilde{x} = \tilde{b}_4 \\
\end{array} \right. $

私達は既に内積によるノルムと距離を導入しているので，$\tilde{\bf b}$と$\bf b$との誤差を$\|\tilde{\bf b}-{\bf b}\|$として評価することができます．
この誤差を$E$とします．
ノルムの性質により$E \geq 0$であるため，$E$を最小にすることは$E^2$を最小にすることと同値になります．
よって，変数$x$の関数である，

> $E^2 = {\|x{\bf a}-{\bf b}\|}^2$

が最小値となる$x$の値を求める問題となります．
この問題の解法は，<font color=blue>最小二乗法</font>と呼ばれています．

まず，誤差の二乗の式を詳細に記述します．

$E^2 = (a_1x-b_1)^2 + (a_2x-b_2)^2 + (a_3x-b_3)^2 + (a_4x-b_4)^2$

この式は変数$x$の2次関数になっていて，$x^2$の係数は正の数になっています．
なぜならば，$x^2$の係数は ${a_1}^2+{a_2}^2+{a_3}^2+{a_4}^2$ であり，暗黙の了解として$a_i \neq a_j$であるためです．
したがって，この関数は下に凸となります．

下に凸の関数の最小値は，その微分がゼロになるところです．
$\frac{dE^2}{dx}$は次式となります．

$\displaystyle \frac{dE^2}{dx} = 2a_1(a_1x-b_1)+2a_2(a_2x-b_2)+2a_3(a_3x-b_3)+2a_4(a_4x-b_4) $

$\frac{dE^2}{dx}=0$ の式変形を行います．

$\begin{eqnarray}
2a_1(a_1x-b_1)+2a_2(a_2x-b_2)+2a_3(a_3x-b_3)+2a_4(a_4x-b_4) &=& 0 \\
{a_1}^2x-a_1b_1+{a_2}^2x-a_2b_2+{a_3}^2x-a_3b_3+{a_4}^2x-a_4b_4 &=& 0 \\
{a_1}^2x+{a_2}^2x+{a_3}^2x+{a_4}^2x &=& a_1b_1+a_2b_2+a_3b_3+a_4b_4 \\
x &=& \frac{a_1b_1+a_2b_2+a_3b_3+a_4b_4 }{{a_1}^2+{a_2}^2+{a_3}^2+{a_4}^2} \\
x &=& \frac{{\bf a}^\mathsf{T}{\bf b}}{{\bf a}^\mathsf{T}{\bf a}} \\
x &=& \frac{\left<{\bf a},{\bf b}\right>}{{\|{\bf a}\|}^2}
\end{eqnarray}$

したがって，$\tilde{x} = \frac{\left<{\bf a},{\bf b}\right>}{{\|{\bf a}\|}^2}$が得られました．

この結果で注目すべき点は，$\tilde{x}$がベクトル$\bf b$をベクトル$\bf a$で構成される1次元の線形部分空間への射影の係数になっていることです．
すなわち，最小二乗法で解を求めることは，定数項ベクトルを係数行列の像の成す線形部分空間への射影を求めることに他なりません．

## 最小二乗法と射影

ここで重要な結果を得ることが出来ました．
それは，最小二乗法の論理展開においては微分や最適化の知識が必要でしたが，結果的にはベクトルの射影に帰結することが分かりました．

> <font color=blue>最小二乗法はベクトルの射影</font>

*****
## Pythonによる解法

ベクトル${\bf a},{\bf b}$が具体的に与えられている問題をPythonによって解いてみます．
計算が分かりやすいように簡単な例として，次の連立方程式を扱います．

$ \left\{ \begin{array}{c}
 x = 5 \\
2x = 5 \\
3x = 6 \\
4x = 7 \\
\end{array} \right. $

それでは，Pythonで行列計算を行うためにNumPyライブラリーをインポートします．

In [1]:
import numpy as np

この問題では，
${\bf a} =
\left(\begin{array}{c}
1 \\ 2 \\ 3 \\ 4 \\
\end{array}\right)$, 
${\bf b} =
\left(\begin{array}{c}
5 \\ 5 \\ 6 \\ 7 \\
\end{array}\right)$
となっていますので，これらの変数を生成します．

In [2]:
a = np.array([1,2,3,4])
a

array([1, 2, 3, 4])

In [3]:
b = np.array([5,5,6,7])

求める解は，$x = \frac{\left<{\bf a},{\bf b}\right>}{{\|{\bf a}\|}^2}$です．
ベクトルの内積はドット積で求めることができます．
例えば$\left<{\bf a},{\bf b}\right>$は，

> a.dot(b)

と記載することができます．

In [4]:
a.dot(b)

61

また，${\|{\bf a}\|}^2 = \left<{\bf a},{\bf a}\right>$であったので，

> a.dot(a)

によってベクトル$\bf a$のノルムの2乗を得ることができます．
あるいは，numpy.linalg.norm()関数によってノルムを求めることもできます．

In [5]:
a.dot(a)

30

In [6]:
np.linalg.norm(a) ** 2

30.0

ここではドット積を使用することにします．
すると，最小二乗法による近似解は，

> a.dot(b) / a.dot(a)

によって計算されます．

In [7]:
a.dot(b)/a.dot(a)

2.0333333333333332

以上のように，Pythonのドット積だけで最小二乗問題を解くことができました．
このPythonによる計算について，線形代数の理論を理解していないとプログラムの意味が分かりません．
**ツールに使われない**ためにも，線形代数の理論を身に付けましょう．
*****