## 超定方程组 
对于方程组Ra=y，R为n×m矩阵，如果R列满秩，且n>m。则方程组没有精确解，此时称方程组为超定方程组。   
1. 超定方程一般是不存在解的矛盾方程，比较常用的方法是最小二乘法。  
2. 曲线拟合是最小二乘法要解决的问题，实际上就是求以上超定方程组的最小二乘解的问题。  


In [244]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
np.set_printoptions(suppress = True)

In [245]:
n = 1
m = 100
np.random.seed(5)
x = np.random.normal(0, 1, m * n).reshape(m, n)
np.random.seed(10)
y = np.dot(x, np.array(range(1, n + 1))) + np.random.normal(0, 0.1, m)

print(x[0], y[0])

[ 0.44122749] 0.574386137298


## 最小二乘法 
假设数据集有m行n列，且满足m > n，那么这个方程组有m个方程和n个未知数，无法求解   

由于：  
$e_{i} = Y_{i} - \hat{Y_{i}}$  

$e_{i} = Y_{i} - (\sum_{j=1}^{n}\beta_{j}X_{ij})$  

$MSE = \frac{1}{m}\sum_{i=1}^{m}e_{i}^2 = \frac{1}{m}\sum_{1}^{m}(Y_{i} - \sum_{j=1}^{n}\beta_{j}X_{ij})^2$  

显然我们不太可能找到一组解让MSE等于0，但是我们可以求出一组解让MSE最小。  上面关于MSE的等式称作损失函数，我们求解方程组的任务也转为最小化损失函数的值。对n个beta求偏导，令偏导数等于零，则得到n个方程组且有n个未知数，方程组有唯一解如下：

$\beta = (X^TX)^{-1}X^TY$

通过numpy的矩阵乘法、求逆和转置来实现least_squares_method，并与numpy自带的线性最小二乘求解函数np.linalg.lstsq进行结果对比

In [157]:
def add_bias(x):
    return np.concatenate((np.ones(x.shape[0]).reshape(-1,1), x), axis=1)


t = np.array(range(10)).reshape(5, 2)
print("The origin x is:\n", t, '\n')

t = add_bias(t)
print("The result is:\n", t, '\n')

The origin x is:
 [[0 1]
 [2 3]
 [4 5]
 [6 7]
 [8 9]] 

The result is:
 [[ 1.  0.  1.]
 [ 1.  2.  3.]
 [ 1.  4.  5.]
 [ 1.  6.  7.]
 [ 1.  8.  9.]] 



In [100]:
def least_squares_method(x, y):
    x = np.mat(add_bias(x))
    y = np.mat(y).T
    return np.array((x.T * x).I * x.T * y)

betas1 = least_squares_method(x, y)
betas2 = np.linalg.lstsq(add_bias(x), y)[0].reshape(-1, 1)
print(np.concatenate((betas1, betas2), axis=1))

[[ 0.00854145  0.00854145]
 [ 0.99778269  0.99778269]
 [ 1.9946594   1.9946594 ]
 [ 3.00730595  3.00730595]]


##  什么是牛顿法
牛顿法是一种在实数域和复数域上近似求解方程的方法。方法使用函数f(x)的泰勒级数的前面几项来寻找方程f(y)=0的根。  
泰勒公式，如果$f(x)$在点$x=x_0$具有任意阶导数，则幂级数  
$f(x) = \large\frac{f(x_0)}{0!}\normalsize+\large\frac{f'(x_0)}{1!} \normalsize(x-x_0)+\large\frac{f''(x_0)}{2!} \normalsize(x-x_0)^2
+...+\large\frac{f^{(n)}(x_0)}{n!} \normalsize(x-x_0)^n + R_n(x)$  
  
令$f(x_1) = 0$，取其线性部分，作为非线性方程的近似方程，则有：  
$f(x_0) + (x_1 - x_0)f'(x_0) = 0$  
  
解方程，得到：  
$x_1 = x_0 - \large\frac{f'(x_0)}{f(x_0)}$  
  
通过不断迭代，将上式推广得到：  
$x_{n+1} = x_n - \large\frac{f'(x_n)}{f(x_n)}$   

## 利用牛顿法求解最小二乘问题
$y = ax + b$  
$e = y - \hat{y}$  
$L = \large\frac{1}{m}\normalsize\sum_{i}^{m}e_{i}^2$

对a和b分别求偏导得到：  
$\large\frac{\partial L}{\partial a} \normalsize= \large\frac{\partial L}{\partial e} \frac{\partial e}{\partial \hat{y}} \frac{\partial \hat{y}}{\partial a}$
$= -\large\frac{2}{m}\normalsize\sum_{i}^{m}(y_{i}-ax_{i} - b)x_{i}$  

$\large\frac{\partial L}{\partial b} \normalsize= \large\frac{\partial L}{\partial e} \frac{\partial e}{\partial \hat{y}} \frac{\partial \hat{y}}{\partial b}$
$= -\large\frac{2}{m}\normalsize\sum_{i}^{m}(y_{i}-ax_{i} - b)$

In [242]:
def newton_method(x, y, lr = 0.001, epochs = 10000):
    x = add_bias(x)
    m, n = x.shape
    weights = np.zeros(n)
    
    for _ in range(epochs):
        weights_partial_1 = np.zeros(n)
        weights_partial_2 = np.zeros(n)
        for i in range(m):
            err = y[i] - weights * x[i]
            weights_partial_1 += err * x[i]
            weights_partial_2 += x[i] ** 2

        weights += lr * weights_partial_2 / weights_partial_1
    return weights

In [243]:
newton_method(x, y)

array([  2.75001954, -14.87697733,   9.51038721,  -0.18799211])

## 利用牛顿法求解根号2的近似值 

In [None]:
def square_root(n=2, lr=0.001, threhold=0.0001):
    return x

In [None]:
test = square_root(n=2, lr=0.001, threhold=0.0000001)

In [None]:
print(2**0.5 - test)