# Scipy Learning Record
Scipy是指Scipy.org技术生态圈中的Scipy模块，此模块因为涉及学术性质较强、工科专业应用领域较强，没有其他库那么普及。且中文学习资料不多。

结合Scipy特点，取其精华，弃其糟粕。将其可能会在未来数据科学用到的内容做记录。

纵观Scipy模块，共包含如下子功能：

- Basic functions(基础函数)
- Special functions (scipy.special)(工科数学中常见的特殊函数)
- Integration (scipy.integrate)(积分)
- Optimization (scipy.optimize)(优化)
- Interpolation (scipy.interpolate)(插值法)
- Fourier Transforms (scipy.fftpack)(傅里叶变换)
- Signal Processing (scipy.signal)(信号处理)
- Linear Algebra (scipy.linalg)(线性代数)
- Sparse Eigenvalue Problems with ARPACK(用ARPACK解决的系数矩阵特征值问题)
- Compressed Sparse Graph Routines (scipy.sparse.csgraph)(压缩稀疏图方法)
- Spatial data structures and algorithms (scipy.spatial)(空间数据结构和算法)
- Statistics (scipy.stats)(统计学)
- Multidimensional image processing (scipy.ndimage)(多维图像处理)
- File IO (scipy.io)(文件传输接口)

从包含模块可以看出，Scipy的学科性质很强，为各学科提供了相关的科学计算方法，试图实现工科生最爱的Matlab的方法。

## Introduction
Scipy是一个以Numpy为基础扩展的科学计算算法库，能给用户提供高级的Python交互接口和可视化接口。Scipy使得Python可以成为能与MATLAB, IDL, Octave, R-Lab, and SciLab相媲美的数据处理系统。（翻译于官方文档）

## Basic Functions
Scipy是基于Numpy的，所以np的对象皆可以被Scipy的函数接收，下面介绍几个Np在Scipy应用中常用(需要解释的)的几个函数技巧：

In [16]:
# index tricks
import numpy as np
a = np.concatenate(([3], [0]*5, np.arange(-1, 1.002, 2/9.0)))
a

array([ 3.        ,  0.        ,  0.        ,  0.        ,  0.        ,
        0.        , -1.        , -0.77777778, -0.55555556, -0.33333333,
       -0.11111111,  0.11111111,  0.33333333,  0.55555556,  0.77777778,
        1.        ])

In [17]:
# r_是指按行堆积， 同理c_是按列堆积；
# -1:1:10j 等同于 np.linspace(-1,1,10)， 不加j，10的意思是步长
b = np.r_[[3],[0]*5,-1:1:10j] 
b, all(a==b)

(array([ 3.        ,  0.        ,  0.        ,  0.        ,  0.        ,
         0.        , -1.        , -0.77777778, -0.55555556, -0.33333333,
        -0.11111111,  0.11111111,  0.33333333,  0.55555556,  0.77777778,
         1.        ]), True)

In [18]:
# mgrid函数，相当于meshgrid 只不过index的操作更加简洁（其实是更加让人难理解。。。）
np.mgrid[0:5,0:5]
np.mgrid[0:5:4j,0:5:4j]

array([[[0.        , 0.        , 0.        , 0.        ],
        [1.66666667, 1.66666667, 1.66666667, 1.66666667],
        [3.33333333, 3.33333333, 3.33333333, 3.33333333],
        [5.        , 5.        , 5.        , 5.        ]],

       [[0.        , 1.66666667, 3.33333333, 5.        ],
        [0.        , 1.66666667, 3.33333333, 5.        ],
        [0.        , 1.66666667, 3.33333333, 5.        ],
        [0.        , 1.66666667, 3.33333333, 5.        ]]])

In [19]:
# 如果只是想创建网格，可以使用ogrid（open grid）函数。利用Np的广播计算规则可以进行等价运算；
# 另外这个函数比较节省内存
np.ogrid[0:5,0:5]

[array([[0],
        [1],
        [2],
        [3],
        [4]]), array([[0, 1, 2, 3, 4]])]

In [20]:
# 运算是等价的
x1 , x2 = np.mgrid[0:5,0:5]
y1, y2 = np.ogrid[0:5,0:5]
def func(x,y):
    return x**2 + y**2
(func(x1,x2) == func(y1,y2)).all()

True

In [21]:
# 多项式 Polynomals
p = np.poly1d([3,2,1])
# 按照幂的次数传入系数
print(p)

   2
3 x + 2 x + 1


In [22]:
# 求根
p.r

array([-0.33333333+0.47140452j, -0.33333333-0.47140452j])

In [23]:
# 求值
p(p.r)

array([0.+5.55111512e-17j, 0.-5.55111512e-17j])

In [24]:
# 运算
print(p*p)

   4      3      2
9 x + 12 x + 10 x + 4 x + 1


In [25]:
p = np.poly1d([3,2,1],r = True, variable = 'z')
print(p)

   3     2
1 z - 6 z + 11 z - 6


解释上面的几个参数：

r: root = Ture时前面传入的参数作为根，多项式就是$(x-3)(x-2)(x-1)$

variable: 更换变向的表示，默认是x

In [26]:
# Vectorize Class
# 可以用来使传入标量，返回标量的Python函数可以像Np广播一样进行向量化计算
# 如计算分段函数时：
def func(a,b):
    if a<b :
        return a+b
    else:
        return a- b 
vect = np.vectorize(func)
vect([1,2,4],[2,1,3])

array([3, 1, 1])

## Integration 
考虑到数据科学中计算积分的情况不多，只列举通用积分的形式（实际上这个库还可以计算好几种积分，高斯积分、多重积分、混合积分等）
还可以用来解常微分方程、偏微分方程...

In [29]:
from scipy.integrate import quad
def int_func(x,a,b):
    return a*x**2 +b 
a = 3
b = 2
I = quad(int_func,0,1,args = (a,b))
I

(3.0, 3.3306690738754696e-14)

上面计算的积分是：
$$\int_0^1{ax^2+b}$$
quad参数解释：
- quad(fuc,下限，上限，函数参数)

## Optimization (scipy.optimize)
可以在[这里](https://docs.scipy.org/doc/scipy/reference/optimize.html#module-scipy.optimize)找到所有关于Optimization模块的功能函数。大致分为三大类：
- 最优化
- 求根
- 线性规划

### Unconstrained minimization of multivariate scalar functions (minimize)
无约束的多元标量函数最小值，如Rosebrock函数，是最优化领域内有名的测试函数
$$f(x) = \sum_i^{N-1}100(x_i-x_{i-1}^2)^2+(1-x_{i-1})^2$$

#### Nelder-Mead Simplex algorithm 单纯型法 (Method = 'nelder-mead')
传统的单纯性迭代方法，因为不用梯度计算较少，但是迭代次数较多

In [39]:
from scipy.optimize import minimize
def min_func(x):
    return sum(100*(x[1:]-x[:-1]**2)**2 + (1-x[:-1])**2)
x0 = np.array([1.3, 0.7, 0.8, 1.9, 1.2])
res = minimize(min_func,x0,method = 'nelder-mead',options={'xtol': 1e-8, 'disp': True})

Optimization terminated successfully.
         Current function value: 0.000000
         Iterations: 339
         Function evaluations: 571


In [40]:
res.x # 查看结果

array([1., 1., 1., 1., 1.])

#### Broyden-Fletcher-Goldfarb-Shanno algorithm (Method = 'BFGS')
这个算法算是牛顿法的扩展，主要用雅克比矩阵，需要我们自己编写求出来
$$f(x) = \sum_i^{N-1}100(x_i-x_{i-1}^2)^2+(1-x_{i-1})^2$$
$$\frac{\partial f(x)}{\partial x_j} = \sum_i^{N-1}{200(x_i-x_{i-1}^2)(\delta_{j,i}-2\delta_{j,i-1}x_{i-1}) + 2(1-x_{i-1}\delta_{j,i-1})}$$
$$= 200(x_j-x_{j-1}^2) - 400x_j(x_{j+1}-x_j^2)-2(1-x_j)$$
其中，$$\delta_{j,i} = \frac{\partial f(x)}{\partial x}$$

In [37]:
# 自行构造计算雅克比矩阵的函数：
def rosen_der(x):
    xm = x[1:-1]
    xm_m1 = x[:-2]
    xm_p1 = x[2:]
    der = np.zeros_like(x)
    der[1:-1] = 200*(xm-xm_m1**2) - 400*(xm_p1 - xm**2)*xm - 2*(1-xm)
    der[0] = -400*x[0]*(x[1]-x[0]**2) - 2*(1-x[0])
    der[-1] = 200*(x[-1]-x[-2]**2)
    return der

In [41]:
res = minimize(min_func,x0,method = 'BFGS',jac = rosen_der,options={'disp': True})

Optimization terminated successfully.
         Current function value: 0.000000
         Iterations: 25
         Function evaluations: 30
         Gradient evaluations: 30


In [42]:
res.x

array([1.00000004, 1.0000001 , 1.00000021, 1.00000044, 1.00000092])

#### Newton-Conjugate-Gradient algorithm 牛顿共轭梯度下降法 (method = 'Newton-CG')
此方法是先将函数泰勒展开：
$$f(x) = f(x_0) + \nabla f(x_0)(x-x_0)+\frac{1}{2}(x-x_0)^TH(X)(x-x_0)$$
求导：
$$f'(x) = \nabla f(x)+H(x)(x-x_0) = 0$$
得到：
$$x_{opt} = x_0 - H^{-1}(X)\nabla f$$

所以此方法的关键在于写出求Hessen矩阵的函数

In [49]:
# 计算Hessen矩阵的函数：
def rosen_hess(x):
    x = np.asarray(x)
    H = np.diag(-400*x[:-1],1) - np.diag(400*x[:-1],-1)
    diagonal = np.zeros_like(x)
    diagonal[0] = 1200*x[0]**2-400*x[1]+2
    diagonal[-1] = 200
    diagonal[1:-1] = 202 + 1200*x[1:-1]**2 - 400*x[2:]
    H = H + np.diag(diagonal)
    return H
res = minimize(min_func,x0,method = 'Newton-CG',jac = rosen_der,hess = rosen_hess,
               options={'xtol': 1e-8, 'disp': True})

Optimization terminated successfully.
         Current function value: 0.000000
         Iterations: 24
         Function evaluations: 33
         Gradient evaluations: 56
         Hessian evaluations: 24


In [50]:
res.x

array([1.        , 1.        , 1.        , 0.99999999, 0.99999999])

#### Trust-Region Newton-Conjugate-Gradient Algorithm (method='trust-ncg')
