# Numpy学习记录
最近在学习科学计算相关的Python库，因此先来整理一下Numpy这个最基本的库。
下面是首先导入numpy和matplotlib库的约定

In [1]:
import numpy as np
import matplotlib.pyplot as plt

Numpy中包含ndarray和matrix两个对象，而其中ndarray又是非常常用的多维数组对象。

### 创建ndarray数组

In [2]:
data = np.array([[2,4,5,6],[2,3,1,3]])
data

array([[2, 4, 5, 6],
       [2, 3, 1, 3]])

能够创建ndarray的np函数有array(),arrang(),linespace(),ones(),zeros()

In [3]:
data2 = np.linspace(1,20,20)
data2

array([  1.,   2.,   3.,   4.,   5.,   6.,   7.,   8.,   9.,  10.,  11.,
        12.,  13.,  14.,  15.,  16.,  17.,  18.,  19.,  20.])

### 1 、ndarray的一些参数

In [4]:
data.dtype

dtype('int32')

In [5]:
data.shape

(2, 4)

In [6]:
data.ndim

2

### 2、索引和切片

In [7]:
data[:,2:3]

array([[5],
       [1]])

In [8]:
data[0:2,[1,2]]

array([[4, 5],
       [3, 1]])

直接索引和切片是比较简单的查找数据的方式，通过这种方式得到的仍然是ndarray对象，并且是原对象的浅拷贝，如果需要深拷贝建立副本的话使用copy()函数即可。索引中有一种比较重要又难以理解的的方式，布尔型索引。

In [9]:
names = np.array(['zhou','li','wang','zhang'])
names == 'zhou'

array([ True, False, False, False], dtype=bool)

In [10]:
data[:,names == 'zhou']

array([[2],
       [2]])

In [11]:
data[data > 2] = -1
data

array([[ 2, -1, -1, -1],
       [ 2, -1,  1, -1]])

总结：基本上索引方式都可以认为是索引时传给数组一个行号的数组，一个列号的数组从而实现索引。

### 3、数组的一些操作
通常对数组来说有reshape()，transpose()来进行数组形状的改变。
除此之外还有一些元素级别的操作例如abs()，add()等，这两个部分较为简单。
利用np.where进行一些判断逻辑操作np.where(con,x,y)

In [12]:
arr = np.random.randn(3,4)
arr

array([[ 0.43902481, -0.71598515, -0.29229109,  1.47960366],
       [-0.41818462, -0.51393751, -0.13377322, -1.4436627 ],
       [ 0.18593743,  1.15210741, -0.67014517,  2.2018497 ]])

In [13]:
np.where(arr>0,2,-2)

array([[ 2, -2, -2,  2],
       [-2, -2, -2, -2],
       [ 2,  2, -2,  2]])

此外，还有一些数据统计的函数例如sum，sort，mean，可以计算出总体或者某行某列的数值。

In [14]:
arr.sort(axis = 1)
arr

array([[-0.71598515, -0.29229109,  0.43902481,  1.47960366],
       [-1.4436627 , -0.51393751, -0.41818462, -0.13377322],
       [-0.67014517,  0.18593743,  1.15210741,  2.2018497 ]])

In [15]:
names = np.append(names,'zhou')
np.unique(names)

array(['li', 'wang', 'zhang', 'zhou'], 
      dtype='<U5')

### 4、线性代数和随机数
numpy中的线性代数操作主要是包含在linalg这个模块中，我用的比较少，可能会用到的就是dot，inv，qr
而随机数就相对来说比较有用，可以主要掌握以下几个模块。

In [16]:
np.random.rand(2,4)  # 产生0~1的随机数

array([[ 0.26970185,  0.40492813,  0.17614584,  0.54370365],
       [ 0.03209999,  0.28651036,  0.74425983,  0.02604322]])

In [17]:
np.random.randn(2,4) # 产生标准正态分布（0，1）

array([[-1.27238813,  0.25136539, -1.68008268, -1.28196789],
       [ 0.38298877, -0.35651327,  0.54964306,  0.98343527]])

In [18]:
np.random.randint(1,10) # 上下限范围内随机整数

3

### 5、矩阵相关
matrix的意义在于使矩阵操作更加像matlab中的操作，这样既简单又容易移植。但是这里存在的问题是经常会跟ndarray混淆，所以最好只使用ndarray。但是使用ndarray又有一些很不舒服的地方，比如对一维数组的矩阵相乘就很麻烦。但是我们只需要记住一个结论，当两个数组shape表示的形式靠近的数相同时，才能相乘。例如：（10，10 * 1） ，（10，10），（1 * 10，10）  
矩阵点乘 np.dot(x,y)

In [19]:
a = np.array([0,1,3,4]) #注意这是一维的
a,a.ndim

(array([0, 1, 3, 4]), 1)

In [20]:
#使用这样的数组最好进行转置
b = np.random.rand(4,3)
a.dot(b)

array([ 4.68473789,  6.85917889,  5.20869666])

还有一点要注意的就是数组的维度，使用reshape来转换时，reshape(里面加元组变成多维变量，加整数为一维变量)