In [42]:
import numpy as np
np.__version__

'1.16.2'

## 关于数据的维度
* 数据组织的维度和数据属性的维度似乎不一样
* 数据组织的维度是以一维数组、二维数组、多维数组等形式来表示
* 数据属性的维度是一个数据对象具有多少个属性

In [43]:
l = [2,4,5,6,8]
a = np.array(l)
a

array([2, 4, 5, 6, 8])

In [44]:
a.ndim

1

In [45]:
a.shape

(5,)

In [46]:
a.size

5

## 基本运算操作


In [47]:
# + - × ÷ 
a = np.arange(4).reshape(2,2)
b = np.array([[4,3],[2,1]])

In [48]:
a

array([[0, 1],
       [2, 3]])

In [49]:
b

array([[4, 3],
       [2, 1]])

In [50]:
a + b

array([[4, 4],
       [4, 4]])

In [51]:
a * b 

array([[0, 3],
       [4, 3]])

In [52]:
# 矩阵乘法 使用@符号，但要求Python版本3.5以上，或者使用dot方法
a @ b

array([[ 2,  1],
       [14,  9]])

In [53]:
a.dot(b)

array([[ 2,  1],
       [14,  9]])

In [54]:
# +=、-=、*=、/=诸如这些符号表示在左边操作对象上就地修改,但还不支持@=这种操作，可以使用a = a @ b
a+=b

In [55]:
a

array([[4, 4],
       [4, 4]])

In [56]:
b

array([[4, 3],
       [2, 1]])

In [57]:
a*=b

In [58]:
a

array([[16, 12],
       [ 8,  4]])

In [59]:
a/=b

TypeError: No loop matching the specified signature and casting
was found for ufunc true_divide

## 关于轴的问题

In [65]:
a = np.arange(24).reshape(2,3,4)
a

array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],
        [16, 17, 18, 19],
        [20, 21, 22, 23]]])

In [66]:
# np的shape(2,3,4)表示数据被分为2组3行4列，分别是对应（0，1,2）维度
# 维度从最外层开始算起，从0开始，最后的维度最高，就是列方向
# 可以想象这些数字是摆放在三维空间上的，z,y,x分别对应第（0,1,2）维，按照某个维度计算就是把这个维度给压缩掉
# 压缩的时候必然导致几个数字重叠，这些重叠的数之间进行计算后取得的降维数组就是按照轴计算的结果
a.sum(axis=0)

array([[12, 14, 16, 18],
       [20, 22, 24, 26],
       [28, 30, 32, 34]])

In [67]:
a.sum(axis=1)

array([[12, 15, 18, 21],
       [48, 51, 54, 57]])

In [68]:
a.sum(axis=2)

array([[ 6, 22, 38],
       [54, 70, 86]])

## 创建数组

### 从列表和元组中创建
### 使用numpy函数
### 从字节流中创建
### 从文件中读取

In [69]:
# linspace 指定起始点和元素个数
np.linspace(0,10,4)

array([ 0.        ,  3.33333333,  6.66666667, 10.        ])

In [70]:
# 默认包括终点，设置endpoint=False可以不包括终点
np.linspace(0,10,4, endpoint=False)

array([0. , 2.5, 5. , 7.5])

In [71]:
# 默认创建50个点
a = np.linspace(0,10)
print(a.size)
a

50


array([ 0.        ,  0.20408163,  0.40816327,  0.6122449 ,  0.81632653,
        1.02040816,  1.2244898 ,  1.42857143,  1.63265306,  1.83673469,
        2.04081633,  2.24489796,  2.44897959,  2.65306122,  2.85714286,
        3.06122449,  3.26530612,  3.46938776,  3.67346939,  3.87755102,
        4.08163265,  4.28571429,  4.48979592,  4.69387755,  4.89795918,
        5.10204082,  5.30612245,  5.51020408,  5.71428571,  5.91836735,
        6.12244898,  6.32653061,  6.53061224,  6.73469388,  6.93877551,
        7.14285714,  7.34693878,  7.55102041,  7.75510204,  7.95918367,
        8.16326531,  8.36734694,  8.57142857,  8.7755102 ,  8.97959184,
        9.18367347,  9.3877551 ,  9.59183673,  9.79591837, 10.        ])

### 拼接和分割

In [72]:
# concatenate
a = np.arange(5)
b = np.zeros(5)
# np.concatenate(a,b) # 错
np.concatenate((a,b))

array([0., 1., 2., 3., 4., 0., 0., 0., 0., 0.])

### 数组维度变化


In [73]:
a = np.ones((2,3,4))
a

array([[[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]],

       [[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]]])

In [74]:
# ndarray.reshape不改变原数组
a.reshape(4,6)

array([[1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1.]])

In [75]:
a

array([[[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]],

       [[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]]])

In [76]:
# ndarray.resize改变原来数组
a.resize(4,6)   # 就地修改，没有返回值

In [77]:
a

array([[1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1.]])

In [78]:
# a.flatten()   # 降低成一维
a = np.arange(24).reshape(2,3,4)
a.flatten()  

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23])

In [79]:
# np.ravel(a)
a = np.arange(24).reshape(2,3,4)
np.ravel(a)

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23])

In [80]:
# 转置
a = np.arange(8).reshape(2,4)
a

array([[0, 1, 2, 3],
       [4, 5, 6, 7]])

In [81]:
a.T

array([[0, 4],
       [1, 5],
       [2, 6],
       [3, 7]])

### 数据类型转换

In [82]:
# ndarray.astype方法一定会创建一个新的数组，及时两个数组类型一样
a = np.arange(24)
b = a.astype(np.float)
a

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23])

In [83]:
b

array([ 0.,  1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9., 10., 11., 12.,
       13., 14., 15., 16., 17., 18., 19., 20., 21., 22., 23.])

### 索引、切片和遍历

In [84]:
b = np.arange(6).reshape(3,2)
for i in b:    # 对于二维数组，相当与遍历行
    print(i)

[0 1]
[2 3]
[4 5]


In [85]:
for i in b.flat:
    print(i)

0
1
2
3
4
5


### 通用函数