## Numpy 数组操作
#### Numpy 中包含了一些函数用于处理数组，大概可分为以下几类：
* 修改数组形状
* 数组元素的添加与删除
* 翻转数组
* 修改数组维度
* 连接数组
* 分割数组


### 修改数组形状
* reshape	不改变数据的条件下修改形状
* flat	数组元素迭代器
* flatten	返回一份数组拷贝，对拷贝所做的修改不会影响原始数组
* ravel	返回展开数组

#### numpy.reshape
##### numpy.reshape 函数可以在不改变数据的条件下修改形状

In [None]:
import numpy as np
 
a = np.arange(8)
print ('原始数组：')
print (a)
print ('\n')
 
b = a.reshape(4,2)
print ('修改后的数组：')
print (b)
b[0,0]=100
print(b)
print(a)

In [None]:
import numpy as np

#把指定的数组矩阵改变形状,但是元素个数不变
#有时不知道数组的大小，或数组大小可变，但需要修改形状
d=np.arange(36).reshape(3,-1)  #将数组改为3行，列数不定
print(d)
print('-----------------------------------------------------------')
d=np.arange(36).reshape(-1,2)  #将数组改为2列，行数不定
print(d)

#### numpy.ndarray.flat  是一个数组元素迭代器

In [None]:
import numpy as np
 
a = np.arange(9).reshape(3,3) 
print ('原始数组：')
print(a)
print("-------------------------------------------------") 

for row in a:
    print (row)
print("-------------------------------------------------") 

#对数组中每个元素都进行处理，可以使用flat属性，该属性是一个数组元素迭代器：
print ('迭代后的数组：')
for element in a.flat:
    print (element,end=",")
print('\n')
print(a.flat)
print("-------------------------------------------------") 

for x in np.nditer(a):
    print (x, end="," )
print ('\n')

#### numpy.ndarray.flatten  返回一份数组拷贝，对拷贝所做的修改不会影响原始数组,格式如下：
* ndarray.flatten(order='C')

In [None]:
import numpy as np
 
a = np.arange(8).reshape(2,4)
 
print ('原数组：')
print (a)
print ('\n')
# 默认按行
 
print ('展开的数组：')
print (a.flatten())
print ('\n')
 
print ('以 F 风格顺序展开的数组：')
print (a.flatten(order = 'F'))
print ('\n')
b = a.flatten(order = 'F')
b[0] = 100
print (b)
print ('\n')
print (a)

#### numpy.ravel() 展平的数组元素，返回的是数组视图，修改会影响原始数组。
* numpy.ravel(a, order='C')
* order：'C' -- 按行，'F' -- 按列，'A' -- 原顺序，'K' -- 元素在内存中的出现顺序。

In [None]:
import numpy as np
 
a = np.arange(8).reshape(2,4)
 
print ('原数组：')
print (a)
print ('\n')
 
print ('调用 ravel 函数之后：')
print (a.ravel())
print ('\n')
 
print ('以 F 风格顺序调用 ravel 函数之后：')
print (a.ravel(order = 'F'))
print ('\n')

b = a.ravel()
b[0] = 100
print (b)
print ('\n')
print (a)

## 数组元素的添加与删除
* resize	返回指定形状的新数组
* append	将值添加到数组末尾
* insert	沿指定轴将值插入到指定下标之前
* delete	删掉某个轴的子数组，并返回删除后的新数组
* unique	查找数组内的唯一元素


####  numpy.resize 函数返回指定大小的新数组。 如果新数组大小大于原始大小，则包含原始数组中的元素的副本。

#### numpy.resize(arr, shape)
* arr：要修改大小的数组
* shape：返回数组的新形状

In [None]:
import numpy as np
 
a = np.array([[1,2,3],[4,5,6]])
 
print ('第一个数组：')
print (a)
print ('\n')
 
print ('第一个数组的形状：')
print (a.shape)
print ('\n')

b = np.resize(a, (3,2))
print ('第二个数组：')
print (b)
print ('\n')
 
print ('第二个数组的形状：')
print (b.shape)
print ('\n')

# 要注意 a 的第一行在 b 中重复出现，因为尺寸变大了
 
print ('修改第二个数组的大小：')
b = np.resize(a,(3,3))
print (b)
print(a)

#### numpy.append   函数在数组的末尾添加值。 追加操作会分配整个数组，并把原来的数组复制到新数组中。 此外，输入数组的维度必须匹配否则将生成ValueError。

* numpy.append(arr, values, axis=None)
* arr：输入数组
* values：要向arr添加的值，需要和arr形状相同（除了要添加的轴）
* axis：默认为 None。当axis无定义时，是横向加成，返回总是为一维数组！当axis为0的时候（列数要相同）,是横向加成。当axis为1时，数组是加在右边（行数要相同）。

In [None]:
import numpy as np
 
a = np.array([[1,2,3],[4,5,6]])
 
print ('第一个数组：')
print (a)
print ('\n')
 
print ('向数组添加元素：')
print (np.append(a, [7,8,9]))
print(a)
b = np.append(a, [7,8,9])
print(b)
print ('\n')
 
print ('沿轴 0 添加元素：')
print (np.append(a, [[7,8,9]],axis = 0))
print(a)
print ('\n')
 
print ('沿轴 1 添加元素：')
print (np.append(a, [[5,5,5],[7,8,9]],axis = 1))

#### numpy.insert 函数在给定索引之前，沿给定轴在输入数组中插入值。

* numpy.insert(arr, obj, values, axis)
* arr：输入数组
* obj：在其之前插入值的索引
* values：要插入的值
* axis：沿着它插入的轴，如果未提供，则输入数组会被展开

In [2]:
import numpy as np
 
a = np.array([[1,2],[3,4],[5,6]])
 
print ('第一个数组：')
print (a)
print ('\n')
 
print ('未传递 Axis 参数。 在插入之前输入数组会被展开。')
print (np.insert(a,3,[11,12]))
print("原数组a：\n",a)
print ('\n')

print ('传递了 Axis 参数。 会广播值数组来配输入数组。')
print ('沿轴 0 广播：')
print (np.insert(a,1,[11],axis = 0))
print ('\n')
 
print ('沿轴 1 广播：')
print (np.insert(a,1,11,axis = 1))

第一个数组：
[[1 2]
 [3 4]
 [5 6]]


未传递 Axis 参数。 在插入之前输入数组会被展开。
[ 1  2  3 11 12  4  5  6]
原数组a：
 [[1 2]
 [3 4]
 [5 6]]


传递了 Axis 参数。 会广播值数组来配输入数组。
沿轴 0 广播：
[[ 1  2]
 [11 11]
 [ 3  4]
 [ 5  6]]


沿轴 1 广播：
[[ 1 11  2]
 [ 3 11  4]
 [ 5 11  6]]


####  numpy.delete 函数返回从输入数组中删除指定子数组的新数组。 
* Numpy.delete(arr, obj, axis)
* arr：输入数组
* obj：可以被切片，整数或者整数数组，表明要从输入数组删除的子数组
* axis：沿着它删除给定子数组的轴，如果未提供，则输入数组会被展开

In [None]:
import numpy as np
 
a = np.arange(12).reshape(3,4)
 
print ('第一个数组：')
print (a)
print ('\n')
 
print ('未传递 Axis 参数。 在删除之前输入数组会被展开。')
print (np.delete(a,5))
print ('\n')
 
print ('删除第二列：')
print (np.delete(a,1,axis = 1))
print ('\n')
 


#### numpy.unique 函数用于去除数组中的重复元素。
* numpy.unique(arr, return_index, return_inverse, return_counts)
* arr：输入数组，如果不是一维数组则会展开
* return_index：如果为true，返回新列表元素在旧列表中的位置（下标），并以列表形式储
* return_inverse：如果为true，返回旧列表元素在新列表中的位置（下标），并以列表形式储
* return_counts：如果为true，返回去重数组中的元素在原数组中的出现次数

In [4]:
import numpy as np
 
a = np.array([5,2,6,2,7,5,6,8,2,9])
 
print ('第一个数组：')
print (a)
print ('\n')
 
print ('第一个数组的去重值：')
u = np.unique(a)
print (u)
print ('\n')
 
print ('去重数组的索引数组：')
u,indices = np.unique(a, return_index = True)
print (indices)
print ('\n')
 
print ('我们可以看到每个和原数组下标对应的数值：')
print (a)
print ('\n')
 
print ('去重数组的下标：')
u,indices = np.unique(a,return_inverse = True)
print (u)
print ('\n')
 
print ('下标为：')
print (indices)
print ('\n')
 
print ('使用下标重构原数组：')
print (u[indices])
print ('\n')
 
print ('返回去重元素的重复数量：')
u,indices = np.unique(a,return_counts = True)
print (u)
print (indices)

第一个数组：
[5 2 6 2 7 5 6 8 2 9]


第一个数组的去重值：
[2 5 6 7 8 9]


去重数组的索引数组：
[1 0 2 4 7 9]


我们可以看到每个和原数组下标对应的数值：
[5 2 6 2 7 5 6 8 2 9]


去重数组的下标：
[2 5 6 7 8 9]


下标为：
[1 0 2 0 3 1 2 4 0 5]


使用下标重构原数组：
[5 2 6 2 7 5 6 8 2 9]


返回去重元素的重复数量：
[2 5 6 7 8 9]
[3 2 2 1 1 1]


## 翻转数组
* transpose	对换数组的维度
* ndarray.T	和 self.transpose() 相同
* rollaxis	向后滚动指定的轴
* swapaxes	对换数组的两个轴

#### numpy.transpose 函数用于对换数组的维度，格式如下：

#### numpy.transpose(arr, axes)
* arr：要操作的数组
* axes：整数列表，对应维度，通常所有维度都会对换。

In [None]:
import numpy as np
 
a = np.arange(12).reshape(3,4)
 
print ('原数组：')
print (a )
print ('\n')
 
print ('对换数组：')
print (np.transpose(a))

# numpy.ndarray.T 类似 numpy.transpose
print ('对换数组：')
print (a.T)

### numpy.rollaxis 函数向后滚动特定的轴到一个特定位置，格式如下：
* numpy.rollaxis(arr, axis, start)
* arr：数组
* axis：要向后滚动的轴，其它轴的相对位置不会改变
* start：默认为零，表示完整的滚动。会滚动到特定位置。

In [None]:
import numpy as np
 
# 创建了三维的 ndarray
a = np.arange(8).reshape(2,2,2)
 
print ('原数组：')
print (a)
print ('\n')

# 将轴 2 滚动到轴 0（宽度到深度）
 
print ('调用 rollaxis 函数：')
print (np.rollaxis(a,2))

# 将轴 2 滚动到轴 1：（宽度到高度）
print ('\n')
 
print ('调用 rollaxis 函数：')
print (np.rollaxis(a,2,1))

#### numpy.swapaxes 函数用于交换数组的两个轴，格式如下：
* numpy.swapaxes(arr, axis1, axis2)
* arr：输入的数组
* axis1：对应第一个轴的整数
* axis2：对应第二个轴的整数

In [None]:
import numpy as np
 
# 创建了三维的 ndarray
a = np.arange(8).reshape(2,2,2)
 
print ('原数组：')
print (a)
print ('\n')

# 现在交换轴 0（深度方向）到轴 2（宽度方向）
 
print ('调用 swapaxes 函数后的数组：')
print (np.swapaxes(a, 2, 0))

## 修改数组维度
* broadcast	产生模仿广播的对象
* bbroadcast_to	将数组广播到新形状
* bexpand_dims	扩展数组的形状
* bsqueeze	从数组的形状中删除一维条目
#### numpy.broadcast 用于模仿广播的对象，它返回一个对象，该对象封装了将一个数组广播到另一个数组的结果。

In [None]:
import numpy as np
 
x = np.array([[1], [2], [3]])
y = np.array([4, 5, 6])  
print("x数组：\n",x) 
print("y数组：\n",y) 
# 对 y 广播 x
b = np.broadcast(x,y)  
#print("b数组：\n",b) 

print ('广播对象的形状：')
print (b.shape)
print ('\n')

# 它拥有 iterator 属性，基于自身组件的迭代器元组
r,c = b.iters
print ('对 y 广播 x：')
print (next(r), next(c))
print (next(r), next(c))
print (next(r), next(c))
print (next(r), next(c))
print (next(r), next(c))
print (next(r), next(c))
print (next(r), next(c))
print (next(r), next(c))
print (next(r), next(c))
print ('\n')

# 手动使用 broadcast 将 x 与 y 相加
b = np.broadcast(x,y)
c = np.empty(b.shape)
print (c.shape)

print ('手动使用 broadcast 将 x 与 y 相加：')
print ('\n')
c.flat = [u + v for (u,v) in b]
print (c)
print ('\n')

# 获得了和 NumPy 内建的广播支持相同的结果
print ('x 与 y 的和：')
print (x + y)

print ('x 与 y 的和：')
z = x+y
print(z)

##### 广播(Broadcast)是 numpy 对不同形状(shape)的数组进行数值计算的方式， 对数组的算术运算通常在相应的元素上进行。
##### 如果两个数组 a 和 b 形状相同，即满足 a.shape == b.shape，那么 a*b 的结果就是 a 与 b 数组对应位相乘。
##### 当运算中的 2 个数组的形状不同时，numpy 将自动触发广播机制。
##### 下面的图片展示了数组 b 如何通过广播来与数组 a 兼容。
![image.png](attachment:image.png)

In [None]:
x = np.array([[0,0,0], [10,10,10,], [20,20,20],[30,30,30]])
y = np.array([0,1,2])  
print(x)
print("\n")
print(y)
print("\n")
print(x+y)

#### numpy.broadcast_to  函数将数组广播到新形状。它在原始数组上返回只读视图。 它通常不连续。 如果新形状不符合 NumPy 的广播规则，该函数可能会抛出ValueError。
* numpy.broadcast_to(array, shape, subok)

In [None]:
import numpy as np
 
a = np.arange(4).reshape(1,4)
 
print ('原数组：')
print (a)
print ('\n')
 
print ('调用 broadcast_to 函数之后：')
b = np.broadcast_to(a,(4,4)) 
print (b)

#### numpy.expand_dims  函数通过在指定位置插入新的轴来扩展数组形状，函数格式如下:

* numpy.expand_dims(arr, axis)
* arr：输入数组
* axis：新轴插入的位置

In [None]:
import numpy as np
 
x = np.array(([1,2],[3,4]))
 
print ('数组 x：')
print (x)
print ('\n')

y = np.expand_dims(x, axis = 0)
print ('数组 y：')
print (y)
print ('\n')
 
print ('数组 x 和 y 的形状：')
print (x.shape, y.shape)
print ('---------------------------------------------')

y = np.expand_dims(x, axis = 1)
print ('数组 y：')
print (y)
print ('\n')
 
print ('数组 x 和 y 的形状：')
print (x.shape, y.shape)
print ('\n')

In [None]:
import numpy as np
 
x = np.array(([1,2],[3,4]))
 
print ('数组 x：')
print (x)
print ('\n')
y = np.expand_dims(x, axis = 0)
 
print ('数组 y：')
print (y)
print ('\n')
 
print ('数组 x 和 y 的形状：')
print (x.shape, y.shape)
print ('\n')

print(y[0])
print(y[0,1,1])

y = np.append(y, [[[5,6],[7,8]]],axis = 0)
print(y)
print (x.shape, y.shape)

In [None]:
import numpy as np
 
x = np.array(([1,2],[3,4]))
 
print ('数组 x：')
print (x)
print ('\n')

# 在位置 1 插入轴
y = np.expand_dims(x, axis = 1)
 
print ('在位置 1 插入轴之后的数组 y：')
print (y)
print ('\n')
 
print ('x.shape 和 y.shape：')
print (x.shape, y.shape)

print('---------------------------------')
print(y[0])
print(y[0,0])
print(y[1])
print(y[1,0])

In [None]:
import numpy as np
 
x = np.array(([1,2],[3,4]))
 
print ('数组 x：')
print (x)
print ('\n')

# 在位置 1 插入轴
y = np.expand_dims(x, axis = 2)
 
print ('在位置 1 插入轴之后的数组 y：')
print (y)
print ('\n')
 
print ('x.shape 和 y.shape：')
print (x.shape, y.shape)

print ('===============================================')
print(y[0])
print(y[0,0])
print(y[1])
print(y[1,0])

#### numpy.squeeze 函数从给定数组的形状中删除一维的条目，函数格式如下：
* numpy.squeeze(arr, axis)
* arr：输入数组
* axis：整数或整数元组，用于选择形状中一维条目的子集

In [None]:
import numpy as np
 
x = np.arange(9).reshape(1,3,3)
 
print ('数组 x：')
print (x)
print ('\n')
y = np.squeeze(x)
 
print ('数组 y：')
print (y)
print ('\n')
 
print ('数组 x 和 y 的形状：')
print (x.shape, y.shape)

## 连接数组
* concatenate	连接沿现有轴的数组序列
* stack	沿着新的轴加入一系列数组。
* hstack	水平堆叠序列中的数组（列方向）
* vstack	竖直堆叠序列中的数组（行方向）


####  numpy.concatenate 函数用于沿指定轴连接相同形状的两个或多个数组，格式如下：
* numpy.concatenate((a1, a2, ...), axis)
* a1, a2, ...：相同类型的数组
* axis：沿着它连接数组的轴，默认为 0

In [None]:
import numpy as np
 
a = np.array([[1,2],[3,4]])
print ('第一个数组：')
print (a)
print ('\n')

b = np.array([[5,6],[7,8]])
print ('第二个数组：')
print (b)
print ('\n')
# 两个数组的维度相同
 
print ('沿轴 0 连接两个数组：')
print (np.concatenate((a,b)))
print ('\n')
 
print ('沿轴 1 连接两个数组：')
print (np.concatenate((a,b),axis = 1))

#### numpy.stack 函数用于沿新轴连接数组序列，格式如下：
* numpy.stack(arrays, axis)
* arrays相同形状的数组序列
* axis：返回数组中的轴，输入数组沿着它来堆叠

In [None]:
import numpy as np
 
a = np.array([[1,2],[3,4]])
print ('第一个数组：')
print (a)
print ('\n')

b = np.array([[5,6],[7,8]])
print ('第二个数组：')
print (b)
print ('\n')
 
print ('沿轴 0 堆叠两个数组：')
z = np.stack((a,b),0)
print (z)
print("z.shape:\n",z.shape) 
print ('\n')

print ('沿轴 1 堆叠两个数组：')
print (np.stack((a,b),1))



#### numpy.hstack 是 numpy.stack 函数的变体，它通过水平堆叠来生成数组。

In [None]:
import numpy as np
 
a = np.array([[1,2],[3,4]])
 
print ('第一个数组：')
print (a)
print ('\n')
b = np.array([[5,6],[7,8]])
 
print ('第二个数组：')
print (b)
print ('\n')
 
print ('水平堆叠：')
c = np.hstack((a,b))
print (c)
print ('\n')

#### numpy.vstack 是 numpy.stack 函数的变体，它通过垂直堆叠来生成数组。

In [None]:
import numpy as np
 
a = np.array([[1,2],[3,4]])
 
print ('第一个数组：')
print (a)
print ('\n')
b = np.array([[5,6],[7,8]])
 
print ('第二个数组：')
print (b)
print ('\n')
 
print ('竖直堆叠：')
c = np.vstack((a,b))
print (c)

In [None]:
# NumPy数组：组合数组(深度组合）
from numpy import *

a = arange(12).reshape(2,6)
b = a * 2
c = a * 3
d = a * 4
print(a)
print(b)
print(c)
print(d)
e = dstack((a,b,c,d))
print(e)
print(e.shape)
print(a[0][0])  # 0
print(b[0][0])  # 0
print(c[0][0])  # 0
print(d[0][0])  # 0

print(e[0][0])
print(e[0][1])
print(e[1][1])


## 分割数组
* split	将一个数组分割为多个子数组
* hsplit	将一个数组水平分割为多个子数组（按列）
* vsplit	将一个数组垂直分割为多个子数组（按行）


#### numpy.split 函数沿特定的轴将数组分割为子数组，格式如下：

* numpy.split(ary, indices_or_sections, axis)
* ary：被分割的数组
* indices_or_sections：如果是一个整数，就用该数平均切分，如果是一个数组，为沿轴切分的位置（左开右闭）
* axis：沿着哪个维度进行切向，默认为0，横向切分。为1时，纵向切分

In [None]:
import numpy as np
 
a = np.arange(9)
 
print ('第一个数组：')
print (a)
print ('\n')
 
print ('将数组分为三个大小相等的子数组：')
b = np.split(a,3)
print (b)
print ('\n')
 
print ('将数组在一维数组中表明的位置分割：')
b = np.split(a,[4,7])
print (b)

In [None]:
import numpy as np
 
a = np.arange(27).reshape(9,3)
 
print ('第一个数组：')
print (a)
print ('\n')
 
print ('延0轴将数组分为三个大小相等的子数组：')
b = np.split(a,3,axis=0)
print (b)
print ('\n')

print ('延1轴将数组分为三个大小相等的子数组：')
b = np.split(a,3,axis=1)
print (b)
print ('\n')

print ('延0轴将数组在表明的位置分割：')
b = np.split(a,[4,7],axis=0)
print (b)

#### numpy.hsplit 函数用于水平分割数组，通过指定要返回的相同形状的数组数量来拆分原数组。

In [None]:
import numpy as np
 
harr = np.arange(27).reshape(9,3)
print ('原array：')
print(harr)
 
print ('拆分后：')
print(np.hsplit(harr, 3))

In [None]:
import numpy as np
 
harr = np.floor(10 * np.random.random((2, 6)))
print ('原array：')
print(harr)
 
print ('拆分后：')
print(np.hsplit(harr, 3))

#### numpy.vsplit 沿着垂直轴分割，其分割方式与hsplit用法相同。

In [None]:
import numpy as np
 
a = np.arange(16).reshape(4,4)
 
print ('第一个数组：')
print (a)
print ('\n')
 
print ('竖直分割：')
b = np.vsplit(a,2)
print (b)