## Numpy 数组操作
- Numpy 中包含了一些函数用于处理数组，大概可分为以下几类：
- 修改数组形状
    - reshape	不改变数据的条件下修改形状
    - flat	    数组元素迭代器
    - flatten	返回一份数组拷贝，对拷贝所做的修改不会影响原始数组
    - ravel	    返回展开数组
- 翻转数组
    - transpose	对换数组的维度
    - ndarray.T	和 self.transpose() 相同
    - rollaxis	向后滚动指定的轴
    - swapaxes	对换数组的两个轴
- 修改数组维度
    - broadcast	    产生模仿广播的对象
    - broadcast_to	将数组广播到新形状
    - expand_dims	扩展数组的形状
    - squeeze	    从数组的形状中删除一维条目
- 连接数组
    - concatenate   连接沿现有轴的数组序列
    - stack	        沿着新的轴加入一系列数组。
    - hstack	    水平堆叠序列中的数组（列方向）
    - vstack	    竖直堆叠序列中的数组（行方向）
- 分割数组
    - split	    将一个数组分割为多个子数组
    - hsplit	将一个数组水平分割为多个子数组（按列）
    - vsplit	将一个数组垂直分割为多个子数组（按行）
- 数组元素的添加与删除
    - resize	返回指定形状的新数组
    - append	将值添加到数组末尾
    - insert	沿指定轴将值插入到指定下标之前
    - delete	删掉某个轴的子数组，并返回删除后的新数组
    - unique	查找数组内的唯一元素

In [1]:
import numpy as np
 
a = np.arange(8)
print ('原始数组：')
print (a)
print ('\n')
 
b = a.reshape(4,2)
print ('修改后的数组：')
print (b)

原始数组：
[0 1 2 3 4 5 6 7]


修改后的数组：
[[0 1]
 [2 3]
 [4 5]
 [6 7]]


In [5]:
import numpy as np
 
a = np.arange(8)
print ('原始数组：')
print (a)
print ('\n')
 
b = np.reshape(a,(4,2))
print ('修改后的数组：')
print (b)
print('\n')
b = np.reshape(a,(4,2),order='C')
print ('修改后的数组：')
print (b)

原始数组：
[0 1 2 3 4 5 6 7]


修改后的数组：
[[0 1]
 [2 3]
 [4 5]
 [6 7]]


修改后的数组：
[[0 1]
 [2 3]
 [4 5]
 [6 7]]


In [8]:
import numpy as np
b = np.reshape(a,(4,2))
print (b)
print('\n')
b = np.reshape(a,(4,2),order='C')
print (b)
print('\n')
b = np.reshape(a,(4,2),order='F')
print(b)
print('\n')
b = np.reshape(a,(4,2),order='A')
print(b)

[[0 1]
 [2 3]
 [4 5]
 [6 7]]


[[0 1]
 [2 3]
 [4 5]
 [6 7]]


[[0 4]
 [1 5]
 [2 6]
 [3 7]]


[[0 1]
 [2 3]
 [4 5]
 [6 7]]


In [10]:
# numpy.ndarray.flat 是一个数组元素迭代器，实例如下:
import numpy as np
a = np.arange(9).reshape(3,3)
for row in a:
    print(row)
print('\n')
#对数组中每个元素都进行处理，可以使用flat属性，该属性是一个数组元素迭代器：
for elem in a.flat:
    print(elem)

[0 1 2]
[3 4 5]
[6 7 8]


0
1
2
3
4
5
6
7
8


In [12]:
# numpy.ndarray.flatten 返回一份数组拷贝，对拷贝所做的修改不会影响原始数组，格式如下：
import numpy as np
a = np.arange(8).reshape(4,2)
print(a)
print('\n')
print(a.flatten(order='C'))
print('\n')
print(a.flatten(order='F'))

[[0 1]
 [2 3]
 [4 5]
 [6 7]]


[0 1 2 3 4 5 6 7]


[0 2 4 6 1 3 5 7]


In [13]:
# numpy.ravel() 展平的数组元素，顺序通常是"C风格"，返回的是数组视图（view，有点类似 C/C++引用reference的意味），修改会影响原始数组。
import numpy as np
a = np.arange(8).reshape(4,2)
print(a)
print('\n')
print(a.ravel(order='C'))
print('\n')
print(a.ravel(order='F'))
print('\n')
print(a)

[[0 1]
 [2 3]
 [4 5]
 [6 7]]


[0 1 2 3 4 5 6 7]


[0 2 4 6 1 3 5 7]


[[0 1]
 [2 3]
 [4 5]
 [6 7]]


In [3]:
import numpy as np
a = np.arange(12).reshape(3,4)
print(a)
print('\n')
print(np.transpose(a))
print(10*'==')
print(a.T)

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]


[[ 0  4  8]
 [ 1  5  9]
 [ 2  6 10]
 [ 3  7 11]]
[[ 0  4  8]
 [ 1  5  9]
 [ 2  6 10]
 [ 3  7 11]]


In [7]:
# numpy.rollaxis 函数向后滚动特定的轴到一个特定位置，格式如下：
import numpy as np
a = np.arange(8).reshape(2,2,2)
print(a)
print(10*'==')
print(np.rollaxis(a,2,0)) # 可理解为2轴及2轴前面的元素位置保持不变，但是2轴上的元素移动到0轴前面。
print(10*'==')
print(np.rollaxis(a,2,1)) # 可理解为下表2列的和1列的元素调换一下。

[[[0 1]
  [2 3]]

 [[4 5]
  [6 7]]]
[[[0 2]
  [4 6]]

 [[1 3]
  [5 7]]]
[[[0 2]
  [1 3]]

 [[4 6]
  [5 7]]]


In [13]:
# numpy.rollaxis(arr,axis,start) 函数向后滚动特定的轴到一个特定位置，格式如下：
# arr：数组
# axis：要向后滚动的轴，其它轴的相对位置不会改变
# start：默认为零，表示完整的滚动。会滚动到特定位置。
import numpy as np
a = np.arange(1,28,1).reshape(3,3,3)
print(a)
print(10*'==')
print(np.rollaxis(a,2,0)) # 可理解为
print(10*'==')
print(np.rollaxis(a,2,1)) # 可理解为下表2列的和1列的元素调换一下。
print(10*'==')
print(np.rollaxis(a,1,0))

[[[ 1  2  3]
  [ 4  5  6]
  [ 7  8  9]]

 [[10 11 12]
  [13 14 15]
  [16 17 18]]

 [[19 20 21]
  [22 23 24]
  [25 26 27]]]
[[[ 1  4  7]
  [10 13 16]
  [19 22 25]]

 [[ 2  5  8]
  [11 14 17]
  [20 23 26]]

 [[ 3  6  9]
  [12 15 18]
  [21 24 27]]]
[[[ 1  4  7]
  [ 2  5  8]
  [ 3  6  9]]

 [[10 13 16]
  [11 14 17]
  [12 15 18]]

 [[19 22 25]
  [20 23 26]
  [21 24 27]]]
[[[ 1  2  3]
  [10 11 12]
  [19 20 21]]

 [[ 4  5  6]
  [13 14 15]
  [22 23 24]]

 [[ 7  8  9]
  [16 17 18]
  [25 26 27]]]


In [14]:
# numpy.rollaxis(arr,axis,start) 函数向后滚动特定的轴到一个特定位置，格式如下：
# arr：数组
# axis：要向后滚动的轴，其它轴的相对位置不会改变
# start：默认为零，表示完整的滚动。会滚动到特定位置。
import numpy as np
a = np.arange(1,17,1).reshape(2,2,2,2)
print(a)
print(10*'==')
print(np.rollaxis(a,2,0)) #可理解为2轴及2轴前面的元素位置保持不变，但是2轴上的元素移动到0轴前面。2轴后面的元素会保持不动，不用管
print(10*'==')
print(np.rollaxis(a,2,1)) #可理解为下表2列的和1列的元素调换一下。
print(10*'==')
print(np.rollaxis(a,1,0))

[[[[ 1  2]
   [ 3  4]]

  [[ 5  6]
   [ 7  8]]]


 [[[ 9 10]
   [11 12]]

  [[13 14]
   [15 16]]]]
[[[[ 1  2]
   [ 5  6]]

  [[ 9 10]
   [13 14]]]


 [[[ 3  4]
   [ 7  8]]

  [[11 12]
   [15 16]]]]
[[[[ 1  2]
   [ 5  6]]

  [[ 3  4]
   [ 7  8]]]


 [[[ 9 10]
   [13 14]]

  [[11 12]
   [15 16]]]]
[[[[ 1  2]
   [ 3  4]]

  [[ 9 10]
   [11 12]]]


 [[[ 5  6]
   [ 7  8]]

  [[13 14]
   [15 16]]]]


In [9]:
# numpy.swapaxes 函数用于交换数组的两个轴，格式如下：
import numpy as np
a = np.arange(8).reshape(2,2,2)
print(a)
print(10*'==')
print(np.swapaxes(a,2,0)) # 现在交换轴 0到轴 2

[[[0 1]
  [2 3]]

 [[4 5]
  [6 7]]]
[[[0 4]
  [2 6]]

 [[1 5]
  [3 7]]]


In [24]:
# numpy.broadcast 用于模仿广播的对象，它返回一个对象，该对象封装了将一个数组广播到另一个数组的结果。
import numpy as np
x = np.array([[1],[2],[3]])
y = np.array([4,5,6])
# 对 y 广播 x
b = np.broadcast(x,y)
# 它拥有 iterator 属性，基于自身组件的迭代器元组
print ('对 y 广播 x：')
r,c = b.iters
print(next(r),next(c))
print(next(r),next(c))
# shape 属性返回广播对象的形状
print(b.shape)
# 手动使用 broadcast 将 x 与 y 相加
b = np.broadcast(x,y)
c = np.empty(b.shape)
print ('手动使用 broadcast 将 x 与 y 相加：')
print (c.shape)
print ('\n')
c.flat = [u + v for (u,v) in b]
print ('调用 flat 函数：')
print (c)
print ('\n')
# 获得了和 NumPy 内建的广播支持相同的结果
 
print ('x 与 y 的和：')
print (x + y)

对 y 广播 x：
1 4
1 5
(3, 3)
手动使用 broadcast 将 x 与 y 相加：
(3, 3)


调用 flat 函数：
[[5. 6. 7.]
 [6. 7. 8.]
 [7. 8. 9.]]


x 与 y 的和：
[[5 6 7]
 [6 7 8]
 [7 8 9]]


In [29]:
# numpy.broadcast_to 函数将数组广播到新形状。它在原始数组上返回只读视图。 
# 它通常不连续。 如果新形状不符合 NumPy 的广播规则，该函数可能会抛出ValueError。
import numpy as np
a = np.arange(4).reshape(1,4)
print(a)
print(a.shape)
print('\n')
print(np.broadcast_to(a,(4,4)))

[[0 1 2 3]]
(1, 4)


[[0 1 2 3]
 [0 1 2 3]
 [0 1 2 3]
 [0 1 2 3]]


In [40]:
# numpy.expand_dims 函数通过在指定位置插入新的轴来扩展数组形状，函数格式如下:
import numpy as np 
x = np.array(([1,2],[3,4]))
print(x)
print('\n')
print(np.expand_dims(x,axis=0))
print(10*'==')
print(x.shape,y.shape)
print(10*'==')
# 在位置 1 插入轴
y=np.expand_dims(x,axis=1)
print(y)
print(10*'==')
print(x.shape,y.shape)
print(10*'==')
print (x.shape, y.shape)

[[1 2]
 [3 4]]


[[[1 2]
  [3 4]]]
(2, 2) (2, 1, 2)
[[[1 2]]

 [[3 4]]]
(2, 2) (2, 1, 2)
(2, 2) (2, 1, 2)


In [42]:
# numpy.squeeze 函数从给定数组的形状中删除一维的条目，函数格式如下：
import numpy as np
a = np.arange(9).reshape(1,3,3)
print(a)
print('\n')
b = np.squeeze(a) # 三维变二维
print(b)

[[[0 1 2]
  [3 4 5]
  [6 7 8]]]


[[0 1 2]
 [3 4 5]
 [6 7 8]]


In [46]:
# numpy.concatenate 函数用于沿指定轴连接相同形状的两个或多个数组，格式如下：
import numpy as np
a = np.arange(4).reshape(2,2)
b = np.arange(5,9,1).reshape(2,2)
print(a)
print(10*'==')
print(b)
print(10*'==')
print(np.concatenate((a,b),axis=0))
print(10*'==')
print(np.concatenate((a,b),axis=1))

[[0 1]
 [2 3]]
[[5 6]
 [7 8]]
[[0 1]
 [2 3]
 [5 6]
 [7 8]]
[[0 1 5 6]
 [2 3 7 8]]


In [48]:
# numpy.stack 函数用于沿新轴连接数组序列，格式如下：
import numpy as np
 
a = np.array([[1,2],[3,4]])
 
print ('第一个数组：')
print (a)
print ('\n')
b = np.array([[5,6],[7,8]])
 
print ('第二个数组：')
print (b)
print ('\n')
print ('沿轴 0 堆叠两个数组：')
print (np.stack((a,b),0))
print ('\n')
 
print ('沿轴 1 堆叠两个数组：')
print (np.stack((a,b),1))

第一个数组：
[[1 2]
 [3 4]]


第二个数组：
[[5 6]
 [7 8]]


沿轴 0 堆叠两个数组：
[[[1 2]
  [3 4]]

 [[5 6]
  [7 8]]]


沿轴 1 堆叠两个数组：
[[[1 2]
  [5 6]]

 [[3 4]
  [7 8]]]


In [49]:
# numpy.hstack 是 numpy.stack 函数的变体，它通过水平堆叠来生成数组。
import numpy as np
a = np.array([[1,2],[3,4]])
 
print ('第一个数组：')
print (a)
print ('\n')
b = np.array([[5,6],[7,8]])
 
print ('第二个数组：')
print (b)
print ('\n')
 
print ('水平堆叠：')
c = np.hstack((a,b))
print (c)
print ('\n')

第一个数组：
[[1 2]
 [3 4]]


第二个数组：
[[5 6]
 [7 8]]


水平堆叠：
[[1 2 5 6]
 [3 4 7 8]]




In [50]:
# numpy.vstack 是 numpy.stack 函数的变体，它通过垂直堆叠来生成数组。
import numpy as np
a = np.array([[1,2],[3,4]])
print ('第一个数组：')
print (a)
print ('\n')
b = np.array([[5,6],[7,8]])
print ('第二个数组：')
print (b)
print ('\n')
print ('竖直堆叠：')
c = np.vstack((a,b))
print (c)

第一个数组：
[[1 2]
 [3 4]]


第二个数组：
[[5 6]
 [7 8]]


竖直堆叠：
[[1 2]
 [3 4]
 [5 6]
 [7 8]]


In [54]:
# numpy.split 函数沿特定的轴将数组分割为子数组，格式如下：
import numpy as np
a = np.arange(9)
print(a)
print('\n')
print(np.split(a,3))
print('\n')
print(np.split(a,[2,5])) # 2之前的元素，2-5但不含5的所有元素，5之后的所有元素，分成三份。

[0 1 2 3 4 5 6 7 8]


[array([0, 1, 2]), array([3, 4, 5]), array([6, 7, 8])]


[array([0, 1]), array([2, 3, 4]), array([5, 6, 7, 8])]


In [57]:
# numpy.hsplit 函数用于水平分割数组，通过指定要返回的相同形状的数组数量来拆分原数组。
import numpy as np
harr = np.floor(10 * np.random.random((2, 6)))
print(harr)
print('\n')
print(np.hsplit(harr,3))

[[5. 9. 9. 7. 3. 2.]
 [1. 4. 6. 1. 5. 5.]]


[array([[5., 9.],
       [1., 4.]]), array([[9., 7.],
       [6., 1.]]), array([[3., 2.],
       [5., 5.]])]


In [64]:
# numpy.vsplit 沿着垂直轴分割，其分割方式与hsplit用法相同。
import numpy as np
 
a = np.arange(16).reshape(4,4)
 
print ('第一个数组：')
print (a)
print ('\n')
 
print ('竖直分割：')
b = np.vsplit(a,4)
print (b)

第一个数组：
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]
 [12 13 14 15]]


竖直分割：
[array([[0, 1, 2, 3]]), array([[4, 5, 6, 7]]), array([[ 8,  9, 10, 11]]), array([[12, 13, 14, 15]])]


In [62]:
import numpy as np
a = np.random.random((2, 6))
print(a)

[[0.76557353 0.78594692 0.92638258 0.22700413 0.36966304 0.31243824]
 [0.95974186 0.01481274 0.1666028  0.16567823 0.16217796 0.10011018]]


In [65]:
# numpy.resize 函数返回指定大小的新数组。
# 如果新数组大小大于原始大小，则包含原始数组中的元素的副本。
import numpy as np
 
a = np.array([[1,2,3],[4,5,6]])
 
print ('第一个数组：')
print (a)
print ('\n')
 
print ('第一个数组的形状：')
print (a.shape)
print ('\n')
b = np.resize(a, (3,2))
 
print ('第二个数组：')
print (b)
print ('\n')
 
print ('第二个数组的形状：')
print (b.shape)
print ('\n')
# 要注意 a 的第一行在 b 中重复出现，因为尺寸变大了
 
print ('修改第二个数组的大小：')
b = np.resize(a,(3,3))
print (b)

第一个数组：
[[1 2 3]
 [4 5 6]]


第一个数组的形状：
(2, 3)


第二个数组：
[[1 2]
 [3 4]
 [5 6]]


第二个数组的形状：
(3, 2)


修改第二个数组的大小：
[[1 2 3]
 [4 5 6]
 [1 2 3]]


In [72]:
# numpy.append 函数在数组的末尾添加值。 追加操作会分配整个数组，并把原来的数组复制到新数组中。 
# 此外，输入数组的维度必须匹配否则将生成ValueError。
# append 函数返回的始终是一个一维数组。
import numpy as np
a = np.array([[1,2,3],[4,5,6]])
print(a)
print ('向数组添加元素：')
print (np.append(a, [7,8,9]))
print ('\n')
print ('沿轴 0 添加元素：')
print(np.append(a,[[7,8,9]],axis=0))

# print(np.append(a,[[7,8,9]],axis=0))
print ('沿轴 1 添加元素：')
# print(np.append(a,[[5,5,5],[7,8,9]],axis=1))

print(np.append(a,[[5,5,5],[6,6,6]],axis=1))

[[1 2 3]
 [4 5 6]]
向数组添加元素：
[1 2 3 4 5 6 7 8 9]


沿轴 0 添加元素：
[[1 2 3]
 [4 5 6]
 [7 8 9]]
沿轴 1 添加元素：
[[1 2 3 5 5 5]
 [4 5 6 6 6 6]]


In [77]:
# numpy.insert 函数在给定索引之前，沿给定轴在输入数组中插入值。
# 如果值的类型转换为要插入，则它与输入数组不同。 插入没有原地的，函数会返回一个新数组。 此外，如果未提供轴，则输入数组会被展开。
import numpy as np
a = np.array([[1,2],[3,4],[5,6]])
print ('第一个数组：')
print (a)
print ('\n')
print ('未传递 Axis 参数。 在插入之前输入数组会被展开。')
print(np.insert(a,3,[11,12]))
print ('\n')
print ('传递了 Axis 参数。 会广播值数组来配输入数组。')
print ('沿轴 0 广播：')
print(np.insert(a,1,[22,33],axis=0))
print ('沿轴 1 广播：')
print (np.insert(a,1,11,axis = 1))

第一个数组：
[[1 2]
 [3 4]
 [5 6]]


未传递 Axis 参数。 在插入之前输入数组会被展开。
[ 1  2  3 11 12  4  5  6]


传递了 Axis 参数。 会广播值数组来配输入数组。
沿轴 0 广播：
[[ 1  2]
 [22 33]
 [ 3  4]
 [ 5  6]]
沿轴 1 广播：
[[ 1 11  2]
 [ 3 11  4]
 [ 5 11  6]]


In [81]:
# numpy.delete 函数返回从输入数组中删除指定子数组的新数组。 与 insert() 函数的情况一样，如果未提供轴参数，则输入数组将展开。
import numpy as np
 
a = np.arange(12).reshape(3,4)
 
print ('第一个数组：')
print (a)
print ('\n')
 
print ('未传递 Axis 参数。 在插入之前输入数组会被展开。')
print (np.delete(a,5))
print ('\n')
print ('删除第二列：')
print(np.delete(a,1,axis=1))
print ('\n')
print ('删除第二行：')
print(np.delete(a,1,axis=0))
print ('\n')

print ('包含从数组中删除的替代值的切片：')
a = np.array([1,2,3,4,5,6,7,8,9,10])
print (np.delete(a, np.s_[::2])) #：：代表从头到尾，间隔为2

第一个数组：
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]


未传递 Axis 参数。 在插入之前输入数组会被展开。
[ 0  1  2  3  4  6  7  8  9 10 11]


删除第二列：
[[ 0  2  3]
 [ 4  6  7]
 [ 8 10 11]]


删除第二行：
[[ 0  1  2  3]
 [ 8  9 10 11]]


包含从数组中删除的替代值的切片：
[ 2  4  6  8 10]


In [82]:
# numpy.unique 函数用于去除数组中的重复元素。
import numpy as np
 
a = np.array([5,2,6,2,7,5,6,8,2,9])
 
print ('第一个数组：')
print (a)
print ('\n')
 
print ('第一个数组的去重值：')
u = np.unique(a)
print (u)
print ('\n')
 
print ('去重数组的索引数组：')
u,indices = np.unique(a, return_index = True)
print (indices)
print ('\n')
 
print ('我们可以看到每个和原数组下标对应的数值：')
print (a)
print ('\n')
 
print ('去重数组的下标：')
u,indices = np.unique(a,return_inverse = True)
print (u)
print ('\n')
 
print ('下标为：')
print (indices)
print ('\n')
 
print ('使用下标重构原数组：')
print (u[indices])
print ('\n')
 
print ('返回去重元素的重复数量：')
u,indices = np.unique(a,return_counts = True)
print (u)
print (indices)

第一个数组：
[5 2 6 2 7 5 6 8 2 9]


第一个数组的去重值：
[2 5 6 7 8 9]


去重数组的索引数组：
[1 0 2 4 7 9]


我们可以看到每个和原数组下标对应的数值：
[5 2 6 2 7 5 6 8 2 9]


去重数组的下标：
[2 5 6 7 8 9]


下标为：
[1 0 2 0 3 1 2 4 0 5]


使用下标重构原数组：
[5 2 6 2 7 5 6 8 2 9]


返回去重元素的重复数量：
[2 5 6 7 8 9]
[3 2 2 1 1 1]
