### 导入包

In [2]:
# -*- conding: utf-8 -*-
import numpy as np

In [17]:
a = np.arange(15).reshape(3, 5)
a

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

In [23]:
# 数组的维度
a.shape

(3, 5)

In [21]:
# 数组的轴（维度）
a.ndim

2

In [28]:
# 数组中元素的类型
a.dtype.name

'int32'

In [29]:
# 数组中每个元素的大小
a.itemsize

4

In [30]:
# 数组中元素的个数
a.size

15

In [32]:
b = np.array([6, 7, 8])
b

array([6, 7, 8])

In [33]:
type(b)

numpy.ndarray

In [34]:
# 数组创建
a = np.array([2, 3, 4])
a

array([6, 7, 8])

In [37]:
a.dtype

dtype('int32')

In [38]:
b = np.array([1.2, 3.5, 5.1])
b.dtype

dtype('float64')

In [None]:
# 一个常见的错误，就是调用array的时候传入多个数字参数，而不是提供单个数字的列表类型作为参数

In [39]:
a = np.array(1, 2, 3, 4)  # 错误的

TypeError: array() takes from 1 to 2 positional arguments but 4 were given

In [53]:
a = np.array([1, 2, 3, 4])  # 正确的
a

array([1, 2, 3, 4])

In [None]:
# shape 数组的维度 这是一个整数的元组表示每个维度中数组的大小。对于有 n 行和 m 列的矩阵，shape 将是 (n,m)。

In [55]:
a.shape

(4,)

In [57]:
a.ndim  # 数组的轴（维度）

1

In [58]:
a.dtype

dtype('int32')

In [None]:
# array 还可以将序列的序列转换成二维数组，将序列的序列的序列转换成三维数组，等等。

In [62]:
b = np.array([(1.5, 2.3), (4, 5, 6)], dtype=object)
b

array([(1.5, 2.3), (4, 5, 6)], dtype=object)

In [None]:
# 也可以在创建时显式指定数组的类型

In [66]:
c = np.array([[1, 2], [3, 4]], dtype=complex)
c

array([[1.+0.j, 2.+0.j],
       [3.+0.j, 4.+0.j]])

In [None]:
# 函数zeros创建一个由0组成的数组，函数 ones创建一个完整的数组，函数empty 创建一个数组，
# 其初始内容是随机的，取决于内存的状态。默认情况下，创建的数组的dtype是 float64 类型的

In [72]:
a = np.zeros((3, 4))
a

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

In [73]:
a.dtype

dtype('float64')

In [74]:
np.ones((2, 3, 4), dtype=np.int16)

array([[[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]],

       [[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]]], dtype=int16)

### 基础操作

In [79]:
a = np.array([20, 30, 40, 50])
print(a)
b = np.arange(4)
print(b)

[20 30 40 50]
[0 1 2 3]


In [82]:
c = a - b
print(c)

[20 29 38 47]


In [83]:
b ** 2

array([0, 1, 4, 9], dtype=int32)

In [89]:
a = np.array([[1, 1], [0, 1]])
b = np.array([[2, 0], [3, 4]])
a * b

array([[2, 0],
       [0, 4]])

In [90]:
a @ b

array([[5, 4],
       [3, 4]])

In [91]:
a.dot(b)

array([[5, 4],
       [3, 4]])

In [109]:
# 生成一个二行三列的全为1的数组
a = np.ones((2, 3), dtype=int)
a

array([[1, 1, 1],
       [1, 1, 1]])

In [110]:
a *= 3
print(a)

[[3 3 3]
 [3 3 3]]


In [111]:
# 生成一个二行三列的随机数# 生成一个二行三列的随机数组
b = np.random.random((2, 3))
b

array([[0.46094899, 0.01093248, 0.76441639],
       [0.48561241, 0.46222207, 0.93664874]])

In [112]:
b += a
b

array([[3.46094899, 3.01093248, 3.76441639],
       [3.48561241, 3.46222207, 3.93664874]])

In [114]:
# b不会自动转换为整数类型
a += b

UFuncTypeError: Cannot cast ufunc 'add' output from dtype('float64') to dtype('int32') with casting rule 'same_kind'

### 索引、切片和迭代

In [118]:
# 一维的数组可以进行索引、切片和迭代操作的就像列表一样
a = np.arange(10) ** 1
a

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9], dtype=int32)

In [119]:
a[2:5]

array([2, 3, 4], dtype=int32)

In [122]:
# 取0>=下标>6, 间隔为2的数据
a[:6:2]

array([1000, 1000, 1000], dtype=int32)

In [124]:
a[:6:2] = 100
a

array([100,   1, 100,   3, 100,   5,   6,   7,   8,   9], dtype=int32)

In [None]:
# 多维的数组每个轴可以有一个索引。这些索引以逗号隔的元组给出

In [127]:
def f(x, y):
    return 10 * x + y

In [128]:
b = np.fromfunction(f, (5, 4), dtype=int)
b

array([[ 0,  1,  2,  3],
       [10, 11, 12, 13],
       [20, 21, 22, 23],
       [30, 31, 32, 33],
       [40, 41, 42, 43]])

In [129]:
b[2, 3]

23

In [130]:
# 取行下标0到5-1行，列下标1列的数据
b[0:5, 1]

array([ 1, 11, 21, 31, 41])

In [131]:
b[:, 1]

array([ 1, 11, 21, 31, 41])

In [133]:
# 取行下标1到3-1行，所有列的数据
b[1:3, :]

array([[10, 11, 12, 13],
       [20, 21, 22, 23]])

In [137]:
# 取最后第一行数据
b[-1, :]

array([40, 41, 42, 43])

In [141]:
b[-1, ...]

array([40, 41, 42, 43])

In [142]:
# 当提供的索引少于轴的数量时，缺失的索引被认为是完整的切片
# 取最后一行数据,等价于 b[-1, :]和b[-1, ...]
# 三个点（ ... ）表示产生完整索引元组所需的冒号
b[-1]

array([40, 41, 42, 43])

In [145]:
b[..., 3]

array([ 3, 13, 23, 33, 43])

In [146]:
b[..., -1]

array([ 3, 13, 23, 33, 43])

In [140]:
# 取最后一列数据 等价于 b[..., 3]和b[..., -1]
b[:, -1]

array([ 3, 13, 23, 33, 43])

In [147]:
# 三个点（ ... ）表示产生完整索引元组所需的冒号
for row in b:
    print(row)

[0 1 2 3]
[10 11 12 13]
[20 21 22 23]
[30 31 32 33]
[40 41 42 43]


In [148]:
# 但是，如果想要对数组中的每个元素执行操作，可以使用flat属性，该属性是数组的所有元素的迭代器
for element in b.flat:
    print(element)

0
1
2
3
10
11
12
13
20
21
22
23
30
31
32
33
40
41
42
43


### 形状操作

In [159]:
# 改变数据的形状
a = np.floor(10 * np.random.random((3, 4)))
a

array([[3., 5., 9., 5.],
       [8., 0., 8., 5.],
       [8., 0., 3., 8.]])

In [160]:
a.shape

(3, 4)

In [161]:
# 可以使用各种命令更改数组的形状。请注意，以下三个命令都返回一个修改后的数组，但不会更改原始数组
a.ravel()

array([3., 5., 9., 5., 8., 0., 8., 5., 8., 0., 3., 8.])

In [162]:
a.reshape(6, 2)

array([[3., 5.],
       [9., 5.],
       [8., 0.],
       [8., 5.],
       [8., 0.],
       [3., 8.]])

In [4]:
# 字体标题
np.dtype([(("字段标题", "字段名称"), "f4")])

dtype([(('字段标题', '字段名称'), '<f4')])

### 数组运算