## NumPy - 基础学习
> 1V

In [None]:
import numpy as np

#### 数组（Arrays）

In [None]:
# 一维数组
a = np.array([1, 2, 3])
print(type(a))
print(a.shape)
print(a[0], a[1], a[2])
a[0] = 5
print(a)

# 二维数组
b = np.array([[1, 2, 3], [4, 5, 6]])
print(b.shape)
print(b[0, 0], b[0, 1], b[1, 0])

Numpy还提供了许多创建数组的函数：

In [None]:
a = np.zeros((2, 2))
print(a)

b = np.ones((1, 2))
print(b)

c = np.full((2, 2), 7)
print(c)

d = np.eye(5)
print(d)

e = np.random.random((3, 3))
print(e)

#### 数组索引
Numpy提供了几种索引数组的方法。

`切片(Slicing)`: 与Python列表类似，可以对numpy数组进行切片。由于数组可能是多维的，因此必须为数组的每个维指定一个切片：

In [None]:
a = np.array([[1, 2, 3, 4],
              [5, 6, 7, 8],
              [9, 10, 11, 12]])
b = a[:2, 1:3]
print(b)
print(a[0, 1])
b[0, 0] = 99
print(a[0, 1])

你还可以将整数索引与切片索引混合使用。 但是，这样做会产生比原始数组更低级别的数组：

In [None]:
a = np.array([[1, 2, 3, 4],
              [5, 6, 7, 8],
              [9, 10, 11, 12]])

row_r1 = a[1, :]
row_r2 = a[1:2, :]
print(row_r1, row_r1.shape)
print(row_r2, row_r2.shape)

col_r1 = a[:, 1]
col_r2 = a[:, 1:2]
print(col_r1, col_r1.shape)
print(col_r2, col_r2.shape)

`整数数组索引`: 使用切片索引到numpy数组时，生成的数组视图将始终是原始数组的子数组。 相反，整数数组索引允许你使用另一个数组中的数据构造任意数组。 这是一个例子：

In [None]:
a = np.array([[1, 2],
              [3, 4],
              [5, 6]])

print(a[[0, 1, 2], [0, 1, 0]])
print(a[0, 0], a[1, 1], a[2, 0])
print(a[[0, 0], [1, 1]])
print(np.array([a[0, 1], a[0, 1]]))

`整数数组索引`的一个有用技巧是从矩阵的每一行中选择或改变一个元素：

In [None]:

a = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9],
              [10, 11, 12]])
b = np.array([0, 2, 0, 1])
print(a[np.arange(4), b])
a[np.arange(4), b] += 10
print(a)

`布尔数组索引`: 布尔数组索引允许你选择数组的任意元素。通常，这种类型的索引用于选择满足某些条件的数组元素。下面是一个例子：

In [None]:
a = np.array([[1, 2], [3, 4], [5, 6]])
bool_idx = (a > 2)
print(bool_idx)
print(a[bool_idx])
print(a[a > 2])

#### 数据类型
每个numpy数组都是相同类型元素的网格。Numpy提供了一组可用于构造数组的大量数值数据类型。Numpy在创建数组时尝试猜测数据类型，但构造数组的函数通常还包含一个可选参数来显式指定数据类型。这是一个例子：

In [None]:
x = np.array([1, 2])
print(x.dtype)

x = np.array([1., 2.])
print(x.dtype)

x = np.array([1, 2], dtype=np.int64)
print(x.dtype)

#### 数组中的数学
基本数学函数在数组上以元素方式运行，既可以作为运算符重载，也可以作为numpy模块中的函数：

In [None]:
x = np.array([[1, 2], [3, 4]], dtype=np.float64)
y = np.array([[5, 6], [7, 8]], dtype=np.float64)

print(x + y)
print(np.add(x, y))

print(x - y)
print(np.subtract(x, y))

print(x * y)
print(np.multiply(x, y))

print(x / y)
print(np.divide(x, y))

print(np.sqrt(x))

我们使用`dot`函数来计算向量的内积，将向量乘以矩阵，并乘以矩阵。 `dot`既可以作为numpy模块中的函数，也可以作为数组对象的实例方法：

In [None]:
x = np.array([[1, 2],
              [3, 4]])
y = np.array([[5, 6],
              [7, 8]])

v = np.array([9, 10])
w = np.array([11, 12])

# 9*11+10*12
print(v.dot(w))
print(np.dot(v, w))

# [1*9+2*10,3*9+4*10]
print(x.dot(v))
print(np.dot(x, v))

# [[1*5+2*7,1*6+2*8],[3*5+4*7,3*6+4*8]]
print(x.dot(y))
print(np.dot(x, y))

Numpy为在数组上执行计算提供了许多有用的函数；其中最有用的函数之一是 `SUM`：

In [None]:
x = np.array([[1, 2], [3, 4]])

print(np.sum(x))
print(np.sum(x, axis=0))  # 计算每列的和
print(np.sum(x, axis=1))  # 计算每行的和

除了使用数组计算数学函数外，我们经常需要对数组中的数据进行整形或其他操作。这种操作的最简单的例子是转置一个矩阵；要转置一个矩阵，只需使用一个数组对象的 `T` 属性：

In [None]:
x = np.array([[1, 2], [3, 4], [5, 6]])
print(x)
print(x.T)

#### 广播（Broadcasting）

广播是一种强大的机制，它允许numpy在执行算术运算时使用不同形状的数组。通常，我们有一个较小的数组和一个较大的数组，我们希望多次使用较小的数组来对较大的数组执行一些操作。

例如，假设我们要向矩阵的每一行添加一个常数向量。我们可以这样做：

In [None]:
x = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9],
              [10, 11, 12]])
v = np.array([1, 0, 1])
y = np.empty_like(x)
print(y)

for i in range(4):
    y[i, :] = x[i, :] + v
print(y)

这会凑效; 但是当矩阵`x`非常大时，在Python中计算显式循环可能会很慢。注意，向矩阵`x`的每一行添加向量`v`等同于通过垂直堆叠多个`v`副本来形成矩阵`vv`，然后执行元素的求和`x`和`vv`。 我们可以像如下这样实现这种方法：

In [None]:
x = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9],
              [10, 11, 12]])
v = np.array([1, 0, 1])
vv = np.tile(v, (4, 1))
print(vv)

y = x + vv
print(y)

Numpy广播允许我们在不实际创建`v`的多个副本的情况下执行此计算。考虑这个需求，使用广播如下：

In [None]:
x = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9],
              [10, 11, 12]])
v = np.array([1, 0, 1])
y = x + v
print(y)

`y=x+v`行即使`x`具有形状`(4，3)`和`v`具有形状`(3,)`，但由于广播的关系，该行的工作方式就好像`v`实际上具有形状`(4，3)`，其中每一行都是`v`的副本，并且求和是按元素执行的。

将两个数组一起广播遵循以下规则：

1. 如果数组不具有相同的rank，则将较低等级数组的形状添加1，直到两个形状具有相同的长度。
2. 如果两个数组在维度上具有相同的大小，或者如果其中一个数组在该维度中的大小为1，则称这两个数组在维度上是兼容的。
3. 如果数组在所有维度上兼容，则可以一起广播。
4. 广播之后，每个数组的行为就好像它的形状等于两个输入数组的形状的元素最大值。
5. 在一个数组的大小为1且另一个数组的大小大于1的任何维度中，第一个数组的行为就像沿着该维度复制一样

以下是广播的一些应用：

In [None]:
v = np.array([1, 2, 3])
w = np.array([4, 5])
print(v.reshape((3, 1)) * w)
x = np.array([[1, 2, 3], [4, 5, 6]])
print(x + v)
print((x.T + w).T)
print(w.reshape((2, 1)) + x)
print(x * 2)

广播通常会使你的代码更简洁，效率更高，因此你应该尽可能地使用它。