# 可选实验室：Python、NumPy和矢量化

简要介绍本课程中使用的一些科学计算。 特别是NumPy科学计算包及其与Python的使用。

# 概要

- [&nbsp;&nbsp;1.1 目标]()
- [&nbsp;&nbsp;1.2 有用的参考资料]()
- [2 Python和NumPy]()
- [3 向量]()
- [&nbsp;&nbsp;3.1 摘要]()
- [&nbsp;&nbsp;3.2 NumPy数组]()
- [&nbsp;&nbsp;3.3 矢量创建]()
- [&nbsp;&nbsp;3.4 向量运算]()
- [4 矩阵]()
- [&nbsp;&nbsp;4.1 摘要]()
- [&nbsp;&nbsp;4.2 NumPy数组]()
- [&nbsp;&nbsp;4.3 矩阵创建]()
- [&nbsp;&nbsp;4.4 矩阵运算]()


In [1]:
import numpy as np
import time

<a name="toc_40015_1.1"></a>
## 1.1 目标

在本实验室中，您将

- 回顾课程1中使用的NumPy和Python功能

## 1.2 有用的参考资料

- NumPy文档，包括基本介绍：[NumPy.org](https://NumPy.org/doc/stable/)
- 具有挑战性的功能主题：[NumPy广播](https://NumPy.org/doc/stable/user/basics.broadcasting.html)


# 2 Python和NumPy

Python是我们将在本课程中使用的编程语言。它有一组数字数据类型和算术运算。NumPy是一个库，它扩展了Python的基本功能，增加了更丰富的数据集，包括更多的数值类型、向量、矩阵和许多矩阵函数。NumPy和Python可以无缝协作。Python算术运算符可用于NumPy数据类型，许多NumPy函数也可接受Python数据类型。


# 3 向量

## 3.1 摘要

<img src="../images/C1_W2_Lab04_Vectors.PNG" style="width:340px;" >

在本课程中使用的矢量是有序的数组。在符号中，向量用小写粗体字母表示，如$\mathbf{x}$。 向量的元素类型相同。例如，一个向量不会同时包含字符和数字。数组中元素的个数通常称为*维数*，但数学家可能更喜欢*秩数*。所示向量的维数为$n$。向量中的元素可以通过索引来引用。在数学环境中，索引通常从1到n。在计算机科学和这些实验室中，索引通常从0到n-1。例如，$0^{th}$的元素是$x_0$。注意，这里的x不是粗体。

## 3.2 NumPy数组

NumPy的基本数据结构是一个可索引的n维*数组*，包含相同类型（`dtype`）的元素。首先，你可能会注意到我们重载了“维度”一词。在上面，维度指的是向量中元素的个数，而在这里，维度指的是数组的索引个数。一维或一维数组只有一个索引。在课程1中，我们将用 NumPy一维数组来表示向量。

 - 一维数组，形状(n,)：n个索引为[0]到[n-1]的元素

## 3.3 矢量创建

NumPy中的数据创建例程通常会有一个第一个参数，即对象的形状。它既可以是一维结果的单个值，也可以是指定结果形状的元组（n,m,...）。下面是使用这些例程创建向量的示例。

In [34]:
a = np.zeros(4)
print(f"np.zeros(4): a = {a}, a shape = {a.shape}, a data type = {a.dtype}")
a = np.zeros((4,))
print(f"np.zeros(4,): a = {a}, a shape = {a.shape}, a data type = {a.dtype}")
a = np.random.random_sample((4,))
print(f"np.random.random_sample(4, 5): a = {a}, a shape = {a.shape}, a data type = {a.dtype}")

np.zeros(4): a = [0. 0. 0. 0.], a shape = (4,), a data type = float64
np.zeros(4,): a = [0. 0. 0. 0.], a shape = (4,), a data type = float64
np.random.random_sample(4, 5): a = [0.5792328  0.53516563 0.80204309 0.24814448], a shape = (4,), a data type = float64


某些数据创建例程不使用形状元组：

In [9]:
a = np.arange(4.)
print(f"np.arange(4.): a = {a}, a shape = {a.shape}, a data type = {a.dtype}")
a = np.random.rand(4)
print(f"np.random.rand(4): a = {a}, a shape = {a.shape}, a data type = {a.dtype}")

np.arange(4.): a = [0. 1. 2. 3.], a shape = (4,), a data type = float64
np.random.rand(4): a = [0.43901866 0.4458103  0.84685863 0.62109871], a shape = (4,), a data type = float64


值也可以手动指定。

In [15]:
a = np.array([5, 4, 3, 2])
print(f"np.array([5, 4, 3, 2]): a = {a}, a shape = {a.shape}, a data type = {a.dtype}")
a = np.array([5., 4, 3, 2])
print(f"np.array([5., 4, 3, 2]): a = {a}, a shape = {a.shape}, a data type = {a.dtype}")

np.array([5, 4, 3, 2]): a = [5 4 3 2], a shape = (4,), a data type = int32
np.array([5., 4, 3, 2]): a = [5. 4. 3. 2.], a shape = (4,), a data type = float64


这些都创建了一个包含四个元素的一维向量`a`。`a.shape`返回维数。这里我们看到`a.shape = (4,)`表示一个有4个元素的一维数组。 

## 3.4 向量运算

让我们探索一些使用向量的操作。

### 3.4.1 索引

向量的元素可以通过索引和切片来访问。NumPy提供了一套非常完整的索引和切片功能。我们将仅探讨本课程所需的基础知识。有关更多详细信息，请参阅[切片和索引](https://NumPy.org/doc/stable/reference/arrays.indexing.html)。

**索引**意味着通过数组中的位置来引用数组的*元素*。

**切片**意味着根据索引从数组中获取元素的*子集*。

NumPy从零开始索引，因此向量$\mathbf{a}$的第三个元素是`a[2]`。

In [17]:
a = np.arange(10)
print(a)
print(f"a[2].shape: {a[2].shape} a[2]  = {a[2]}, Accessing an element returns a scalar")
print(f"a[-1] = {a[-1]}")
try:
    c = a[10]
except Exception as e:
    print("The error message you'll see is:")
    print(e)

[0 1 2 3 4 5 6 7 8 9]
a[2].shape: () a[2]  = 2, Accessing an element returns a scalar
a[-1] = 9
The error message you'll see is:
index 10 is out of bounds for axis 0 with size 10


### 3.4.2 切片

切片使用一组三个值（`start:stop:step`）创建一个索引数组。值的子集也是有效的。它的使用最好通过示例来解释：

In [21]:
a = np.arange(10)
print(f"a        =  {a}")
c = a[2:7:1]
print("a[2:7:1] = ", c)
c = a[2:7:2]
print("a[2:7:2] = ", c)
c = a[3:]
print("a[3:]    = ", c)
c = a[:3]
print("a[:3]    = ", c)
c = a[:]
print("a[:]     = ", c)

a        =  [0 1 2 3 4 5 6 7 8 9]
a[2:7:1] =  [2 3 4 5 6]
a[2:7:2] =  [2 4 6]
a[3:]    =  [3 4 5 6 7 8 9]
a[:3]    =  [0 1 2]
a[:]     =  [0 1 2 3 4 5 6 7 8 9]


### 3.4.3 单向量运算

有许多有用的操作涉及对单个向量的操作。

In [22]:
a = np.array([1, 2, 3, 4])
print(f"a             : {a}")
b = -a
print(f"b = -a        : {b}")
b = np.sum(a)
print(f"b = np.sum(a) : {b}")
b = np.mean(a)
print(f"b = np.mean(a): {b}")
b = a ** 2
print(f"b = a**2      : {b}")

a             : [1 2 3 4]
b = -a        : [-1 -2 -3 -4]
b = np.sum(a) : 10
b = np.mean(a): 2.5
b = a**2      : [ 1  4  9 16]


### 3.4.4 向量向量逐元素运算

大多数NumPy算术、逻辑和比较运算也适用于向量。这些运算符在逐个元素的基础上工作。例如

$$ \mathbf{a} + \mathbf{b} = \sum_{i=0}^{n-1} a_i + b_i $$

In [23]:
a = np.array([1, 2, 3, 4])
b = np.array([-1, -2, 3, 4])
print(f"Binary operators work element wise: {a + b}")

Binary operators work element wise: [0 0 6 8]


当然，为了使其正常工作，向量必须具有相同的大小：

In [24]:
c = np.array([1, 2])
try:
    d = a + c
except Exception as e:
    print("The error message you'll see is:")
    print(e)

The error message you'll see is:
operands could not be broadcast together with shapes (4,) (2,) 


### 3.4.5 标量向量运算

向量可以按标量值“缩放”。标量值只是一个数字。标量乘以向量的所有元素。

In [25]:
a = np.array([1, 2, 3, 4])
b = 5 * a
print(f"b = 5 * a : {b}")

b = 5 * a : [ 5 10 15 20]


### 3.4.6 向量向量点积

点积是线性代数和NumPy的支柱。这是本课程中广泛使用的操作，应该很好理解。点积如下所示。

<img src="../images/C1_W2_Lab04_dot_notrans.gif" width=800> 

点积将两个向量中的值按元素相乘，然后将结果相加。

向量点积要求两个向量的维度相同。

让我们实现下面我们自己的点积版本：

**使用for循环**，实现一个返回两个向量的点积的函数。返回给定输入$a$和$b$的函数：

$$x=\sum_{i=0}^{n-1} a_i b_i$$

假设`a`和`b`是相同的形状。

In [27]:
def my_dot(a, b):
    x = 0
    for i in range(a.shape[0]):
        x = x + a[i] * b[i]
    return x

In [28]:
a = np.array([1, 2, 3, 4])
b = np.array([-1, 4, 3, 2])
print(f"my_dot(a, b) = {my_dot(a, b)}")

my_dot(a, b) = 24


请注意，点积预计返回标量值。

让我们使用`np.dot`尝试相同的操作。

In [29]:
a = np.array([1, 2, 3, 4])
b = np.array([-1, 4, 3, 2])
c = np.dot(a, b)
print(f"NumPy 1-D np.dot(a, b) = {c}, np.dot(a, b).shape = {c.shape} ")
c = np.dot(b, a)
print(f"NumPy 1-D np.dot(b, a) = {c}, np.dot(a, b).shape = {c.shape} ")


NumPy 1-D np.dot(a, b) = 24, np.dot(a, b).shape = () 
NumPy 1-D np.dot(b, a) = 24, np.dot(a, b).shape = () 


在上面，您会注意到一维的结果与我们的实现相匹配。

### 3.4.7 对速度的需求：向量与for循环

我们使用NumPy库是因为它提高了速度和内存效率。让我们来演示一下：

In [31]:
np.random.seed(1)
a = np.random.rand(10000000)
b = np.random.rand(10000000)
tic = time.time()
c = np.dot(a, b)
toc = time.time()
print(f"np.dot(a, b) =  {c:.4f}")
print(f"Vectorized version duration: {1000 * (toc - tic):.4f} ms ")
tic = time.time()
c = my_dot(a, b)
toc = time.time()
print(f"my_dot(a, b) =  {c:.4f}")
print(f"loop version duration: {1000 * (toc - tic):.4f} ms ")
del a
del b

np.dot(a, b) =  2501072.5817
Vectorized version duration: 5.9998 ms 
my_dot(a, b) =  2501072.5817
loop version duration: 1312.5708 ms 


因此，在这个例子中，矢量化大大提高了速度。这是因为NumPy能更好地利用底层硬件中的可用数据并行性。GPU和现代CPU采用单指令、多数据（SIMD）流水线，允许并行发布多个操作。这在机器学习中至关重要，因为机器学习的数据集通常非常庞大。

### 3.4.8 课程1中的向量向量运算

向量向量运算在课程1中会经常出现。原因如下：

- 今后，我们的示例将存储在一个维数为(m,n)的数组`X_train`中。这将在上下文中详细解释，但这里需要注意的是，它是一个2维数组或矩阵（请参阅下一节关于矩阵的内容）。
- `w`将是形状为(n,)的一维向量。
- 我们将在示例中循环执行操作，通过索引X提取每个示例单独处理。
- `X[i]`返回形状(n,)的值，这是一个一维向量。因此，涉及`X[i]`的操作通常是向量-向量操作。 

以上解释有点冗长，但在执行向量运算时，对齐和理解操作数的形状非常重要。

In [32]:
X = np.array([[1], [2], [3], [4]])
w = np.array([2])
c = np.dot(X[1], w)

print(f"X[1] has shape {X[1].shape}")
print(f"w has shape {w.shape}")
print(f"c has shape {c.shape}")

X[1] has shape (1,)
w has shape (1,)
c has shape ()


# 4 矩阵

## 4.1 摘要

矩阵是二维数组。矩阵的元素类型相同。在符号中，矩阵用大写粗体字母表示，如$\mathbf{X}$。在本实验和其他实验中，`m`通常表示行数，`n`表示列数。矩阵的元素可以用二维索引来引用。在数学环境中，索引中的数字通常从1到n。在计算机科学和这些实验室中，索引将从0到n-1。

<figure>
    <center>
        <img src="../images/C1_W2_Lab04_Matrices.PNG" alt='missing' width=900>
    <center/>
    <figcaption>
        通用矩阵表示法，第一个索引是行，第二个索引是列
    </figcaption>
<figure/>

## 4.2 NumPy数组

NumPy的基本数据结构是一个可索引的n维*数组*，包含相同类型（`dtype`）的元素。这些已在前面描述过。矩阵具有二维（2-D）索引[m,n]。

在课程1中，二维矩阵用于保存训练数据。训练数据是$m$个示例，由$n$个特征创建(m,n)数组。课程1不会直接对矩阵进行运算，而是通常提取一个示例作为向量并对其进行运算。下面您将回顾：

- 数据创建
- 切片和索引

## 4.3 矩阵创建

创建一维向量的相同函数将创建二维或n维数组。这里有些例子

下面提供了形状元组来实现二维结果。 请注意NumPy如何使用括号来表示每个维度。请注意，NumPy在打印时将每行打印一行。

In [35]:
a = np.zeros((1, 5))
print(f"a shape = {a.shape}, a = {a}")
a = np.zeros((2, 1))
print(f"a shape = {a.shape}, a = {a}")
a = np.random.random_sample((1, 1))
print(f"a shape = {a.shape}, a = {a}")

a shape = (1, 5), a = [[0. 0. 0. 0. 0.]]
a shape = (2, 1), a = [[0.]
 [0.]]
a shape = (1, 1), a = [[0.59096694]]


也可以手动指定数据。尺寸用与上面印刷中的格式匹配的附加括号指定。

In [36]:
a = np.array([[5], [4], [3]])
print(f" a shape = {a.shape}, np.array: a = {a}")
a = np.array([[5],
              [4],
              [3]])
print(f" a shape = {a.shape}, np.array: a = {a}")

 a shape = (3, 1), np.array: a = [[5]
 [4]
 [3]]
 a shape = (3, 1), np.array: a = [[5]
 [4]
 [3]]


## 4.4 矩阵运算

让我们探索一些使用矩阵的运算。

### 4.4.1 索引

矩阵包括第二个索引。这两个索引描述的是[行, 列]。访问可以返回一个元素或行/列。见下文：

In [38]:
a = np.arange(6).reshape(-1, 2)
print(f"a.shape: {a.shape}, \na = {a}")
print(
    f"\na[2,0].shape: {a[2, 0].shape}, a[2,0] = {a[2, 0]}, type(a[2,0]) = {type(a[2, 0])} Accessing an element returns a scalar\n")
print(f"a[2].shape: {a[2].shape}, a[2] = {a[2]}, type(a[2]) = {type(a[2])}")

a.shape: (3, 2), 
a = [[0 1]
 [2 3]
 [4 5]]

a[2,0].shape: (), a[2,0] = 4, type(a[2,0]) = <class 'numpy.int32'> Accessing an element returns a scalar

a[2].shape: (2,), a[2] = [4 5], type(a[2]) = <class 'numpy.ndarray'>


值得注意的是最后一个例子。 仅通过指定行来访问矩阵将返回*一维向量*。

**重塑**

前面的示例使用[reshape](https://numpy.org/doc/stable/reference/ generated/numpy.reshape.html)来调整数组的形状。

`a = np.arange(6).reshape(-1, 2) `

这行代码首先创建了一个包含六个元素的*一维向量*。 然后，它使用reshape命令将该向量重塑为*2-D*数组。这可以写成：

`a = np.arange(6).reshape(3, 2) `

得到同样的3行2列数组。

-1参数告诉例程在给定数组大小和列数的情况下计算行数。

### 4.4.2 切片

切片使用一组三个值（`start:stop:step`）创建一个索引数组。值的子集也是有效的。它的使用最好通过示例来解释：

In [None]:
a = np.arange(20).reshape(-1, 10)
print(f"a = \n{a}")
print("a[0, 2:7:1] = ", a[0, 2:7:1], ",  a[0, 2:7:1].shape =", a[0, 2:7:1].shape, "a 1-D array")
print("a[:, 2:7:1] = \n", a[:, 2:7:1], ",  a[:, 2:7:1].shape =", a[:, 2:7:1].shape, "a 2-D array")
print("a[:,:] = \n", a[:, :], ",  a[:,:].shape =", a[:, :].shape)
print("a[1,:] = ", a[1, :], ",  a[1,:].shape =", a[1, :].shape, "a 1-D array")
print("a[1]   = ", a[1], ",  a[1].shape   =", a[1].shape, "a 1-D array")

## 恭喜！

在本实验中，您掌握了课程1所需的Python和NumPy功能。