# 成为“维基百科通”

本课的目标**不是**要记住如何计算点积或乘法矩阵，而是让你运用点积做一些有用的运算，就像维基百科页面上关于卡尔曼滤波器的那篇文章所写的那样。此外，你也需要做一些额外的研究和审查。

但是这些页面通常是用**线性代数**的符号来写的，而不是计算机编程的符号。

在该 notebook 中，你将学习如何处理线性代数符号以及如何将其转换为计算机代码。

## 分析点积公式
在我写这篇文章的时候，维基百科上有一篇关于[点积](https://en.wikipedia.org/wiki/Dot_product) 的文章，这篇文章的开头提到了**代数定义**的概念，它的开头是这样写的：

> 两个向量 $\mathbf{a} = [a_1, a_2, \ldots, a_n]$ 与 $\mathbf{b} = [b_1, b_2, \ldots, b_n]$ 的点积定义如下：
>
> $$\mathbf{a} \cdot \mathbf{b} = \sum _{i=1}^{n}a_{i}b_{i}=a_{1}b_{1}+a_{2}b_{2}+\cdots +a_{n}b_{n}$$

如果你不知道具体可以用它来做什么，这个公式可能对你来说没有意义。所以，让我们来看看这个公式的三个特征，从而帮助你理解...

### 特征1 - 小写字母变量与大写字母变量
该等式只使用小写字母变量。一般来说，在讨论**向量**或**标量**时要使用小写变量（常规数字如3、-2.5等），而大写变量是针对矩阵的。

### 特征2 - 粗体与常规字体的变量
**粗体**字的变量表示矢量或矩阵，而常规字体中的变量是标量。


### 特征3 - 等式中的“...”
如果你在一个等式中看到三个点$\ldots$ ，它意味着“这种模式可以继续任何次数”。

#### 示例1-应用特征1、2和3
当你看到 $\mathbf{a} = [a_1, a_2, \ldots, a_n]$ 之类的东西时，你可以推断出下列内容：

1. **$\mathbf{a}$ 是一个向量**： 由于a是粗体，它可以是一个向量或一个矩阵，但由于它也是小写，所以我们知道它只能是一个向量。

2. **$\mathbf{a}$ 可以有任意长度**： 因为$\mathbf{a}$的定义中有一个$\ldots$ ，我们知道除了 $a_1$和$a_2$之外，还可能有$a_3$、$a_4$等......

3. **向量 $\mathbf{a}$ 中的值是标量**：由于$a_1$是小写字母且不是粗体，因此我们知道它必然是标量（常规数字），而不是向量或矩阵。

### 特征 4 - $\Sigma$ 符号
 $\Sigma$ 符号是希腊字母“sigma”的大写形式，它是执行总和的指令。

**当你看到一个 $\Sigma$ 符号时，应该想到“循环“！**

在点积的例子中，sigma 是指让我们按照$i=1,2, \ldots, n​$对$a_ib_i​$ 进行求和。在这种情况下，$n​$是指 $\mathbf{a}​$ 和 $\mathbf{b}​$ 向量的长度。

这个for循环的工作原理最好用一个例子来解释。看一看下面定义的`dot_product`函数。尝试阅读评论，并真正理解代码是如何与数学连接的。


**数学**

两个向量 $\mathbf{a} = [a_1, a_2, \ldots, a_n]$ 与 $\mathbf{b} = [b_1, b_2, \ldots, b_n]$ 的点积定义如下： 

$$\mathbf{a} \cdot \mathbf{b} = \sum _{i=1}^{n}a_{i}b_{i}=a_{1}b_{1}+a_{2}b_{2}+\cdots +a_{n}b_{n}$$

In [None]:
# The CODE

def dot_product(a, b):
    # start by checking that a and b have the same length.
    # I know they SHOULD have the same length because they
    # each are DEFINED (in the first line above) to have n 
    # elements. Even though n isn't specified, the fact that 
    # a goes from 0 to n AND b does the same (instead of going
    # from 0 to m for example) implies that these vectors 
    # always should have the same length.
    if len(a) != len(b):
        print("Error! Vectors must have the same length!")
        return None
    
    # let's call the length of these vectors "n" so we can
    # be consistent with the mathematical notation
    n = len(a)
    
    # Since we want to add up a bunch of terms, we should
    # start by setting the total to zero and then add to 
    # this total n times.
    total = 0
    
    # now we are going to perform the multiplication!
    # note that the algebraic version goes from 1 to n. 
    # The Python version of this indexing will go from 
    # 0 to n-1 (recall that range(3) returns [0,1,2] for example).
    for i in range(n): 
        a_i = a[i]
        b_i = b[i]
        total = total + a_i * b_i
        
    return total



In [None]:
# let's see if it works
a = [3,2,4]
b = [2,5,9]

# a*b should be 3*2 + 2*5 + 4*9
# or...           6 +  10 +  36 
#                            52

a_dot_b = dot_product(a,b)
print(a_dot_b)

In [None]:
52