# Vectorization（向量化）
## 1、比较运行速度
来自吴恩达深度学习教程的例子，目的：比较线性公式C = A*B 用向量化和用for的执行时间的区别

In [1]:
import numpy as np

a = np.array([1,2,3,4])
print(a)

[1 2 3 4]


In [2]:
import time
a = np.random.rand(1000000)
b = np.random.rand(1000000)

tic = time.time()
c = np.dot(a,b)
toc = time.time()

print(c)
print("Vectorized version:" + str(1000*(toc-tic)) +"ms")

c = 0
tic = time.time()
for i in range(1000000):
    c += a[i]*b[i]
    
toc = time.time()

print(c)
print("For loop:" + str(1000*(toc-tic)) + "ms")

250113.671989
Vectorized version:1.97315216064ms
250113.671989
For loop:305.689096451ms


从结果上看，一个约2ms,一个约300ms，确定相差很大
## 2、不要用迭为1的向量

In [3]:
import numpy as np
a = np.random.rand(5)
print(a)

[ 0.8941919   0.14295789  0.75054309  0.55001852  0.0168459 ]


In [4]:
print(a.shape)

(5,)


In [5]:
print(a.T)

[ 0.8941919   0.14295789  0.75054309  0.55001852  0.0168459 ]


In [6]:
print(np.dot(a,a.T))

1.68613520867


In [7]:
a = np.random.randn(5,1)  # 列向量
print(a)

[[ 2.37460188]
 [-0.11834053]
 [ 2.35471981]
 [ 0.81645431]
 [ 0.10694735]]


In [8]:
print(a.T)  # 横向量

[[ 2.37460188 -0.11834053  2.35471981  0.81645431  0.10694735]]


上面的例子告诉我们：
不要用迭为1的向量，它像是一个数组，它的转置还是本身；要用行向量或列向量，并在定义后加下assert(a.shape == (1,5))。
如果真的使用了迭为1的向量，可以用a.reshape(5,1)