## 1 向量

### 1.1 向量描述方法 

**numpy中用数组表示向量**
1. 行向量

In [1]:
import numpy as np
u = np.array([1,6,7])
u

array([1, 6, 7])

2. 列向量

In [4]:
v = u.reshape(-1,1)
v

array([[1],
       [6],
       [7]])

3. 运算速度示例

In [9]:
import random,time
# 创建列表
lst = [random.randint(1,100) for i in range(1000000)]

start = time.time()
lst = [i*i for i in lst]  # 列表形式计算平方
end = time.time()
print(f"用时：{end - start}s")

vlst = np.array(lst)      # 列表化为数组
start2 = time.time()
vlst2 = vlst*vlst         # 用数组计算平方
end2 = time.time();
print(f"用时：{end2 - start2}s")

print(f"数组用时快{round((end - start)/(end2 - start2),3)}倍")

用时：0.1150047779083252s
用时：0.003022909164428711s
数组用时快38.044倍


### 1.2 Pandas表示

Pandas 的DataFrame对象，每一列可以看成一个向量

In [11]:
import pandas as pd

# 创建一个数据集
df = pd.DataFrame({'A':[1,2,3],'B':[2,4,6],'C':[4,8,12],'target':[1,0,1]})

# 输出
df

Unnamed: 0,A,B,C,target
0,1,2,4,1
1,2,4,8,0
2,3,6,12,1


###  1..2 向量加法

* 数组相加 

In [11]:
np.array([[2],[1]]) + np.array([[3],[3]])

array([[5],
       [4]])

* 数组相减

In [12]:
np.array([[2],[1]]) - np.array([[3],[3]])

array([[-1],
       [-2]])

### 1.3 向量的数量乘法 

* 标量乘以数组

In [14]:
2 * np.array([3,1])

array([6, 2])

In [15]:
-1 * np.array([3,1])

array([-3, -1])

## 2. 向量空间 

### 2.1 什么是向量空间 

* 两个向量相加所得到的向量，依然在这个二维平面空间中； 
* 经过数量乘法所得到的向量，也在这个二维平面空间中。

### 2.2 维数

In [1]:
import numpy as np

u = np.array([2,3,4])
u.ndim

1

In [2]:
u = np.array([[2,3,4]])
u.ndim

2

In [8]:
a = np.arange(12)
print(a)
a = a.reshape((3,4))
print(a)
a.ndim

[ 0  1  2  3  4  5  6  7  8  9 10 11]
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]


2

## 3. 内积空间 

* 向量点乘

In [1]:
import numpy as np
a = np.array([3,5,7])
b = np.array([2,4,0])
np.dot(a,b)

26

*　向量内积

In [2]:
np.inner(a,b)

26

**向量内积与点积在非一维计算结果不同**

In [4]:
c = np.array([[1,2],[3,4]])
d = np.array([[5,6],[7,8]])
np.dot(c,d)

array([[19, 22],
       [43, 50]])

![image-2.png](attachment:image-2.png)

In [6]:
np.inner(c,d)

array([[17, 23],
       [39, 53]])

![image.png](attachment:image.png)

## 4. 距离和角度

### 4.1 距离

* 欧几里得距离

![image.png](attachment:image.png)

In [1]:
import numpy as np
vec1 = np.array([1,2])
vec2 = np.array([9,8])
dist = np.linalg.norm(vec1-vec2)
dist

10.0

* 曼哈顿距离
![image.png](attachment:image.png)

In [2]:
from scipy.spatial.distance import cityblock
a = np.array([1,5])
b = np.array([6,2])
md = cityblock(a,b)
md

8

* 切比雪夫距离
![image.png](attachment:image.png)

In [3]:
from scipy.spatial.distance import chebyshev
c = np.array([1,5])
d = np.array([6,2])
cf = chebyshev(c,d)
cf

5

* 闵可夫斯基距离
![image.png](attachment:image.png)
1. p=1,曼哈顿距离
2. p=2,欧几里得距离
3. p->∞，切比雪夫距离

### 2. 基于距离的分类 
* KNN 
* 曼哈顿近距离分类