# 标量
标量由普通小写字母表示，例如 $x$，$y$，$z$。

$\mathbb{R}$ 为连续实数空间。
$x \in \mathbb{R}$ 表示 $x$ 是一个实值标量的正式方式。

标量由只有一个元素的张量表示。

In [1]:
import torch

x = torch.tensor(3.0)
y = torch.tensor(2.0)

x + y, x * y, x / y, x**y

(tensor(5.), tensor(6.), tensor(1.5000), tensor(9.))

# 向量

向量可以视作由标量值组成的列表。这些标量值被称为向量的元素。

向量通常记为粗体小写字母，例如 $\mathbf{x}$，$\mathbf{y}$，$\mathbf{z}$。

向量一般由一维张量表示



In [6]:
x = torch.arange(4)
x

tensor([0, 1, 2, 3])

In [7]:
# 可以通过张量的索引来访问元素
x[3]

tensor(3)

## 长度、维度和形状
数学表示法中，一个向量 $\mathbf{x}$ 由n个实值标量组成，可以将其表示为 $\mathbf{x} \in \mathbb{R}^n$。

向量 $\mathbf{x}$ 中的元素可以通过索引访问，例如 $\mathbf{x}$ 中第 $i$ 个元素表示为 $x_i$。

向量的长度称为向量的 *维度* (dimension)，是向量元素的数量。在代码中，向量的长度可以通过 Python 中的 `len()` 函数来访问。

当用张量表示一个向量（只有一个轴）时，我们也可以通过.shape属性访问向量的长度。 形状（shape）是一个元素组，列出了张量沿每个轴的长度（维数）。 对于只有一个轴的张量，形状只有一个元素

In [9]:
print(len(x))
x.shape

4


torch.Size([4])

## 点积Dot Product

点积是相同位置元素的乘积的和，例如 $\mathbf{x}$, $\mathbf{y} \in \mathbb{R}^n$ 的点积为 $\mathbf{x}^T \mathbf{y} = \sum_{i=1}^{n} x_i y_i$。

将两个向量规范化得到单位长度后，点积表示他们夹角的余弦。


## 矩阵-向量积
矩阵-向量积是一个矩阵和一个向量的积

矩阵$\mathbf{A} \in \mathbb{R}^{m \times n}$ 和向量$\mathbf{x} \in \mathbb{R}^{n}$ 的矩阵-向量积是一个向量$\mathbf{y} \in \mathbb{R}^{m}$

## 矩阵Hadamard积

矩阵Hadamard积是两个矩阵的对应位置的元素相乘得到的矩阵

## 矩阵乘法matrix multiplication

矩阵$\mathbf{A} \in \mathbb{R}^{n \times k}$ 和 $\mathbf{B} \in \mathbb{R}^{k \times m}$

矩阵乘法$\mathbf{C} = \mathbf{A}\mathbf{B} \in \mathbb{R}^{n \times m}$，可以看作执行了$m$次矩阵-向量积，每次使用$\mathbf{A}$ 乘以$\mathbf{B}$ 的一列。

## 范数norm

向量范数是将向量映射到标量的函数$f$

不正式地说，向量的*范数*衡量从原点到向量尖端的距离。不涉及维度，而是分量的大小

### 范数的性质

1. $\forall \alpha \in \mathbb{R}, f(\alpha \mathbf{x}) = |\alpha| f(\mathbf{x})$  范数随元素缩放而缩放
2. $f(\mathbf{x} + \mathbf{y}) \leq f(\mathbf{x}) + f(\mathbf{y})$  三角不等式
3. $f(\mathbf{x}) = 0 \Leftrightarrow \mathbf{x} = \mathbf{0}$  所有范数非负

### L1范数

$L_1$ 范数表示为向量元素的绝对值之和

$\parallel \mathbf{x} \parallel = \sum_{i=1}^{n} |x_i| $

```py
u = torch.tensor([3.0, -4.0])
torch.abs(u).sum()
```

### L2范数

$L_2$ 范数表示为向量元素的平方和的平方根

$\parallel \mathbf{x} \parallel _2 = \sqrt{\sum_{i=1}^{n} x_i^2} $

```py
u = torch.tensor([3.0, -4.0])
torch.norm(u)
```


### 范数的目标

在深度学习中，我们经常试图解决优化问题： 最大化分配给观测数据的概率; 最小化预测和真实观测之间的距离。 

用向量表示物品（如单词、产品或新闻文章），以便最小化相似项目之间的距离，最大化不同项目之间的距离。
