# Vectorization

## 推导式

一般形式：`out_exp_res for out_exp in input_list if condition`

返回类型为 Base.Generator，可以传递给函数

In [2]:
typeof(n*m for n in 1:3, m in 1:2)

Base.Generator{Base.Iterators.ProductIterator{Tuple{UnitRange{Int64}, UnitRange{Int64}}}, var"#3#4"}

In [3]:
sum(1/n^2 for n in 1:1000)

1.6439345666815615

推导式用 `[]` 或 `collect()` 可以展开为数组

### 遍历单向量

- `[f(x) for x ∈ iterator]`
- `[f(i) for i ∈ eachindex(iterator)]`
- `[f(i, x) for (i, x) ∈ enumerate(iterator)]`
> enumerate() 能自动将向量展开为 (i, x) 配对的向量 


In [5]:
vector = ['a', 'b', 'c']

3-element Vector{Char}:
 'a': ASCII/Unicode U+0061 (category Ll: Letter, lowercase)
 'b': ASCII/Unicode U+0062 (category Ll: Letter, lowercase)
 'c': ASCII/Unicode U+0063 (category Ll: Letter, lowercase)

In [2]:
[x^2 for x ∈ vector]

3-element Vector{String}:
 "aa"
 "bb"
 "cc"

In [3]:
[x^i for (i, x) ∈ enumerate(vector)]

3-element Vector{String}:
 "a"
 "bb"
 "ccc"

In [2]:
function unique_in_order(arr)
    [x for (i, x) ∈ enumerate(arr) if (i == 1 || x ≠ arr[i-1])]
end

unique_in_order("aabbccaa")

4-element Vector{Char}:
 'a': ASCII/Unicode U+0061 (category Ll: Letter, lowercase)
 'b': ASCII/Unicode U+0062 (category Ll: Letter, lowercase)
 'c': ASCII/Unicode U+0063 (category Ll: Letter, lowercase)
 'a': ASCII/Unicode U+0061 (category Ll: Letter, lowercase)

### 平行遍历多向量

- `zip(v1, v2, ...)`
    - 返回类型为 Base.Iterators.Zip，可以用`collect(itr)`或`[itr...]`展开为 Vector{Tuple}

In [17]:
zip([1,2,3] , [4,5,6]) |> typeof

Base.Iterators.Zip{Tuple{Vector{Int64}, Vector{Int64}}}

In [18]:
# 三种等价写法
[tuple for tuple in zip([1, 2, 3], [4, 5, 6])]
collect(zip([1, 2, 3], [4, 5, 6]))
[zip([1, 2, 3], [4, 5, 6])...]

3-element Vector{Tuple{Int64, Int64}}:
 (1, 4)
 (2, 5)
 (3, 6)

In [16]:
[x + y for (x, y) in zip([1, 2, 3], [4, 5, 6])] 

3-element Vector{Int64}:
 5
 7
 9

### 交叉遍历多向量

- `f(x, y) for x in iterator1 for y in iterator2`
  - 返回类型为 Base.Interators.Flatten，用 `[]` 或 `collect()` 展开后为 Vector
- `f(x, y, ...) for x in rangeX, y in rangeY, ...` 
  - 返回类型为 Base.Generator，用 `[]` 或 `collect()` 展开后为 Matrix
- `Iterators.product(v1, v2)`
  - 返回类型为 Base.Iterators.ProductIterator，展开后为 Matrix

In [21]:
[x + y for x in 1:3 for y in 1:2]

6-element Vector{Int64}:
 2
 3
 3
 4
 4
 5

In [22]:
[x + y for x in 1:3, y in 1:2]

3×2 Matrix{Int64}:
 2  3
 3  4
 4  5

In [23]:
Iterators.product(1:3, 1:2) |> collect

3×2 Matrix{Tuple{Int64, Int64}}:
 (1, 1)  (1, 2)
 (2, 1)  (2, 2)
 (3, 1)  (3, 2)

In [24]:
[x + y for (x, y) in Iterators.product(1:3, 1:2)]

3×2 Matrix{Int64}:
 2  3
 3  4
 4  5

### 遍历矩阵

- `f(indices[1], indices[2]) for indices in CartesianIndices(Matrix)` 
> `indices[1]`, `indices[2]` 分别为元素的行、列索引



In [5]:
A = [1 2 3; -3 -2 1; 3 -1 2; 4 5 6]

4×3 Matrix{Int64}:
  1   2  3
 -3  -2  1
  3  -1  2
  4   5  6

In [5]:
CartesianIndices(A)

4×3 CartesianIndices{2, Tuple{Base.OneTo{Int64}, Base.OneTo{Int64}}}:
 CartesianIndex(1, 1)  CartesianIndex(1, 2)  CartesianIndex(1, 3)
 CartesianIndex(2, 1)  CartesianIndex(2, 2)  CartesianIndex(2, 3)
 CartesianIndex(3, 1)  CartesianIndex(3, 2)  CartesianIndex(3, 3)
 CartesianIndex(4, 1)  CartesianIndex(4, 2)  CartesianIndex(4, 3)

In [6]:
[indices[1] for indices in CartesianIndices(A)]

4×3 Matrix{Int64}:
 1  1  1
 2  2  2
 3  3  3
 4  4  4

In [7]:
[indices[2] for indices in CartesianIndices(A)]

4×3 Matrix{Int64}:
 1  2  3
 1  2  3
 1  2  3
 1  2  3

## 泛函 `map()`

`map(f, ...)`

In [2]:
vector = ['a', 'b', 'c']
map(x->x^2, vector) # vector .|> (x->x^2)

3-element Vector{String}:
 "aa"
 "bb"
 "cc"

### 多元函数

`map()` 的第一个参数 f 可以是多元函数，除了 f，其他参数的长度应相等，对应元素参与计算；若长度不等，则在其中任何一个用完时停止。

In [7]:
map((x, i)->x^i, vector, 1:length(vector))

3-element Vector{String}:
 "a"
 "bb"
 "ccc"

In [4]:
map((x, y, z) -> x^y + z, [1, 2, 3], [1, 2, 3], [1, 2, 3])

3-element Vector{Int64}:
  2
  6
 30

### 字符串

`map()` 作用于字符串、且 f 返回单个字符时，会自动将字符串视为字符向量，对每个字符分别操作，最后返回合并在一起的新字符串

In [3]:
map(c -> c+1, "abc")

"bcd"

## `broadcast()/.()`

### `broadcast(f, ...args)` 

除了第一个参数 f, 其他参数中
- 若只有一个 iterator，则将其余参数视为标量，只遍历这个 iterator
- 若有更多的 iterator，则对应遍历（维度一致）或交叉遍历（维度不同，如$1\times N$矩阵与列向量）
- 不希望执行遍历、只想作为一个整体参与操作的 iterator，要用 tuple() 包装起来

In [6]:
broadcast(x->x^2, vector)

3-element Vector{String}:
 "aa"
 "bb"
 "cc"

In [7]:
broadcast((x, i)->x^i, vector, 1:length(vector))

3-element Vector{String}:
 "a"
 "bb"
 "ccc"

In [8]:
a = [1 2 3]

1×3 Matrix{Int64}:
 1  2  3

In [9]:
b = [1 2 3]

1×3 Matrix{Int64}:
 1  2  3

In [10]:
broadcast(+, a, b) # a, b都是行向量，对应项相加

1×3 Matrix{Int64}:
 2  4  6

In [11]:
c = [1,2,3]

3-element Vector{Int64}:
 1
 2
 3

In [12]:
broadcast(+, a, c) # c是列向量，与a的相加变成交叉遍历

3×3 Matrix{Int64}:
 2  3  4
 3  4  5
 4  5  6

In [11]:
# 不参与遍历的 S
V = [1, 2, 3, 4, 5]
S = [1, 2, 3]
V.∉tuple(S)

5-element BitVector:
 0
 0
 0
 1
 1

In [8]:
V[V.∉tuple(S)]

2-element Vector{Int64}:
 4
 5

In [9]:
[x for x ∈ V if x ∉ S]

2-element Vector{Int64}:
 4
 5

In [10]:
filter(x -> x ∉ S, V)

2-element Vector{Int64}:
 4
 5

### `f.(…args)`

语法糖，等价于`broadcast(f, ...args)`

In [13]:
(x -> x^2).(vector)

3-element Vector{String}:
 "aa"
 "bb"
 "cc"

In [14]:
((x, i) -> x^i).(vector, 1:length(vector))

3-element Vector{String}:
 "a"
 "bb"
 "ccc"

In [15]:
[parse(Int, x) for x ∈ collect("123")]

3-element Vector{Int64}:
 1
 2
 3

In [16]:
broadcast(parse, Int, collect("123"))

3-element Vector{Int64}:
 1
 2
 3

In [17]:
parse.(Int, collect("123"))

3-element Vector{Int64}:
 1
 2
 3

### `.运算符`

#### 功能

把 `.` 放在运算符之前可以实现运算符的矢量化，甚至包括`.==` 和 `.|>`

In [18]:
(1, 2, 3) .* 2 # 此时的 a.*b 相当于 (*).(a, b) 和 broadcast(*, a, b)

(2, 4, 6)

**不用写 `.` 就能被解析器明白向量化运算的场景：**

1. 标量与向量的数乘
2. 向量数除标量
3. size相同的数组之间的加减法

省略这些 `.` 可以式代码更简洁，看起来更像数学公式

#### 性能

如果表达式中连续多次出现点操作，Julia 会自动将内部的逐元操作进行融合，避免多次的循环，加快运算速度。

例如，`sin.(cos.(A))` 在执行内部，不会先对 A 生成余弦结果的向量，再对该数集求正弦结果向量；而是转为一次循环操作，对 A 逐元地求余弦再求正弦后才会生成最终结果向量。

**尽可能地写矢量化运算符，对性能是有好处的**

### `@.`

一个表达式中的运算全部是矢量化运算时，可以使用 `@.` 宏，简化代码

In [2]:
x = [1, 2]
@. 3x^2 + 4x + 7x^3 # 等效于 3 .* x .^ 2 .+ 4 .* x .+ 7 .* x .^ 3

2-element Vector{Int64}:
 14
 76

## `mapslices()`

处理多维数组时，沿特定维度（固定其他维度的坐标，只改变这一个维度的坐标）应用函数 `mapslices(f, A; dims)`

> 就像 R 中的 `Apply(x, Margin, FUN)`

dims is an integer vector. The results are **concatenated along the remaining dimensions**. For example, if dims is [1,2] and A is 4-dimensional, f is called on A[:,:,i,j] for all i and j.

In [19]:
my_example_matrix = [[1 2 3]
                     [4 5 6]
                     [7 8 9]]

3×3 Matrix{Int64}:
 1  2  3
 4  5  6
 7  8  9

In [20]:
# dims = 1，对第一个维度（行）应用 sum（sum 将所有行归约为一行）
mapslices(sum, my_example_matrix; dims=1)

1×3 Matrix{Int64}:
 12  15  18

In [21]:
# dims = 2，对第一个维度（列）应用 sum（sum 将所有列归约为一列）
mapslices(sum, my_example_matrix; dims=2)

3×1 Matrix{Int64}:
  6
 15
 24