# 随机游走

In [None]:
import numpy as np

## 简介

随机游走（Random Walk）与很多自然、社会现象相关。

在自然科学研究中，随机游走是扩散过程的基础，广泛用于对物理和化学粒子扩散现象的模拟。

在实际生活中，人们用随机游走描述花粉的布朗运动、证券的涨跌等。

对随机游走过程的理论研究和计算机模拟已成功地应用于数学、物理、化学和经济等学科，在互联网信息检索、图像分割等领域的应用也取得了很好的效果。

这个案例将会研究随机游走时每一步与原点的距离和位置关系。

## 模拟移动方向

假设物体初始位置处于二维坐标系的$ (0, 0) $，每步随机地沿着`x`轴方向左移或右移一个单位，同时沿着`y`轴方向上移或下移一个单位，左右上下移动的概率是相等的。

为了模拟物体在`x`轴和`y`轴上每步的随机游走，首先创建一个$ 2 \times N $的二维数组，$ N $为移动总步数。

In [None]:
N = 10

数组的第0行表示`x`轴上的移动，第1行表示`y`轴上的移动。数组元素取值为`-1`（负方向移动）或`1`（正方向移动）。

例如：

```
[
    [-1, 1, 1, 1, 1, 1, 1, -1, -1, 1],
    [-1, 1, -1, 1, -1, -1, -1, -1, 1, -1]
]
```

`np.random`模块只能生成指定范围内的随机数，但是这里只需要`1`或`-1`的取值。

因此，可以先生成一个`0`或`1`的随机数组，再将所有的`0`替换为`-1`即可。

In [None]:
random_walk = np.random.randint(0, 2, size=(2, N))
random_walk

`np.where()`用于对数组条件赋值。

In [None]:
random_walk = np.where(random_walk > 0, 1, -1)
random_walk

## 计算移动位置

`random_walk`记录了每步沿着`x`轴、`y`轴移动的方向，通过计算从第$ 1 $步到第$ i $的累加和，即可算出第$ i $步所处的位置。

例如对于以下`random_walk`：

```
[
    [-1, 1, 1, 1, 1, 1, 1, -1, -1, 1],
    [-1, 1, -1, 1, -1, -1, -1, -1, 1, -1]
]
```

1. 从$ (0, 0) $出发

2. 第$ 0 $步：位于$ (0-1, 0-1) = (-1, -1) $

3. 第$ 1 $步：位于$ (-1+1, -1+1) = (0, 0) $

4. 第$ 2 $步：位于$ (0+1, 0-1) = (1, -1) $

5. 第$ 3 $步：位于$ (1+1, -1+1) = (2, 0) $

6. ...

![](./img/random_walk.png)

聚合函数`np.cumsum()`可以用于计算数组中每步的累加和。

例如对于以下`random_walk`：

```
[
    [-1, 1, 1, 1, 1, 1, 1, -1, -1, 1],
    [-1, 1, -1, 1, -1, -1, -1, -1, 1, -1]
]
```

生成的累加和数组为：

```
[
    [-1, 0, 1, 2, 3, 4, 5, 4, 3, 4],
    [-1, 0, -1, 0, -1, -2, -3, -4, -3, -4]
]
```

In [None]:
positions = np.cumsum(random_walk, axis=1)
positions

## 计算每步位置与原点的距离

`position`数组保存了每一步移动后所在的位置，现在需要计算这些位置与原点的距离。

In [None]:
dists = np.sqrt(positions[0]**2 + positions[1]**2)
dists

`np.set_printoptions(precision=4)`可以用于设置小数显示的位数。

In [None]:
np.set_printoptions(precision=4)
dists

## 统计分析

根据`dists`，可以看出与原点的最远距离、最近距离、和平均距离。

In [None]:
print("最远距离：", dists.max())
print("最近距离：", dists.min())
print("平均距离：", dists.mean())

还可以统计出随机游走过程中，有多少次与原点的距离大于平均距离的次数。

In [None]:
(dists > dists.mean()).sum()

`dists > dists.mean()`会生成一个一维的布尔数组，大于平均距离的位置`True`, 否则为`False`。

用`sum()`求和时，`True`的值为`1`，`False`的值为`0`。`True`的个数就是大于平均距离的次数。

## 绘制轨迹

In [None]:
import matplotlib.pyplot as plt

x = np.insert(positions[0], 0, 0)
y = np.insert(positions[1], 0, 0)

plt.plot(x, y, c='g', marker='*')
plt.scatter(0, 0, c='r', marker='o')
plt.text(.1, -.1, 'origin')
plt.scatter(positions[0][-1], positions[1][-1], c='r', marker='o')
plt.text(positions[0][-1]+.1, positions[1][-1]-.1, 'stop')
plt.show()

尝试增加总步数`N`，观察与原点的距离如何变化。