# 罗宾斯-蒙罗算法(随机逼近算法)
- 算法目标：寻找一个 **未知表达式函数的零点**，这个函数必须是**递增**的

In [36]:
import random

import numpy as np
# 假设一个函数（对于算法来说是未知的，但是为了方便观察RM算法是否估计准确和生成函数采样，设计一个有递增区间函数）
def f(x):
    return x**2-4

算法表达式：
$$w_{k+1}= w_k - a_k \widetilde{g}(w_k,\eta_k),k=1,2,3,...$$
其中，
- $w_k$表示对零点的第k次估计
- $\widetilde{g}(w_k,\eta_k)=g(w_k)+\eta_k$表示带有噪音的一个观测（即观测值含有噪声$\eta_k$）
- $a_k$>0，称为步长，本次算法取0.15

In [37]:
# 定义RM算法
def RM(w0, iterationNum, alpha=0.15):
    w = w0# 初始化估计值
    for k in range(iterationNum):
        # g表示一个有噪声的测量
        g = f(w) + np.random.normal(scale=1, size=1)
        w = w - g * alpha
    return w

In [38]:
# 从小向大估计
w_1 = RM(1,100)
# 从大向小估计
w_2 = RM(3,100)

In [39]:
print(f"真实值：{np.sqrt(4)}")
print(f"从小到大估计：{w_1}")
print(f"从大到小估计：{w_2}")

真实值：2.0
从小到大估计：[2.03634189]
从大到小估计：[2.00539572]
