当我们用平均增长率来描述数据时，实际上假定了该数据在一段时间以来以固定的趋势增长。趋势大致分为3种：增长，下降，平稳。

假设理想情况下，某数据的年增长率为k%，如10%。

现实中，各种因素会对趋势造成扰动，使得每年的实际增长率不等于k%，如8%,11%,等等。

我们假定理想的平均增长率能够较好地拟合历史数据。下面就通过实验来测试增长率的算数平均和几何平均的合理性，即这两种平均对数据的拟合程度。

我们首先定义函数，来构造一组数据。

假设100元购买了某理财产品N年。该理财产品的年增长率在k%左右浮动，扰动的最大幅度为delta.

例如，k=10, delta=2，则每年的增长率可能为8%, 9%, 10%, 11%, 12%.

那么，这N年的投资净值可以用以下函数计算：

In [None]:
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

def make_data(k, delta, N):
    money_first_year = 100
    money_every_year = np.zeros(N+1, dtype=np.float32)
    rate_every_year = np.zeros(N)
    money_every_year[0] = money_first_year
    for i in range(N):
        rate_i = k + np.random.uniform(-delta, delta)
        money_every_year[i + 1] = money_every_year[i] * (1 + rate_i / 100)
        rate_every_year[i] = rate_i/100
    
    print('各年的增长率：', np.around(rate_every_year * 100, 2))
    print('各年的净值：', np.around(money_every_year, 2))
    return money_every_year, rate_every_year

例如理想增长率为10%，每年的波动幅度为±5%，我们生成20年的数据如下：

In [None]:
money_20years, rate_20years = make_data(k=10, delta=5, N=20)

year_indexes = np.arange(21)
plt.scatter(year_indexes, money_20years, marker='x')

我们计算一下各年增长率的算数平均值和几何平均值，并用这两种平均增长率画出相应的增长曲线。

In [None]:
rate_arithmetic_mean = rate_20years.mean()
rate_geometric_mean = (1+rate_20years).prod()**(1/20) - 1
print('算数平均增长率：', np.around(rate_arithmetic_mean * 100, 2))
print('几何平均增长率：', np.around(rate_geometric_mean * 100, 2))

money_20years_arith = 100 * np.power((1+rate_arithmetic_mean), np.arange(21))
money_20years_geome = 100 * np.power((1+rate_geometric_mean), np.arange(21))
plt.scatter(year_indexes, money_20years, marker='x')
plt.plot(year_indexes, money_20years_arith, color='red', label='arithmetic')
plt.plot(year_indexes, money_20years_geome, color='purple', label='geometric')
plt.legend()
plt.show()

对上述例子，看不出明显区别。

下面的代码块可以改变中心增长率k0, 扰动幅度delta0，年数N0来观察拟合情况。

当我们增大delta0和N0时，就能发现使用几何平均率是对实际增长更好的拟合。

In [3]:
k0 = 10
delta0 = 20
N0=100
money_n_years, rate_n_years = make_data(k=k0, delta=delta0, N=N0)

rate_arithmetic_mean = rate_n_years.mean()
rate_geometric_mean = (1+rate_n_years).prod()**(1/N0) - 1
print('算数平均增长率：', np.around(rate_arithmetic_mean * 100, 2))
print('几何平均增长率：', np.around(rate_geometric_mean * 100, 2))

year_indexes = np.arange(N0+1)
money_n_years_arith = 100 * np.power((1+rate_arithmetic_mean), np.arange(N0+1))
money_n_years_geome = 100 * np.power((1+rate_geometric_mean), np.arange(N0+1))
plt.scatter(year_indexes, money_n_years, marker='x')
plt.plot(year_indexes, money_n_years_arith, color='red', label='arithmetic')
plt.plot(year_indexes, money_n_years_geome, color='purple', label='geometric')
plt.legend()
plt.show()

NameError: name 'make_data' is not defined