### 1.3
#### (1) 计算均值、方差、标准差、变异系数、偏度、峰度
均值 $ \overline{x}=\cfrac{1}{n} \displaystyle \sum_{i=1}^{n}x_i $

方差 $ S^2=\cfrac{1}{n-1}\displaystyle \sum_{i=1}^{n}(x_i-\overline{x})^2 $

标准差 $ S = \sqrt{S^2} $

变异系数 $ CV = \cfrac{S}{\overline{x}} \times 100\% $

$k$ 阶中心矩 $ \mu_k = \cfrac{1}{n}(x-\overline{x})^k $ 

偏度 $ G_3 = \cfrac{\mu_3}{\sigma^3} $

峰度 $ G_4 = \cfrac{\mu_4}{\sigma^4} $

In [None]:
import numpy as np
import pandas as pd 

data = pd.DataFrame(np.array([[184, 207, 236, 262, 284, 311, 354, 437, 485, 550, 693, 762, 803, 896, 1070, 1331, 1746, 2336, 2641, 2834, 2972, 3180],
                     [138, 158, 178, 199, 221, 246, 283, 347, 376, 417, 508, 553, 571, 621, 718, 855, 1118, 1434, 1768, 1876, 1895, 1973],
                     [405, 434, 496, 562, 576, 603, 662, 802, 920, 1089, 1431, 1568, 1686, 1925, 2356, 3027, 3891, 4874, 5430, 5796, 6217, 6651]]).T, index=range(1978, 2000), columns=['全国居民', '农村居民', '城镇居民'])

x_mean = round(data.mean(), 2)
S_2 = round(np.var(data, ddof=1, axis=0), 2)
S = round(np.std(data, ddof=1, axis=0), 2)
CV = round(x_mean / S, 2)
G3 = round(data.skew(), 2)
G4 = round(data.kurt(), 2)
print('均值:\n{}\n方差:\n{}\n标准差:\n{}\n变异系数:\n{}\n偏度:\n{}\n峰度:\n{}'.format(x_mean, S_2, S, CV, G3, G4))

均值:
全国居民    1117.00
农村居民     747.86
城镇居民    2336.41
dtype: float64
方差:
全国居民    1031680.29
农村居民     399673.84
城镇居民    4536136.44
dtype: float64
标准差:
全国居民    1015.72
农村居民     632.20
城镇居民    2129.82
dtype: float64
变异系数:
全国居民    1.10
农村居民    1.18
城镇居民    1.10
dtype: float64
偏度:
全国居民    1.02
农村居民    1.01
城镇居民    0.97
dtype: float64
峰度:
全国居民   -0.46
农村居民   -0.45
城镇居民   -0.57
dtype: float64


#### (1) 计算中位数、上下四分位数、四分位极差、三均值
中位数
$$
M=\begin{cases}
x_{(\frac{n+1}{2})} & n为奇数 \\
\frac{1}{2}(x_{(\frac{n}{2})}+x_{(\frac{n}{2}+1)}) & n为偶数
\end{cases}
$$

分位数
$$
M_p=
\begin{cases}
x_{([np]+1)} & np非整数 \\
\frac{1}{2}(x_{(np)}+x_{(np+1)}) & np为整数
\end{cases}
$$

四分位极差 $IQR=Q_3-Q_1$

三均值 $TM=\cfrac{1}{4}Q_1 + \cfrac{1}{2}M + \cfrac{1}{4}Q_3$

In [14]:
M = data.median()
Q1 = data.quantile(0.25)
Q3 = data.quantile(0.75)
IQR = Q3 - Q1
TM = 1/4*Q1 + 1/2*M + 1/4*Q3
print('中位数\n{}\n上四分位数\n{}\n下四分位数\n{}\n四分位极差\n{}\n三均值\n{}\n'.format(M, Q1, Q3, IQR, TM))

中位数
全国居民     727.5
农村居民     530.5
城镇居民    1499.5
dtype: float64
上四分位数
全国居民    321.75
农村居民    255.25
城镇居民    617.75
Name: 0.25, dtype: float64
下四分位数
全国居民    1642.25
农村居民    1052.25
城镇居民    3675.00
Name: 0.75, dtype: float64
四分位极差
全国居民    1320.50
农村居民     797.00
城镇居民    3057.25
dtype: float64
三均值
全国居民     854.7500
农村居民     592.1250
城镇居民    1822.9375
dtype: float64



### 1.4
#### (1) 计算均值、方差、标准差、变异系数、偏度、峰度