计算某气象站某日逐时（0~24h）2m 气温（℃）的标准差和方差

In [1]:
import pandas as pd

In [2]:
s = pd.Series(
    data=[
        13.3, 10.8, 9.9, 9.2, 8.4, 7.7, 7.1, 6.9, 6.6, 6.4, 
        6.2, 6.0, 8.2, 11.2, 13.1, 15.0, 17.0, 19.1, 20.9, 20.0, 
        19.0, 18.0, 16.8, 15.2
    ],
    index=[f'{i + 1}h' for i in range(24)]
)

In [3]:
s

1h     13.3
2h     10.8
3h      9.9
4h      9.2
5h      8.4
6h      7.7
7h      7.1
8h      6.9
9h      6.6
10h     6.4
11h     6.2
12h     6.0
13h     8.2
14h    11.2
15h    13.1
16h    15.0
17h    17.0
18h    19.1
19h    20.9
20h    20.0
21h    19.0
22h    18.0
23h    16.8
24h    15.2
dtype: float64

直接使用 pandas 中的 Dataframe

In [4]:
# 方差
s.var()

25.58840579710145

In [5]:
# 标准差
s.std()

5.058498373737156

先转为 numpy 数组后使用

In [6]:
temperature = s.to_numpy()

In [7]:
temperature

array([13.3, 10.8,  9.9,  9.2,  8.4,  7.7,  7.1,  6.9,  6.6,  6.4,  6.2,
        6. ,  8.2, 11.2, 13.1, 15. , 17. , 19.1, 20.9, 20. , 19. , 18. ,
       16.8, 15.2])

In [8]:
# 方差
temperature.var()

24.522222222222222

In [9]:
# 标准差
temperature.std()

4.951991742947702

造成上述方差和标准差不一致的情况是由于 `numpy` 中就是样本本身的方差，而 `pandas` 中所求的是样本的无偏方差

对于 `numpy` 有：
$$\sigma^2=\frac{\sum_{i=1}^{N}(x_i-\overline{x})}{N}$$

对于 `scipy` 有：
$$\sigma^2=\frac{\sum_{i=1}^{N}(x_i-\overline{x})}{N-1}$$

如果需要在 `numpy` 中计算无偏估计的方差和标准差，则可以使用

In [10]:
# 无偏估计的方差
temperature.var(ddof=1)

25.588405797101448

In [11]:
# 无偏估计的标准差
temperature.std(ddof=1)

5.058498373737155