# 获取数组统计信息

In [1]:
import numpy as np
array1 = np.random.randint(1,100,10)
array1

array([65, 47, 17, 32, 87, 41, 85, 94, 13, 96])

In [2]:
#总和
print(array1.sum())
print(np.sum(array1))

#平均值
print(array1.mean())
print(np.mean(array1))

print(np.median(array1)) #中位数
print(np.quantile(array1, 0.5)) #分位数

577
577
57.7
57.7
56.0
56.0


In [3]:
#极大值
print(array1.max())
print(np.amax(array1))

#极小值
print(array1.min())
print(np.amin(array1))

#极差
print(np.ptp(array1))

q1, q3 = np.quantile(array1, [0.25, 0.75])
print(q3 - q1)

96
96
13
13
83
52.25


In [4]:
#方差
print(array1.var())
print(np.var(array1))

#标准差
print(array1.std())
print(np.std(array1))

print(array1.std() / array1.mean()) #变异系数

915.01
915.01
30.24913221895795
30.24913221895795
0.5242483920096698


值得注意的是，对于二维或更高维的数组，在获取描述统计信息时，可以通过名为 `axis` 的参数指定均值、方差等运算是沿着哪一个轴来执行，`axis` 参数不同，执行的结果可能是大相径庭的，如下所示。

In [5]:
array2 = np.random.randint(60, 101, (5, 3))
array2

array([[90, 90, 89],
       [67, 81, 93],
       [95, 72, 82],
       [75, 71, 89],
       [78, 82, 62]])

In [6]:
print(array2.mean())
print(array2.mean(axis=0))
print(array2.mean(axis=1))

81.06666666666666
[81.  79.2 83. ]
[89.66666667 80.33333333 83.         78.33333333 74.        ]


需要说明的是，NumPy 的数组对象并没有提供计算几何平均值、调和平均值、去尾平均值等的方法，如果有这方面的需求，可以使用名为 scipy 的三方库，它的stats模块中提供了这些函数。此外，该模块还提供了计算众数、变异系数、偏态、峰度的函数，代码如下所示。

In [7]:
from scipy import stats

print(np.mean(array1))                # 算术平均值
print(stats.gmean(array1))            # 几何平均值
print(stats.hmean(array1))            # 调和平均值
print(stats.tmean(array1, [10, 90]))  # 去尾平均值
print(stats.variation(array1))        # 变异系数
print(stats.skew(array1))             # 偏态系数
print(stats.kurtosis(array1))         # 峰度系数

57.7
47.55185449375263
36.71584348464896
48.375
0.5242483920096698
-0.10725978309071768
-1.5133553537528033


# 其他 numpy 常用函数
- `all()` / `any()` 判断数组中所有元素是否都为 `True` / 判断数组中是否有元素是 `True`
- `astype()` 拷贝数组，并将数组元素转换成指定的数据类型
- `reshape()` 改变数组形状
- `dump()` 把数组保存到一个二进制文件中
- `load()` 从一个二进制文件中读取数组
- `toflie()` 把数组写入文件
- `fill()` 用特定值填充数组
- `flatten()` 把多维数组转换成一维数组
- `nonzero()` 返回非0元素的索引
- `round()` 对数组中的元素做四舍五入操作。
- `sort()` 对数组进行就地排序。
- `swapaxes()` 和 `transpose()` 交换数组指定的轴和转置。
- `tolist()` 将数组转成 Python 中的list。