In [None]:
import pandas as pd
import numpy as np

#在Python中导入scipy.库中的Linalg模块
#scipy是Python中的一个料学计算库
#linalg是线性代数(linear algebra)的缩写，它是数学的一个分支，涉及线性方程、线性函数以及它们通过矩阵和向量空间的表示。

from scipy import linalg

# 读取excel文档
df = pd.read_excel('data.xlsx', usecols='C:G')
print(df)

x = df.to_numpy()
print(x)

In [None]:
# 标准化数据
X = (x - np.mean(x, axis=0)) / np.std(x, ddof=1, axis=0) # np.mean计算均值，np.std计算标准差

# 计算协方差矩阵
R = np.cov(X.T) # np.cov计算协方差矩阵

# 计算特征值和特征向量
eigenvalues, eigenvectors = linalg.eigh(R) # linalg.eigh计算特征值和特征向量，从高到低排列
# 将特征值数组降序排列
eigenvalues = eigenvalues[::-1]
# 将特征向量数组降序排列
eigenvectors = eigenvectors[:, ::-1]

# 计算主成分贡献率和累计贡献率
contribution_rate = eigenvalues / eigenvalues.sum()
# np.cumsum()函数用于计算数组元素的累积和
cum_contribution_rate = np.cumsum(contribution_rate)

# 输出结果
print('特征值:', eigenvalues)
print('贡献率：', contribution_rate)
print('累计贡献率：', cum_contribution_rate)
print('与特征值对应的特征向量：', eigenvectors)