In [2]:
import pandas as pd
import numpy as np
# 在Python中导入scipy库中的linalg模块
# scipy 是Python中的一个科学计算库。
# linalg 是线性代数（linear algebra）的缩写，
# 它是数学的一个分支，涉及线性方程、线性函数以及它们通过矩阵和向量空间的表示。
from scipy import linalg

# 读取Excel文件的B:G列，除去第一行（标题）
df = pd.read_excel('棉花产量论文作业的数据.xlsx', usecols='C:G')#从C读取到G列
print(df)

# df.to_numpy 是 pandas 中 DataFrame 对象的一个方法，用于将 DataFrame 的数据转换为 NumPy 数组。
x = df.to_numpy()
print(x)


# 接下来的步骤与之前相同
# 标准化数据
X = (x - np.mean(x, axis=0)) / np.std(x, ddof=1, axis=0)

# 计算协方差矩阵
R = np.cov(X.T)

# 计算特征值和特征向量
eigenvalues, eigenvectors = linalg.eigh(R)
# 将特征值数组按降序排列
eigenvalues = eigenvalues[::-1]
# 将特征向量矩阵的列按降序排列
eigenvectors = eigenvectors[:, ::-1]

# 计算主成分贡献率和累积贡献率
contribution_rate = eigenvalues / sum(eigenvalues)
# np.cumsum 是 NumPy 库中的一个函数，用于计算数组元素的累积和。
cum_contribution_rate = np.cumsum(contribution_rate)

# 打印结果
print('特征值为：')
print(eigenvalues)
print('贡献率为：')
print(contribution_rate)
print('累计贡献率为：')
print(cum_contribution_rate)
print('与特征值对应的特征向量矩阵为：')
print(eigenvectors)


       种子费      化肥费     农药费     机械费     灌溉费
0   106.05   495.15  305.10   45.90   56.10
1   113.55   561.45  343.80   68.55   93.30
2   104.55   584.85  414.00   73.20  104.55
3   132.75   658.35  453.75   82.95  107.55
4   174.30   904.05  625.05  114.00  152.10
5   230.40  1248.75  834.45  143.85  176.40
6   238.20  1361.55  720.75  165.15  194.25
7   260.10  1337.40  727.65  201.90  291.75
8   270.60  1195.80  775.50  220.50  271.35
9   286.20  1171.80  610.95  195.00  284.55
10  282.90  1151.55  599.85  190.65  277.35
11  317.85  1105.80  553.80  211.05  290.10
12  319.65  1213.05  513.75  231.60  324.15
13  368.40  1274.10  567.45  239.85  331.80
14  466.20  1527.90  487.35  408.00  336.15
15  449.85  1703.25  555.15  402.30  358.80
16  537.00  1888.50  637.20  480.75  428.40
17  565.50  2009.85  715.65  562.05  456.90
[[ 106.05  495.15  305.1    45.9    56.1 ]
 [ 113.55  561.45  343.8    68.55   93.3 ]
 [ 104.55  584.85  414.     73.2   104.55]
 [ 132.75  658.35  453.75   82.95  

In [3]:
import pandas as pd
arr_2d=np.array([[1,2,3],[4,5,6],[7,8,9],[10,11,12]])
column_std_dev=np.std(arr_2d,axis=1)
print(column_std_dev)

[0.81649658 0.81649658 0.81649658 0.81649658]
