In [3]:
import pandas as pd
import matplotlib.pyplot as plt

# 设置中文字体
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False


# 假设df为包含所有股票及其因子值的数据框
# 以下数据皆为假定数据
# 可以通过查询财报网获取

# 市盈率（PE）= 股票价格/每股收益（EPS）

# 市净率（PB）= 股票价格/每股净资产

# 盈利增长率 = (当前期盈利−上期盈利)/上期盈利


# 太极集团600129.SH TCL科技000100.SZ 京东方Ａ000725.SZ 三峡能源(600905.SH) 中远海控(601919.SH) 比亚迪(002594.SZ)

df = pd.DataFrame({
    'Stock': ['太极集团', 'TCL科技', '京东方Ａ', '三峡能源', '中远海控', '比亚迪'],
    'PE_Ratio': [23.74, 27.13, 46.66, 18.73, 10.34, 24.15], # 代表股票的市盈率，是衡量股票价格相对于每股收益的比率，数值越低通常被认为估值越合理。
    'PB_Ratio': [5.12, 1.52, 1.19, 1.58, 1.20, 5.15], # 代表股票的市净率，是衡量股票价格相对于每股净资产的比率，数值越低通常被认为风险越小。
    'Earnings_Growth': [3.15, 1.84, 1.49, 1.92, 2.33, 2.93], # 代表股票的盈利增长率，表示公司盈利增长的速度，数值越高通常表示公司盈利能力越强。
})


# 定义因子权重
factor_weights = {'PE_Ratio': -1, 'PB_Ratio': -1, 'Earnings_Growth': 1}

# 计算综合评分
df['Score'] = df[[col for col in factor_weights]].mul(list(factor_weights.values())).sum(axis=1)

# 排序并展示前五名
top_stocks = df.sort_values('Score', ascending=False).head()
print(top_stocks[['Stock', 'Score']])

# 绘制散点图,展示PE与PB的关系
plt.figure(figsize=(10, 6))
plt.scatter(df['PE_Ratio'], df['PB_Ratio'], c=df['Score'], cmap='viridis')
plt.colorbar(label='综合评分')
plt.xlabel('市盈率')
plt.ylabel('市净率')
plt.title('股票因子散点图')
plt.show()

ModuleNotFoundError: No module named 'pandas'