学生学习的因数和自我提升度的关系

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns

# 设置中文显示
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

# 读取数据
df = pd.read_csv('../../data/intermediate/初步清洗_比赛数据_2.csv', sep=',', engine='python', encoding='utf-8')

# 去除制表符
df = df.map(lambda x: x.strip('\t') if isinstance(x, str) else x)

# 自我提升
imp_cols = [
    '问题解决能力提升',
    '自主学习能力提升',
    '合作能力提升',
    '表达沟通能力提升',
    '未来规划能力提升',
    '人文底蕴提升',
    '科学精神提升',
    '学会学习提升',
    '健康生活提升',
    '责任担当提升',
    '实践创新提升',
    '自我提升'
]

# 计算专业课平均满意度
df['能力提升'] = df[imp_cols].mean(axis=1)

# 影响因素（注意列名与 CSV 一致）
factors = [
    '课前预学',
    '课堂参与',
    '课后复习',
    '延伸阅读',
    '完成作业时间',
    '自习时间',
    '课外阅读时间',
    '网络课程时间',
    '实验科研时间',
    '社团活动时间',
    '竞赛活动时间',
    '其他学习时间',
    '同学合作',
    '参与科研团队',
    '参与学科竞赛',
    '学习同学方法',
    '师生交流频度'
]

# 计算相关系数
corr_data = df[factors + ['能力提升']].corr()

# 取影响因素与专业课平均满意度的相关系数
corr_factors = corr_data[['能力提升']].drop('能力提升')

# 根据相关系数排序
corr_factors_sorted = corr_factors.sort_values(by='能力提升', ascending=False)

# 画热力图
plt.figure(figsize=(6, 10))
sns.heatmap(corr_factors_sorted, annot=True, cmap='coolwarm', center=0)
plt.title('影响因素与能力提升的相关系数热力图（排序后）')
plt.show()


每一个能力

In [None]:
# 循环每一个能力，分别画热力图
for ability in imp_cols:
    corr_data = df[factors + [ability]].corr()
    corr_factors = corr_data[[ability]].drop(ability)
    corr_factors_sorted = corr_factors.sort_values(by=ability, ascending=False)

    plt.figure(figsize=(6, 10))
    sns.heatmap(corr_factors_sorted, annot=True, cmap='coolwarm', center=0)
    plt.title(f'影响因素与"{ability}"的相关系数热力图（排序后）')
    plt.show()