对于思政课

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# 设置中文显示
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

# 读取数据
df = pd.read_csv('../../data/intermediate/初步清洗_比赛数据.csv', sep=',', engine='python', encoding='utf-8')

# 去除制表符
df = df.map(lambda x: x.strip('\t') if isinstance(x, str) else x)

# 思政课列
sizheng_cols = [
    '思政课总体满意度',
    '思政课设置满意度', 
    '思政课内容满意度',
    '思政课质量满意度', 
    '思政课效果满意度'
]

# 计算思政课平均满意度
df['思政课平均满意度'] = df[sizheng_cols].mean(axis=1)

# 绘制小提琴图
plt.figure(figsize=(6, 6))
sns.violinplot(x='性别', y='思政课平均满意度', hue='性别', data=df, palette='Set2', legend=False)

plt.ylim(0, 1)  # 设置y轴范围
plt.title('按性别分组的思政课平均满意度分布')
plt.ylabel('思政课平均满意度')
plt.xlabel('性别')
plt.show()


In [None]:
# 定义满意度区间
bins = [0, 0.2, 0.4, 0.6, 0.8, 1.0]
labels = ['0-0.2', '0.2-0.4', '0.4-0.6', '0.6-0.8', '0.8-1.0']
df['满意度区间'] = pd.cut(df['思政课平均满意度'], bins=bins, labels=labels, include_lowest=True)

# 按性别统计各区间比例
count_df = df.groupby(['性别', '满意度区间'], observed=False).size().unstack(fill_value=0)

# 转换为比例
prop_df = count_df.div(count_df.sum(axis=1), axis=0).reset_index()

# 转成长格式方便绘图
plot_df = prop_df.melt(id_vars='性别', var_name='满意度区间', value_name='比例')

# 绘制柱状图
plt.figure(figsize=(8, 6))
sns.barplot(x='满意度区间', y='比例', hue='性别', data=plot_df, palette='Set2')
plt.title('按性别分组的思政课平均满意度区间比例')
plt.ylabel('比例')
plt.xlabel('满意度区间')
plt.ylim(0, 1)
plt.legend(title='性别')
plt.show()

对于专业课

In [None]:
# 专业课列
zy_cols = [
    '专业课知识融合',
    '专业课解决问题能力',
    '专业课交叉融合',
    '专业课实践结合',
    '专业课努力程度',
    '专业课前沿内容'
]

# 计算思政课平均满意度
df['专业课平均满意度'] = df[zy_cols].mean(axis=1)

# 绘制小提琴图
plt.figure(figsize=(6, 6))
sns.violinplot(x='性别', y='专业课平均满意度', hue='性别', data=df, palette='Set2', legend=False)

plt.ylim(0, 1)  # 设置y轴范围
plt.title('按性别分组的思政课平均满意度分布')
plt.ylabel('思政课平均满意度')
plt.xlabel('性别')
plt.show()

In [None]:
# 定义满意度区间
bins = [0, 0.2, 0.4, 0.6, 0.8, 1.0]
labels = ['0-0.2', '0.2-0.4', '0.4-0.6', '0.6-0.8', '0.8-1.0']
df['满意度区间'] = pd.cut(df['专业课平均满意度'], bins=bins, labels=labels, include_lowest=True)

# 按性别统计各区间比例
count_df = df.groupby(['性别', '满意度区间'], observed=False).size().unstack(fill_value=0)

# 转换为比例
prop_df = count_df.div(count_df.sum(axis=1), axis=0).reset_index()

# 转成长格式方便绘图
plot_df = prop_df.melt(id_vars='性别', var_name='满意度区间', value_name='比例')

# 绘制柱状图
plt.figure(figsize=(8, 6))
sns.barplot(x='满意度区间', y='比例', hue='性别', data=plot_df, palette='Set2')
plt.title('按性别分组的专业课平均满意度区间比例')
plt.ylabel('比例')
plt.xlabel('满意度区间')
plt.ylim(0, 1)
plt.legend(title='性别')
plt.show()

对于实习情况

In [None]:
# 专业课列
sx_cols = [
    '课前预学',
    '课堂参与',
    '课后复习',
    '延伸阅读',
    '完成作业时间',
    '自习时间',
    '课外阅读时间',
    '网络课程时间',
    '实验科研时间',
    '社团活动时间',
    '竞赛活动时间',
    '其他学习时间',
    '同学合作',
    '参与科研团队',
    '参与学科竞赛',
    '学习同学方法'
]

# 计算思政课平均满意度
df['实习平均满意度'] = df[sx_cols].mean(axis=1)

# 绘制小提琴图
plt.figure(figsize=(6, 6))
sns.violinplot(x='性别', y='实习平均满意度', hue='性别', data=df, palette='Set2', legend=False)

plt.ylim(0, 1)  # 设置y轴范围
plt.title('按性别分组的实习平均满意度分布')
plt.ylabel('实习平均满意度')
plt.xlabel('性别')
plt.show()

In [None]:
# 定义满意度区间
bins = [0, 0.2, 0.4, 0.6, 0.8, 1.0]
labels = ['0-0.2', '0.2-0.4', '0.4-0.6', '0.6-0.8', '0.8-1.0']
df['满意度区间'] = pd.cut(df['实习平均满意度'], bins=bins, labels=labels, include_lowest=True)

# 按性别统计各区间比例
count_df = df.groupby(['性别', '满意度区间'], observed=False).size().unstack(fill_value=0)

# 转换为比例
prop_df = count_df.div(count_df.sum(axis=1), axis=0).reset_index()

# 转成长格式方便绘图
plot_df = prop_df.melt(id_vars='性别', var_name='满意度区间', value_name='比例')

# 绘制柱状图
plt.figure(figsize=(8, 6))
sns.barplot(x='满意度区间', y='比例', hue='性别', data=plot_df, palette='Set2')
plt.title('按性别分组的专业课平均满意度区间比例')
plt.ylabel('比例')
plt.xlabel('满意度区间')
plt.ylim(0, 1)
plt.legend(title='性别')
plt.show()