In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# 设置中文显示
plt.rcParams['font.sans-serif'] = ['Microsoft YaHei', 'SimHei', 'Arial Unicode MS']
plt.rcParams['axes.unicode_minus'] = False

# 读取数据
df = pd.read_csv('individual_results_df.csv')

# 获取参与年份最多的5个国家
participation_years = df.groupby('country')['year'].nunique().sort_values(ascending=False)
top_5_countries = participation_years.head(5).index.tolist()

# 这些国家的历年平均总分变化
plt.figure(figsize=(12, 6))
for country in top_5_countries:
    country_data = df[df['country'] == country].groupby('year')['total'].mean()
    plt.plot(country_data.index, country_data.values, label=country, marker='o')
plt.title('主要参赛国家的历年平均总分变化')
plt.xlabel('年份')
plt.ylabel('平均总分')
plt.legend()
plt.grid(True, alpha=0.3)
plt.show()

# 这些国家的获奖情况
award_counts = df[df['country'].isin(top_5_countries)].groupby(['country', 'award']).size().unstack(fill_value=0)

plt.figure(figsize=(12, 6))
award_counts.plot(kind='bar', stacked=True)
plt.title('主要参赛国家的获奖情况')
plt.xlabel('国家')
plt.ylabel('获奖数量')
plt.legend(title='奖项')
plt.xticks(rotation=45)
plt.grid(True, alpha=0.3)
plt.show()

# 这些国家在不同题目上的平均表现
problem_performance = df[df['country'].isin(top_5_countries)].groupby('country')[['p1', 'p2', 'p3', 'p4', 'p5', 'p6']].mean()

plt.figure(figsize=(12, 6))
problem_performance.plot(kind='bar')
plt.title('主要参赛国家在各题目上的平均表现')
plt.xlabel('国家')
plt.ylabel('平均分')
plt.legend(title='题目编号')
plt.xticks(rotation=45)
plt.grid(True, alpha=0.3)
plt.show()
