In [27]:
import pandas as pd

# 讀取資料
df = pd.read_csv('104年在職教師學歷、公私立別、教育階段之情況.csv')
df.head()

Unnamed: 0,教育階段,公私立別,合計,專科,專科百分比,大學,大學百分比,碩士,碩士百分比,博士,博士百分比
0,103年度,總計,194717,1362,0.7,92630,47.57,98331,50.5,2394,1.23
1,104年度,總計,192035,1248,0.65,84516,44.01,103709,54.01,2562,1.33
2,104年度,公立,168631,309,0.18,70710,41.93,95234,56.47,2378,1.41
3,104年度,私立,23404,939,4.01,13806,58.99,8475,36.21,184,0.79
4,幼兒園,小計,12113,944,7.79,8640,71.33,2514,20.75,15,0.12


# Q1: 104年度的公立和私立學校的大學學歷的教師差異？

In [29]:
# 取出 104 年度的資料
df_104 = df[df['教育階段'] == '104年度']

# 取出公立學校的資料
df_public = df_104[df_104['公私立別'] == '公立']

# 取出私立學校的資料
df_private = df_104[df_104['公私立別'] == '私立']

# 計算公立學校和私立學校各自的大學百分比
public_college_percentage = df_public['大學百分比'].sum()
private_college_percentage = df_private['大學百分比'].sum()

# 計算結果
print('公立學校大學學歷百分比：{:.2f}%'.format(public_college_percentage))
print('私立學校大學學歷百分比：{:.2f}%'.format(private_college_percentage))

公立學校大學學歷百分比：41.93%
私立學校大學學歷百分比：58.99%


得出: 大學學歷的教師，任職於私立學校的比例較高

# Q2: 任職於何種教育階段中的大學學歷教師比例最高？

In [36]:
# 刪除 "103年度" 和 "104年度" 的資料
df = df[~df['教育階段'].isin(['103年度', '104年度'])]

# 以 "教育階段" 為分組，計算大學百分比平均值
univ_pct_mean_by_edu_level = df.groupby('教育階段')['大學百分比'].mean()

# 取出大學比例最高的教育階段
max_univ_pct_edu_level = univ_pct_mean_by_edu_level.idxmax()

print(f"大學比例最高的教育階段為 {max_univ_pct_edu_level}")

大學比例最高的教育階段為 幼兒園


得出: 大學學歷的教師，最多任職於幼兒園

# Q3: 任職於何種教育階段中的碩士學歷教師比例最高？

In [42]:
# 去除103年度和104年度的資料
df = df[(df['教育階段'] != '103年度') & (df['教育階段'] != '104年度')]

# 依照碩士比例排序，取出碩士比例最高的一筆
highest_master = df.sort_values(by='碩士百分比', ascending=False).iloc[0]

print(f"碩士比例最高的教育階段是：{highest_master['教育階段']}，碩士比例為：{highest_master['碩士百分比']}%")


碩士比例最高的教育階段是：高級職業學校，碩士比例為：69.21%


得出: 碩士學歷的教師，最多任職於高職

# Q4: 任職於何種教育階段中的博士學歷教師比例最高？

In [43]:
# 刪除 "103年度" 和 "104年度" 的資料
df = df[~df['教育階段'].isin(['103年度', '104年度'])]

# 依照博士比例排序，取出博士比例最高的一筆
highest_phD = df.sort_values(by='博士百分比', ascending=False).iloc[0]

print(f"博士比例最高的教育階段是：{highest_phD['教育階段']}，博士比例為：{highest_phD['博士百分比']}%")


博士比例最高的教育階段是：矯正學校，博士比例為：5.19%


得出: 博士學歷的老師，最多任職於矯正學校

# Q5: 何種年齡層的教師任職於高中的人數最多?

In [68]:
# 讀取資料
df2 = pd.read_csv('104年在職教師年齡層、各教育階段公私立別人數之情況.csv')
df2.head()

Unnamed: 0,年齡層,總計,百分比,合計公立,合計私立,幼兒園公立,幼兒園私立,國民小學公立,國民小學私立,國民中學公立,國民中學私立,高級中學公立,高級中學私立,高級職業學校公立,高級職業學校私立,特殊教育學校公立,矯正學校公立
0,103年度,194717.0,0.0,170541.0,24176.0,5255.0,6600.0,86746.0,1499.0,44996.0,511.0,21498.0,11889.0,10433.0,3677.0,1537.0,76.0
1,104年度,192035.0,100.0,168631.0,23404.0,5790.0,6323.0,85349.0,1499.0,44033.0,386.0,21465.0,11770.0,10391.0,3426.0,1526.0,77.0
2,平均年齡,41.58,0.0,41.49,42.22,40.04,42.1,42.25,38.26,40.27,41.05,41.26,42.6,41.9,43.02,39.66,43.38
3,22-29,11211.0,5.84,9213.0,1998.0,895.0,685.0,2881.0,138.0,3361.0,25.0,1319.0,920.0,553.0,230.0,202.0,2.0
4,30-34,24713.0,12.87,21212.0,3501.0,839.0,822.0,8340.0,434.0,7009.0,58.0,3196.0,1732.0,1510.0,455.0,312.0,6.0


In [70]:
# 刪除 "103年度" 和 "104年度" 的資料
df = df[~df['年齡層'].isin(['103年度', '104年度','平均年齡'])]

# 以 "教育階段" 為分組，計算大學百分比平均值
univ_pct_mean_by_edu_level = df.groupby('年齡層')['高級中學公立,高級中學私立'].mean()

# 取出大學比例最高的教育階段
max_univ_pct_edu_level = univ_pct_mean_by_edu_level.idxmax()

print(f"大學比例最高的教育階段為 {max_univ_pct_edu_level}")

KeyError: 'Column not found: 高級中學 公立,高級中學 私立'