In [176]:
import pandas as pd

# 讀取資料
df = pd.read_csv('104年在職教師學歷、公私立別、教育階段之情況.csv')
df.head()

Unnamed: 0,教育階段,公私立別,合計,專科,專科百分比,大學,大學百分比,碩士,碩士百分比,博士,博士百分比
0,103年度,總計,194717,1362,0.7,92630,47.57,98331,50.5,2394,1.23
1,104年度,總計,192035,1248,0.65,84516,44.01,103709,54.01,2562,1.33
2,104年度,公立,168631,309,0.18,70710,41.93,95234,56.47,2378,1.41
3,104年度,私立,23404,939,4.01,13806,58.99,8475,36.21,184,0.79
4,幼兒園,小計,12113,944,7.79,8640,71.33,2514,20.75,15,0.12


# Q1: 104年度的公立和私立學校的大學學歷的教師差異？

In [178]:
# 取出 104 年度的資料
df_104 = df[df['教育階段'] == '104年度']

# 取出公立學校的資料
df_public = df_104[df_104['公私立別'] == '公立']

# 取出私立學校的資料
df_private = df_104[df_104['公私立別'] == '私立']

# 計算公立學校和私立學校各自的大學百分比
public_college_percentage = df_public['大學百分比'].sum()
private_college_percentage = df_private['大學百分比'].sum()

# 計算結果
print('公立學校大學學歷百分比：{:.2f}%'.format(public_college_percentage))
print('私立學校大學學歷百分比：{:.2f}%'.format(private_college_percentage))

公立學校大學學歷百分比：41.93%
私立學校大學學歷百分比：58.99%


得出: 大學學歷的教師，任職於私立學校的比例較高

# Q2: 任職於何種教育階段中的大學學歷教師比例最高？

In [179]:
# 刪除 "103年度" 和 "104年度" 的資料
df = df[~df['教育階段'].isin(['103年度', '104年度'])]

# 依照大學比例排序，取出大學比例最高的一筆
highest_univ = df.sort_values(by='大學百分比', ascending=False).iloc[0]

print(f"大學比例最高的教育階段是：{highest_univ['教育階段']}，大學比例為：{highest_univ['大學百分比']}%")


大學比例最高的教育階段是：幼兒園，大學比例為：79.28%


得出: 大學學歷的教師，最多任職於幼兒園

# Q3: 任職於何種教育階段中的碩士學歷教師比例最高？

In [180]:
# 去除103年度和104年度的資料
df = df[(df['教育階段'] != '103年度') & (df['教育階段'] != '104年度')]

# 依照碩士比例排序，取出碩士比例最高的一筆
highest_master = df.sort_values(by='碩士百分比', ascending=False).iloc[0]

print(f"碩士比例最高的教育階段是：{highest_master['教育階段']}，碩士比例為：{highest_master['碩士百分比']}%")


碩士比例最高的教育階段是：高級職業學校，碩士比例為：69.21%


得出: 碩士學歷的教師，最多任職於高職

# Q4: 任職於何種教育階段中的博士學歷教師比例最高？

In [181]:
# 刪除 "103年度" 和 "104年度" 的資料
df = df[~df['教育階段'].isin(['103年度', '104年度'])]

# 依照博士比例排序，取出博士比例最高的一筆
highest_phD = df.sort_values(by='博士百分比', ascending=False).iloc[0]

print(f"博士比例最高的教育階段是：{highest_phD['教育階段']}，博士比例為：{highest_phD['博士百分比']}%")


博士比例最高的教育階段是：矯正學校，博士比例為：5.19%


得出: 博士學歷的老師，最多任職於矯正學校

# Q5: 104學年的在職教師的最多人數的學歷為?

In [182]:
data104 = {'教育階段': ['總計', '總計', '公立', '私立'],
        '公私立別': ['總計', '總計', '公立', '私立'],
        '合計': [194717, 192035, 168631, 23404],
        '專科': [1362, 1248, 309, 939],
        '專科百分比': [0.7, 0.65, 0.18, 4.01],
        '大學': [92630, 84516, 70710, 13806],
        '大學百分比': [47.57, 44.01, 41.93, 58.99],
        '碩士': [98331, 103709, 95234, 8475],
        '碩士百分比': [50.5, 54.01, 56.47, 36.21],
        '博士': [2394, 2562, 2378, 184],
        '博士百分比': [1.23, 1.33, 1.41, 0.79]}

df = pd.DataFrame(data)

df104_teacher = df[df['教育階段'] == '總計']

print(df104_teacher)

  教育階段 公私立別      合計    專科  專科百分比     大學  大學百分比      碩士  碩士百分比    博士  博士百分比
0   總計   總計  197654  1663   0.84  87264  44.13  105936  53.59  2791   1.41
1   總計   總計  194846  1501   0.77  80090  41.08  108611  55.75  2644   1.36


In [183]:
df104_teacher = df104_teacher.sort_values(by=['專科', '大學', '碩士', '博士'], ascending=False)
max_education = df104_teacher.columns[df104_teacher.iloc[0].values[3:].argmax()+3]

print('104在職教師的最多人數的學歷為：', max_education)


104在職教師的最多人數的學歷為： 碩士


得出，大多數的在職教師，至少會取得碩士學位

# Q6: 103學年的在職教師最多人數的學歷為?

In [184]:
data103 = {'教育階段': ['總計', '總計', '公立', '私立'],
        '公私立別': ['總計', '總計', '公立', '私立'],
        '合計': [197654, 194846, 171528, 23228],
        '專科': [1663, 1501, 408, 1095],
        '專科百分比': [0.84, 0.77, 0.24, 4.71],
        '大學': [87264, 80090, 66957, 13133],
        '大學百分比': [44.13, 41.08, 39.03, 56.47],
        '碩士': [105936, 108611, 98941, 9702],
        '碩士百分比': [53.59, 55.75, 57.69, 41.74],
        '博士': [2791, 2644, 2547, 97],
        '博士百分比': [1.41, 1.36, 1.49, 0.42]}

df = pd.DataFrame(data)

df103_teacher = df[df['教育階段'] == '總計']

df103_teacher = df103_teacher.sort_values(by=['專科', '大學', '碩士', '博士'], ascending=False)

max_education = df103_teacher.columns[df103_teacher.iloc[0].values[3:].argmax()+3]

print('103在職教師的最多人數的學歷為：', max_education)

103在職教師的最多人數的學歷為： 碩士


得出: 103年大多數的在職教師也是一樣的情形，一樣至少會有碩士學位


# Q7: 103 和 104 年度碩士教師的人數差異

In [185]:
# 取得 103 年度和 104 年度的碩士總計
master_103 = df[(df['教育階段'] == '總計') & (df['合計'] != 0)]['碩士'].values[0]
master_104 = df[(df['教育階段'] == '總計') & (df['合計'] != 0)]['碩士'].values[1]

# 計算差異
diff = master_104 - master_103

# 輸出結果
print(f"103年度碩士總計：{master_103}")
print(f"104年度碩士總計：{master_104}")
print(f"103和104年度的碩士教師相差人數：{diff}")


103年度碩士總計：105936
104年度碩士總計：108611
103和104年度的碩士教師相差人數：2675


得出: 碩士學位的教師人數趨勢成長

# Q8: 103和104年的大學學歷教師人數差異

In [186]:
# 取得 103 年度和 104 年度的大學總計
univ_103 = df[(df['教育階段'] == '總計') & (df['合計'] != 0)]['大學'].values[0]
univ_104 = df[(df['教育階段'] == '總計') & (df['合計'] != 0)]['大學'].values[1]

# 計算差異
diff = univ_104 - univ_103

# 輸出結果
print(f"103年度學士總計：{univ_103}")
print(f"104年度學士總計：{univ_104}")
print(f"103和104年度的學士教師相差人數：{diff}")

103年度學士總計：87264
104年度學士總計：80090
103和104年度的學士教師相差人數：-7174


得出: 大學學歷的教師人數減少，有可能是整體教師人數減少而導致的，但看碩士學歷卻是增加，所以應該不是因為整體教師人數減少，猜測是因為教師不再僅僅擁有大學學位，而是精進自己的學術成就。

# Q9: 103年與104年的博士學歷教師對比

In [187]:
# 取得 103 年度和 104 年度的博士總計
phD_103 = df[(df['教育階段'] == '總計') & (df['合計'] != 0)]['博士'].values[0]
phD_104 = df[(df['教育階段'] == '總計') & (df['合計'] != 0)]['博士'].values[1]

# 計算差異
diff = phD_104 - phD_103

# 輸出結果
print(f"103年度博士總計：{phD_103}")
print(f"104年度博士總計：{phD_104}")
print(f"103和104年度的博士教師相差人數：{diff}")

103年度博士總計：2791
104年度博士總計：2644
103和104年度的博士教師相差人數：-147


感想: 根據上面的推測，教師的學術成績應是成長的趨勢，很意外博士人數竟是減少的

# Q10: 103學年的在職教師的最少人數的學歷為?

In [188]:
df = df[df['教育階段'] == '總計']
df = df[df['合計'] > 0] # 排除人數為 0 的列

min_edu_count = df['合計'].min()
min_edu_level = df.loc[df['合計'] == min_edu_count, '專科':'博士'].idxmin(axis=1).values[0]

print(f"103學年的在職教師的最少人數的學歷為 {min_edu_level}")

103學年的在職教師的最少人數的學歷為 專科百分比


得出: 專科學歷的老師佔比最少

# -------我是分隔線-------

# -------

# 大學學歷的教師任職於不同教育階段的分布

In [150]:
# 篩選只包含大學的行
college_df = df[df['大學'] != 0]

# 依照教育階段分組，季按教育阶段分组并计算大学人数总和
college_by_education = college_df.groupby('教育階段')['大學'].sum()

# 根据大学人数降序排列并输出结果
college_ranking = college_by_education.sort_values(ascending=False)
print(college_ranking)


教育階段
總計    177146
公立     70710
私立     13806
Name: 大學, dtype: int64


In [151]:
college_df = df[df['大學'] != 0]

college_by_education_and_school = college_df.groupby(['幼兒園','國民小學','國民中學','高級中學','高級職業學校','特殊教育學校','矯正學校'])['大學'].sum()

college_ranking = college_by_education_and_school.sort_values(ascending=False)
print(college_ranking)


KeyError: '幼兒園'