# Pandas Merge Example 合併分數例子

在這個例子，假設我們有幾個 Excel 表，假設當中有不同學科的成績。當中是同一班同學的資料，但每個 Excel 分別儲存了不同科目成績。現在我們想將同一班同學的各科目成績整合，我們將會使用 Python 的 Pandas 套件配合當中的 Merge 功能來達成。

In [None]:
# Load the libraries
import numpy as np
import pandas as pd

In [None]:
# A list of .xlsx files to merge
files = [
    "中文", 
    "英文", 
    "數學",
    "物理",
    "化學",
]

In [None]:
df = pd.read_excel(files[0] + ".xlsx")
df = df.rename(columns={
    "總成績": files[0]
})
df

In [None]:
# 載入一個檔案檢查一下

df = pd.read_excel(files[0] + ".xlsx")

# 將總成績改名為科目名稱，不然所有科目都會叫「總成績」
df = df.rename(columns={
    "總成績": files[0]
})

# 我們只取學生編號及原總成績兩欄。
df = df[["學生編號", files[0]]]
df

In [None]:
# 載入第二個檔案

df2 = pd.read_excel(files[1] + ".xlsx")
df2 = df2.rename(columns={
    "總成績": files[1]
})
df2 = df2[["學生編號", files[1]]]
df2

In [None]:
help(df.merge)

In [None]:
# 使用 DataFrame Merge 將 df 和 df2 兩組數據整合
df_result = df.merge(df2, on="學生編號")
df_result

In [None]:
df

In [None]:
for topic in files[1:]:
    df2 = pd.read_excel(topic + ".xlsx")
    df2 = df2.rename(columns={
        "總成績": topic
    })

    df2 = df2[["學生編號", topic]]
    df = df.merge(df2, on="學生編號")
    
df.round()
df

In [None]:
df = df.round()
df = df.astype(int)

#df = df.set_index("學生編號")
df.to_excel("final result.xlsx")

In [None]:

for topic in files[1:]:
    df2 = pd.read_excel(topic + ".xlsx")
    df2 = df2.rename(columns={
        "總成績": topic
    })

    df2 = df2[["學生編號", topic]]
    df = df.merge(df2, on="學生編號")
    
df = df.round()
df["學生編號"] = df["學生編號"].astype(int)
df = df.set_index("學生編號")
df

## 完整代碼

Full Code

In [1]:
import numpy as np
import pandas as pd

files = [
    "中文", 
    "英文", 
    "數學",
    "物理",
    "化學",
]

# The first file
topic = files[0]
df = pd.read_excel(topic + ".xlsx")

df = df.rename(columns={ "總成績": topic })

df = df[["學生編號", topic]]

# All other files

for topic in files[1:]:
    df2 = pd.read_excel(topic + ".xlsx")
    df2 = df2.rename(columns={
        "總成績": topic
    })

    df2 = df2[["學生編號", topic]]
    df = df.merge(df2, on="學生編號")
    
df = df.round()
df["學生編號"] = df["學生編號"].astype(int)
df = df.set_index("學生編號")
df.to_excel("final_results.xlsx")