1. 安裝 Pandas

In [None]:
pip install pandas

2. 匯入 Pandas 套件

In [None]:
import pandas as pd

3. Pandas 資料結構

In [None]:
s = pd.Series([1, 3, 5, 7, 9])

In [None]:
df = pd.DataFrame({
    'A': [1, 2, 3],
    'B': [4, 5, 6],
    'C': [7, 8, 9]
})


4. 資料讀取與寫入

In [None]:
df = pd.read_csv('file.csv')

In [None]:
df.to_csv('output.csv', index=False)

In [None]:
df = pd.read_json('file.json')

In [None]:
import sqlite3
conn = sqlite3.connect('database.db')
df = pd.read_sql('SELECT * FROM table_name', conn)

5. 資料操作

In [None]:
df['A']  # 單一欄位
df[['A', 'B']]  # 多個欄位

In [None]:
df[df['A'] > 2]  # 條件篩選

In [None]:
df['D'] = df['A'] + df['B']  # 新增欄位

In [None]:
df.drop(columns=['B'], inplace=True)

In [None]:
df.sort_values(by='A', ascending=False)

In [None]:
df.reset_index(drop=True, inplace=True)

6. 缺失值處理

In [None]:
df.isnull().sum()

填補缺失值

In [None]:
df.fillna(0, inplace=True)  # 用 0 取代缺失值

刪除含缺失值的列

In [None]:
df.dropna(inplace=True)

7. 資料聚合與分組

In [None]:
df.groupby('A').sum()  # 以 'A' 欄位分組並求和

In [None]:
df.describe()  # 提供資料的統計摘要

In [None]:
pd.pivot_table(df, values='B', index='A', columns='C', aggfunc='sum')

8. 合併與連接

In [None]:
合併資料表

In [None]:
pd.merge(df1, df2, on='key_column')

In [None]:
pd.concat([df1, df2], axis=0)  # 垂直拼接
pd.concat([df1, df2], axis=1)  # 水平拼接

9. 資料轉換

In [None]:
df['A'] = df['A'].astype(float)

In [None]:
df.melt(id_vars=['A'], value_vars=['B', 'C'])

In [None]:
df.pivot(index='A', columns='B', values='C')

10. 時間序列處理

In [None]:
df['date'] = pd.to_datetime(df['date'])

In [None]:
df.set_index('date', inplace=True)

In [None]:
df.resample('M').mean()  # 按月重採樣並取平均值

11. 可視化

In [None]:
df.plot()  # 使用 Pandas 內建繪圖功能

12. 匯出資料至其他格式

In [None]:
df.to_excel('output.xlsx')

In [None]:
df.to_json('output.json')

13. 進階技巧

條件選擇

In [None]:
df.loc[df['A'] > 1, 'B'] = 0  # 根據條件修改資料

適用函數

In [None]:
df['A'] = df['A'].apply(lambda x: x * 2)  # 對欄位應用函數