In [None]:

# # Pandas 進階 30秒快速練習題 - 解答
# 這些是練習題的參考解答，每個解答都經過優化，確保簡潔且易於理解。

import pandas as pd
import numpy as np

# 設定顯示選項
pd.set_option('display.max_columns', None)
pd.set_option('display.expand_frame_repr', False)

# 建立測試資料
sales_df = pd.DataFrame({
    '日期': pd.date_range('2024-01-01', '2024-01-05'),
    '商品': ['A', 'B', 'A', 'C', 'B'],
    '類別': ['食品', '電子', '食品', '服飾', '電子'],
    '價格': [100, 500, 150, 300, 450],
    '數量': [5, 2, 3, 1, 4],
    '地區': ['北部', '北部', '中部', '南部', '中部']
})

In [None]:

# ## M3.1: 條件過濾進階

In [None]:
# 解答 1.1: 複合條件過濾
filtered_sales = sales_df[(sales_df['價格'] > 200) & (sales_df['地區'] == '北部')]
print("價格大於 200 且在北部地區的商品：")
print(filtered_sales)

In [None]:
# 解答 1.2: 條件選擇
area_category = np.where(sales_df['地區'] == '北部', '重點區域', '一般區域')
print("\n地區分類：")
print(pd.Series(area_category, index=sales_df.index))

In [None]:
# 解答 1.3: 多重條件選擇
conditions = [
    (sales_df['價格'] < 200),
    (sales_df['價格'].between(200, 400)),
    (sales_df['價格'] > 400)
]
choices = ['低價', '中價', '高價']
price_category = np.select(conditions, choices)
print("\n價格分類：")
print(pd.Series(price_category, index=sales_df.index))

In [None]:

# ## M3.2: 分組聚合操作

In [None]:
# 解答 2.1: 基本分組計算
category_stats = sales_df.groupby('類別').agg({
    '價格': 'mean',
    '數量': 'sum'
})
print("類別統計：")
print(category_stats)

In [None]:
# 解答 2.2: 多重分組
sales_df['銷售額'] = sales_df['價格'] * sales_df['數量']
sales_by_category_region = sales_df.groupby(['類別', '地區'])['銷售額'].sum()
print("\n各類別各地區銷售額：")
print(sales_by_category_region)

In [None]:
# 解答 2.3: 自定義聚合
price_range = sales_df.groupby('類別')['價格'].agg(
    價格差額=lambda x: x.max() - x.min()
)
print("\n各類別價格差額：")
print(price_range)

In [None]:

# ## M3.3: 樞紐分析與交叉表

In [None]:
# 解答 3.1: 建立樞紐表
sales_pivot = pd.pivot_table(
    sales_df,
    values='銷售額',
    index='地區',
    columns='類別',
    aggfunc='sum'
)
print("銷售額樞紐表：")
print(sales_pivot)

In [None]:
# 解答 3.2: 交叉表分析
category_region_cross = pd.crosstab(sales_df['地區'], sales_df['類別'])
print("\n地區和類別的交叉表：")
print(category_region_cross)

In [None]:
# 解答 3.3: 樞紐表多值統計
multi_stat_pivot = pd.pivot_table(
    sales_df,
    values=['價格', '數量'],
    index='類別',
    aggfunc={'價格': 'mean', '數量': 'sum'}
)
print("\n多值統計樞紐表：")
print(multi_stat_pivot)

In [None]:

# ## M3.4: 合併與連接操作

# 建立額外的測試資料
inventory_df = pd.DataFrame({
    '商品': ['A', 'B', 'C', 'D'],
    '庫存': [100, 150, 80, 200]
})

In [None]:
# 解答 4.1: 合併資料框
merged_data = pd.merge(sales_df, inventory_df, on='商品')
print("合併後的資料：")
print(merged_data)

In [None]:
# 解答 4.2: 不同類型的連接
outer_merged = pd.merge(sales_df, inventory_df, on='商品', how='outer')
print("\n外部連接結果：")
print(outer_merged)

In [None]:
# 解答 4.3: 多鍵合併
prices_df = pd.DataFrame({
    '商品': ['A', 'B', 'C'],
    '類別': ['食品', '電子', '服飾'],
    '建議售價': [120, 550, 350]
})
multi_key_merged = pd.merge(sales_df, prices_df, on=['商品', '類別'])
print("\n多鍵合併結果：")
print(multi_key_merged)

In [None]:

# ## M3.5: 時間序列操作

# 建立時間序列測試資料
time_series_df = pd.DataFrame({
    '日期': pd.date_range('2024-01-01', '2024-01-10', freq='D'),
    '銷售額': np.random.randint(1000, 5000, 10)
})

In [None]:
# 解答 5.1: 時間索引設置
ts_indexed = time_series_df.set_index('日期').sort_index()
print("設置時間索引後的資料：")
print(ts_indexed)

In [None]:
# 解答 5.2: 時間重採樣
sales_resampled = ts_indexed.resample('3D')['銷售額'].mean()
print("\n三天平均銷售額：")
print(sales_resampled)

In [None]:
# 解答 5.3: 時間位移
moving_avg = ts_indexed['銷售額'].rolling(window=3).mean()
print("\n三天移動平均：")
print(moving_avg)