## 重塑数据：透视表和堆叠/取消堆叠

在数据分析中，重塑数据可以帮助我们更好地理解数据的结构和关系。Pandas 提供了多种方法来进行数据的重塑，其中最常用的方法包括透视表（pivot_table）、堆叠（stack）和取消堆叠（unstack）。

### 1. 透视表（Pivot Table）

透视表是一种强大的工具，可以通过指定行、列和聚合函数来汇总数据。

基本语法：

```python
DataFrame.pivot_table(values=None, index=None, columns=None, aggfunc='mean', fill_value=None)
```

示例：

In [2]:
import pandas as pd

# 创建一个示例 DataFrame
data = {
    '日期': ['2023-01-01', '2023-01-01', '2023-01-02', '2023-01-02'],
    '城市': ['北京', '上海', '北京', '上海'],
    '销售额': [100, 200, 150, 250]
}

df = pd.DataFrame(data)

# 创建透视表
pivot_table = df.pivot_table(values='销售额', index='日期', columns='城市', aggfunc='sum', fill_value=0)

print(pivot_table)


城市           上海   北京
日期                  
2023-01-01  200  100
2023-01-02  250  150


### 2. 堆叠（Stack）

stack 方法用于将某一层级的列转换为行，使数据更加紧凑并便于进一步分析。

In [4]:
# 使用刚才的透视表进行堆叠
stacked_df = pivot_table.stack()

print(stacked_df)

日期          城市
2023-01-01  上海    200
            北京    100
2023-01-02  上海    250
            北京    150
dtype: int64


### 3. 取消堆叠（Unstack）

unstack 方法则是将行转换为列，将堆叠后的数据恢复为原来的形状或相似的形状。

In [6]:
# 解除堆叠
unstacked_df = stacked_df.unstack()

print(unstacked_df)

城市           上海   北京
日期                  
2023-01-01  200  100
2023-01-02  250  150


### 4. 多层索引

Pandas 的 stack 和 unstack 可以处理多层索引的数据，可以在不同层次上进行操作。

In [9]:
# 创建一个多层索引的 DataFrame
multi_index_data = {
    ('2023-01-01', '北京'): 100,
    ('2023-01-01', '上海'): 200,
    ('2023-01-02', '北京'): 150,
    ('2023-01-02', '上海'): 250
}

multi_index_df = pd.Series(multi_index_data)

# 转换为 DataFrame 格式
multi_df = multi_index_df.unstack()

print(multi_df)

print('-' * 30)

# 堆叠多层索引
stacked_multi = multi_df.stack()
print(stacked_multi)

             上海   北京
2023-01-01  200  100
2023-01-02  250  150
------------------------------
2023-01-01  上海    200
            北京    100
2023-01-02  上海    250
            北京    150
dtype: int64


通过使用透视表、堆叠和取消堆叠的方法，你可以灵活地重塑数据，以便于后续的分析和可视化。这些工具在进行数据汇总和比较时非常有用。