# 数据透视表与交叉表

##  数据透视表（Pivot Table）

数据透视表是一种用于总结、分析、探索和展示数据的工具。它允许我们从一个 DataFrame 中生成汇总信息，并重新排布数据，使其更易于理解。

```python
# values：要汇总的列。
# index：用于行索引的列。
# columns：用于列索引的列。
# aggfunc：聚合函数，默认为 mean；可以是 sum, count, min, max 等。
# fill_value：填充缺失值。
DataFrame.pivot_table(values=None, index=None, columns=None, aggfunc='mean', fill_value=None)
```

In [3]:
import pandas as pd

# 创建示例 DataFrame
data = {
    '日期': ['2023-01-01', '2023-01-01', '2023-01-02', '2023-01-02'],
    '产品': ['A', 'B', 'A', 'B'],
    '销量': [10, 20, 15, 25]
}

df = pd.DataFrame(data)

# 创建数据透视表，汇总每天每种产品的销量
pivot_table = df.pivot_table(values='销量', index='日期', columns='产品', aggfunc='sum', fill_value=0)
print("\n数据透视表结果:")
print(pivot_table)


数据透视表结果:
产品           A   B
日期                
2023-01-01  10  20
2023-01-02  15  25


## 交叉表（Crosstab）

交叉表是另一种用于总结分类数据的工具，类似于数据透视表，但通常用于观察两个或多个变量之间的关系。它也适用于计算频率分布。

```python
# index：行索引。
# columns：列索引。
# values：要聚合的值（可选）。
# aggfunc：聚合函数（可选）。
# margins：是否添加总计行和列。
# margins_name：总计行和列的名称。
pd.crosstab(index, columns, values=None, aggfunc=None, margins=False, margins_name='All')
```

In [7]:
# 创建示例 DataFrame
data2 = {
    '性别': ['男', '女', '女', '男', '男'],
    '购买': ['是', '否', '是', '是', '否']
}

df2 = pd.DataFrame(data2)

# 创建交叉表，统计性别与购买行为的关系
crosstab_result = pd.crosstab(index=df2['性别'], columns=df2['购买'], margins=True)
print("\n交叉表结果:")
print(crosstab_result)


交叉表结果:
购买   否  是  All
性别            
女    1  1    2
男    1  2    3
All  2  3    5


通过使用数据透视表和交叉表，我们能够有效地总结和分析数据。这些工具在商业分析、市场研究和其他许多领域都非常实用。