## 1. 导入库

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# 设置样式
sns.set_style("whitegrid")
plt.rcParams['figure.figsize'] = (10, 6)

## 2. 生成示例数据

In [None]:
np.random.seed(42)

# 创建销售数据
dates = pd.date_range('2024-01-01', periods=365)
df = pd.DataFrame({
    'date': dates,
    'sales': np.random.poisson(100, 365) + np.sin(np.arange(365) * 2 * np.pi / 365) * 20,
    'category': np.random.choice(['电子产品', '服装', '食品'], 365),
    'region': np.random.choice(['华东', '华北', '华南'], 365)
})

df.head()

## 3. 数据探索

In [None]:
# 基本统计
print("数据集形状:", df.shape)
print("\n描述性统计:")
df.describe()

## 4. 可视化分析

In [None]:
# 时间序列图
fig, axes = plt.subplots(2, 1, figsize=(12, 10))

# 销售趋势
axes[0].plot(df['date'], df['sales'], color='#00D9FF', alpha=0.7)
axes[0].set_title('每日销售趋势', fontsize=14, fontweight='bold')
axes[0].set_xlabel('日期')
axes[0].set_ylabel('销售额')

# 类别对比
category_sales = df.groupby('category')['sales'].sum().sort_values(ascending=False)
axes[1].bar(category_sales.index, category_sales.values, color=['#00D9FF', '#FF6B6B', '#4ECDC4'])
axes[1].set_title('各类别总销售额', fontsize=14, fontweight='bold')
axes[1].set_xlabel('类别')
axes[1].set_ylabel('总销售额')

plt.tight_layout()
plt.show()

In [None]:
# 区域与类别交叉分析
pivot_table = df.pivot_table(values='sales', index='region', columns='category', aggfunc='sum')

plt.figure(figsize=(10, 6))
sns.heatmap(pivot_table, annot=True, fmt='.0f', cmap='YlOrRd', cbar_kws={'label': '销售额'})
plt.title('区域 × 类别销售热力图', fontsize=14, fontweight='bold')
plt.tight_layout()
plt.show()

## 5. 结论

通过本次分析，我们发现：
1. 销售数据呈现明显的季节性波动
2. 电子产品类别销售额最高
3. 华东地区在各类别中均表现突出

---

**部署到 Posit Connect**：将此笔记本推送到 Git 仓库即可自动发布