In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import os

# 设置中文字体，确保图表中文正常显示
plt.rcParams["font.family"] = ["SimHei", "WenQuanYi Micro Hei", "Heiti TC"]
plt.rcParams['axes.unicode_minus'] = False  # 解决负号显示问题

# 文件路径
file_path = r"E:\余泓彬\open future\泥深\大一春夏\数字素养\实验二\商品销售数据.xlsx"

# 读取Excel文件中的两个sheet
info_df = pd.read_excel(file_path, sheet_name="信息表")
sales_df = pd.read_excel(file_path, sheet_name="销售数据表")

# 合并表格，基于"商品编号"列
merged_df = pd.merge(sales_df, info_df, on="商品编号", how="left")

# 计算销售金额并添加到DataFrame
merged_df["销售金额"] = merged_df["商品销售价"] * merged_df["订单数量"]

# 从订单日期提取月份信息并添加到DataFrame
merged_df["月份"] = pd.to_datetime(merged_df["订单日期"]).dt.month

# 按月份统计每月销售金额
monthly_sales = merged_df.groupby("月份")["销售金额"].sum().reset_index()
print("每月销售金额统计:")
print(monthly_sales)

# 按商品名称和月份统计销售金额
product_monthly_sales = merged_df.groupby(["商品名称", "月份"])["销售金额"].sum().reset_index()

# 按商品大类和月份统计销售金额
category_monthly_sales = merged_df.groupby(["商品大类", "月份"])["销售金额"].sum().reset_index()

# 可视化：绘制折线图对比商品每月销售金额
plt.figure(figsize=(12, 6))
sns.lineplot(data=product_monthly_sales, x="月份", y="销售金额", hue="商品名称", marker="o")
plt.title("各商品每月销售金额对比")
plt.xlabel("月份")
plt.ylabel("销售金额")
plt.grid(True, linestyle="--", alpha=0.7)
plt.legend(title="商品名称")
plt.tight_layout()
plt.savefig("商品每月销售金额对比.png", dpi=300)
plt.show()

# 可视化：绘制柱状图对比不同商品大类的月度销售额
plt.figure(figsize=(14, 7))
sns.barplot(data=category_monthly_sales, x="月份", y="销售金额", hue="商品大类")
plt.title("不同商品大类的月度销售额对比")
plt.xlabel("月份")
plt.ylabel("销售金额")
plt.grid(True, linestyle="--", alpha=0.7)
plt.legend(title="商品大类", loc="upper right")
plt.tight_layout()
plt.savefig("商品大类月度销售额对比.png", dpi=300)
plt.show()

print("数据分析和可视化完成！图表已保存。")
