本项目对双十一淘宝美妆数据进行了全面分析和可视化,通过数据清洗、分类处理、统计分析和多种可视化方式,深入挖掘了美妆产品在电商平台上的销售特点和趋势。
- 数据清洗与预处理:去除重复数据,填充缺失值,重置索引
- 文本分析:使用结巴分词对商品标题进行分词处理
- 商品分类:将美妆产品按主类别(护肤品、化妆品等)和子类别(面膜、口红等)进行分类
- 销售数据分析:分析各品牌、各类别的销售量和销售额
- 价格分析:通过箱型图分析各品牌产品价格分布
- 男士产品分析:专门分析男士专用美妆产品的销售情况
- 地区销售分析:分析全国各地区的销售数据
- 3D可视化:使用pyecharts生成中国地图3D销售额可视化
Python/
├── code/
│ ├── main.py # 主要数据处理和可视化代码
│ ├── 3D.py # 3D地图可视化代码
│ └── out.py # 地区销售数据处理代码
└── README.md # 项目说明文档
- Python:主要编程语言
- pandas:数据处理和分析
- matplotlib & seaborn:数据可视化
- jieba:中文分词
- pyecharts:交互式图表和3D地图可视化
- 双十一淘宝美妆数据.csv:原始数据集
- 各地区省分经纬度和销售量.xlsx:地理位置数据
项目通过多种可视化方式展示了以下分析结果:
- 护肤品和化妆品在销售量和销售额上的占比
- 各品牌在不同子类别产品上的销售情况
- 各品牌产品的价格分布特点
- 男士专用美妆产品的销售情况
- 全国各地区的销售额分布(3D地图展示)
- 确保安装了所需的Python库:
pip install pandas jieba matplotlib seaborn pyecharts - 运行主要分析脚本:
python code/main.py - 生成3D地图可视化:
python code/3D.py
- 运行代码前请确保相关数据文件已放置在正确位置
- 3D.py生成的HTML文件需要在浏览器中打开查看