# Python_Data_Analysis

## 项目概述
本项目用于读取本地 TXT/JSON 数据，清洗后存入 MySQL 数据库，并可视化每日销售数据。

---

## 文件结构
pandas&mysql/nodb_ver/
├── data_viz.ipynb          # 可视化用 Notebook
├── data_viz.py             # 数据可视化模块
├── file_define.ipynb       # 数据读取 Notebook
├── file_define.py          # Reader 类和数据清洗
├── main.ipynb              # 主 Notebook
├── README.ipynb            # 项目说明
├── sql_handle.ipynb        # 数据库操作 Notebook
├── sql_handle.py           # 数据库操作模块
└── data/
    ├── february_sales.json
    └── january_sales.txt

---

## 依赖环境安装

建议使用虚拟环境：

```powershell
# Anaconda
conda create -n pandas_mysql python=3.12
conda activate pandas_mysql

# 或 venv
python -m venv venv
.\venv\Scripts\activate

安装 Python 库：
pip install pandas matplotlib pymysql
注意：请确保 MySQL 已安装且可连接。

使用方法
1. 数据读取与清洗
from file_define import TxtFileReader, JsonFileReader
import pandas as pd

txt_reader = TxtFileReader("data/january_sales.txt")
json_reader = JsonFileReader("data/february_sales.json")

df_txt = txt_reader.read_data()
df_json = json_reader.read_data()

df = pd.concat([df_txt, df_json], ignore_index=True)

2. 导入 MySQL
from sql_handle import mysql_connection, create_database, use_database, create_sales_table, insert_data

conn = mysql_connection(password="YOUR_PASSWORD")
create_database(conn, "test_db")
use_database(conn, "test_db")
create_sales_table(conn)
insert_data(conn, df)
conn.close()

3. 数据可视化
from data_viz import plot_sales_by_day

plot_sales_by_day(df)

注意事项

file_define.py 的 Reader 类会自动进行数据清洗

导入数据库前，请检查数据中是否有缺失值或异常值

建议在 Jupyter Notebook 中运行

