# 第19节课: 高阶可视化 —— 不仅要准，还要美

**目标**: 引入 **Seaborn** 库，升级图表美学，绘制小提琴图和成对关系图。
**重点**: 体验“声明式绘图”的便捷。

In [None]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# 设置一个好看的主题 (Seaborn 特有)
sns.set_theme(style="whitegrid")

# 标准中文配置
plt.rcParams['font.sans-serif'] = ['SimHei'] 
plt.rcParams['font.sans-serif'] = ['Arial Unicode MS'] 
plt.rcParams['axes.unicode_minus'] = False

# 读取数据
df = pd.read_csv('data/china_tourism.csv')

## 1. 美学升级：Seaborn 小提琴图

箱线图只能看中位数，看不到分布形状。**小提琴图 (Violin Plot)** = 箱线图 + 直方图。既能看“胖瘦”（分布），又能看“高低”（价格）。

In [None]:
# 1. 过滤异常值（去掉价格 > 500 的极端值）
df_clean = df[df['Sold_Price'] < 500]

# 2. 画图
# x, y: 指定横纵轴
# order: 指定X轴的排列顺序
# palette: 指定配色方案
sns.violinplot(data=df_clean, 
               x='Level', y='Sold_Price', 
               order=['5A', '4A', '3A'], 
               palette='muted')

plt.title('不同等级景区价格“体型”对比')
plt.show()

## 2. 全局概览：成对关系图 (PairPlot)

我们想看：“价格、评分、等级这三个变量之间，到底有什么错综复杂的关系？”
**PairPlot** 可以一行代码画出所有关系，是数据分析师的“全局概览”工具。

In [None]:
# vars: 指定要分析的变量
# hue: 指定分类变量，不同类别会染成不同颜色
sns.pairplot(data=df_clean, 
             vars=['Sold_Price', 'Rating_Clean'], 
             hue='Level', 
             palette='bright')

## 3. 课堂练习：相关系数热力图

PairPlot 让我们看到了关系，现在我们用**相关系数 (Correlation)** 来量化这种关系。

In [None]:
# 1. 计算相关系数矩阵
corr_matrix = df_clean[['Sold_Price', 'Rating_Clean']].corr()

# 2. 画热力图
# annot=True: 在格子里显示数值
# cmap='coolwarm': 使用冷暖色调（红正蓝负）
sns.heatmap(corr_matrix, annot=True, cmap='coolwarm')
plt.title('价格与评分的相关性')
plt.show()