# 数据可视化 Seaborn

🎉恭喜你来到本次教程的最后一个notebook！  

在对数据进行基本的处理之后，我们需要以图的形式更直观地将信息传递给读者。  

🎈因此，本节将使用seaborn进行基本的数据可视化操作  

>这里只对使用seaborn画图进行最基本的展示，更多全面的介绍详见：  
> 1. 官方的教程 https://seaborn.pydata.org/tutorial.html  
> 2. 不同类型图的集合 https://python-graph-gallery.com/

In [1]:
import seaborn as sns
import pandas as pd

In [2]:
# 导入seaborn库中带有的数据集
penguins = pd.read_csv("/home/mw/input/37953795/penguins.csv")

#查看前五行数据
penguins.head()

Unnamed: 0,species,island,bill_length_mm,bill_depth_mm,flipper_length_mm,body_mass_g,sex
0,Adelie,Torgersen,39.1,18.7,181.0,3750.0,Male
1,Adelie,Torgersen,39.5,17.4,186.0,3800.0,Female
2,Adelie,Torgersen,40.3,18.0,195.0,3250.0,Female
3,Adelie,Torgersen,,,,,
4,Adelie,Torgersen,36.7,19.3,193.0,3450.0,Female


## 箱图

In [3]:
# 指定x轴与y轴代表的变量
sns.boxplot(data=penguins, 
            x="species", 
            y="flipper_length_mm")

# 去掉右边和上面的边框，使坐标轴更符合APA要求
sns.despine()

## 条形图

In [4]:
# 指定x轴与y轴代表的变量，使用hue来指定第二个分类标准：性别
sns.barplot(data = penguins, 
            x = "species", 
            y = "flipper_length_mm", 
            hue="sex",
            errorbar="sd")
sns.despine()

## 散点图

In [5]:
# 指定x轴与y轴代表的变量
sns.scatterplot(data = penguins, 
                x = "bill_length_mm", 
                y = "bill_depth_mm")
sns.despine()

In [6]:
# 增加拟合的回归直线
sns.regplot(data = penguins, 
                x = "bill_length_mm", 
                y = "bill_depth_mm")
sns.despine()

## 直方图/密度图

In [7]:
sns.displot(penguins, x = 'flipper_length_mm')

<seaborn.axisgrid.FacetGrid at 0x7ff485cf8fa0>

In [8]:
sns.displot(penguins, x="flipper_length_mm", kind="kde")

<seaborn.axisgrid.FacetGrid at 0x7ff485cf8df0>

In [9]:
# 通过kde将两种图结合在一起
sns.histplot(data=penguins, x="flipper_length_mm", kde=True)
sns.despine()

In [10]:
# 通过hue来指定图示中新的类别变量
sns.displot(penguins, x="flipper_length_mm", hue="species")

<seaborn.axisgrid.FacetGrid at 0x7ff483ba41c0>

# 多图拼接

In [11]:
sns.displot(penguins, x="flipper_length_mm", col="species")

<seaborn.axisgrid.FacetGrid at 0x7ff483ab8a90>

In [12]:
sns.displot(
    penguins, 
    x="flipper_length_mm", 
    col="species",                      #指定列变量(分类变量)
    row="sex",                          #指定行变量(分类变量)
    binwidth=3,                         #调整每一个矩形的宽度
    height=3,
    facet_kws=dict(margin_titles=True)) #将行变量的标题(即sex)绘制在最右侧

<seaborn.axisgrid.FacetGrid at 0x7ff483ad6d00>

## 🔴温馨提醒：到这里所有的教程已学习完毕，请前往闯关题部分完成练习哦