## 什么是Plotly

Plotly是新一代的Python数据可视化开发库，它是在plotly.js的基础上建立的，提供了完善的交互能力和灵活的绘制选项。

与早期的Matplotlib和Seaborn等库相比，Plotly将数据可视化提升到一个新的层次。Plotly内置完整的交互能力及编辑工具，支持在线和离线模式，提供稳定的API以便与现有应用集成，既可以在web浏览器中展示数据图表，也可以存入本地拷贝。

目前plotly绘图主要是有两种方法：
- plotly_express：plotly的高级封装
- plotly.graph_objects：底层方法
> 本项目的图形结果均运行在jupyter notebook中

下面我们利用Plotly内置的数据集来看看如何绘图，主要基于plotly_express


## 导入库

在导入plotly的两种接口的时候，有两种约定方式

In [2]:
!pip install plotly_express
import pandas as pd
import numpy as np

# 两种绘图接口的约定导入方式
import plotly_express as px  # 或 import plotly.express as px
import plotly.graph_objects as go  

^C


ModuleNotFoundError: No module named 'plotly_express'

## 数据集

plotly有多种内置的数据集供我们使用

In [None]:
gapminder = px.data.gapminder() 
gapminder.head()

In [None]:
gapminder["country"].value_counts()

In [None]:
tips = px.data.tips()  
tips.head()

In [None]:
iris = px.data.iris()  # 著名的鸢尾花数据集
iris.head()

In [None]:
iris.columns

In [None]:
stock = px.data.stocks()  # 一份股票数据集
stock.head()

In [None]:
print(stock.columns)

## 绘图

下面几种常见的图形，快速了解Plotly的绘图

### 柱状图

In [None]:
# 指定选取国家：Switzerland

Switzerland  = gapminder[gapminder["country"] == "Switzerland"]
Switzerland 

In [None]:
fig = px.bar(Switzerland,x="year",y="pop")

fig.show()

In [None]:
fig = go.Figure(
    data = (
        go.Bar(x=Switzerland["year"].tolist(),  # x轴数据
               y=Switzerland["pop"].tolist(),  # y轴数据
              )
    )
)

fig.show()

### 股票趋势图

In [None]:
# FB公司股票趋势图
fig = px.line(stock, x='date', y="FB")  

fig.show()

In [None]:
fig = go.Figure(data=[go.Line(
    x=stock['date'].tolist(), 
    y=stock["FB"].tolist()
)])

fig.show()

### 散点图

In [None]:
# gapminder_2002 = gapminder.query("year==2002")

gapminder_2002 = gapminder[gapminder["year"] == 2002]
gapminder_2002

In [None]:
px.scatter(gapminder_2002,   # 传入的数据集
           x="gdpPercap",  # 横坐标是人均GDP
           y="lifeExp",  # 纵坐标是平均寿命
           color="continent"  # 颜色取值：根据洲的值来取
          )

In [None]:
px.scatter(gapminder_2002   # 绘图数据集
           ,x="gdpPercap"  # 横坐标
           ,y="lifeExp"  # 纵坐标
           ,color="continent"  # 区分颜色
           ,size="pop"   # 区分圆的大小
           ,size_max=60  # 散点大小
          )

In [None]:
# 生成随机数据
N = 50
random_x = np.linspace(0, 1, N)
random_y0 = np.random.randn(N) + 10
random_y1 = np.random.randn(N)
random_y2 = np.random.randn(N) - 10

# 准备画布
fig = go.Figure()

# 添加3组不同的数据轨迹
fig.add_trace(go.Scatter(  #
    x=random_x,
    y=random_y0,
    mode='lines', # mode模式选择
    name='lines')) # 名字

fig.add_trace(go.Scatter(
    x=random_x,
    y=random_y1,
    mode='lines+markers',
    name='lines+markers'))

fig.add_trace(go.Scatter(
    x=random_x,
    y=random_y2,
    mode='markers',
    name='markers'))

fig.show()

### 面积图

In [None]:
gapminder.head()   # gdp数据集

In [None]:
# area 图
px.area(gapminder,  
        x="year",
        y="pop",
        color="continent",
        line_group="country")

In [None]:
fig = go.Figure()

# 通过散点图的不同填充方式来实现的

fig.add_trace(go.Scatter(x=[1, 2, 3, 4], 
                         y=[1, 2, 3, 5], 
                         fill='tozerox', # 填充方式：向着x轴填充
                         name="tozerox" # 轨迹名称
                        )) 

# fig.add_trace(go.Scatter(x=[1, 2, 3, 4], 
#                          y=[1, 2, 3, 5], 
#                          fill='tonexty', # 填充方式：向着x轴填充
#                          name="tonexty" # 轨迹名称
#                         )) 


fig.add_trace(go.Scatter(x=[1, 2, 3, 4], 
                         y=[1, 2, 3, 5], 
                         fill='tozeroy', # 填充方式：向着x轴填充
                         name="tozeroy" # 轨迹名称
                        )) 


# fig.add_trace(go.Scatter(x=[1, 2, 3, 4], 
#                          y=[3, 5, 1, 7], 
#                          fill='tonexty',
#                          name="tonexty"
#                         ))

fig.show()

### 饼图

In [None]:
tips.head()  # 查看前5行数据

In [None]:
# 根据day分组，统计total_bill字段的和

total_bill_byday = tips.groupby(by="day")["total_bill"].sum().reset_index()
total_bill_byday

In [None]:
px.pie(total_bill_byday, # 绘图数据
       names="day",  # 每个组的名字
       values="total_bill"  # 组的取值
      )

In [None]:
fig = go.Figure(data=go.Pie(
    labels=total_bill_byday["day"].tolist(),
    values=total_bill_byday["total_bill"].tolist()
))

fig.show()

### 旭日图

In [None]:
# 选取2002年数据
gapminder_2002 = gapminder[gapminder["year"] == 2002]

px.sunburst(gapminder_2002,   # 绘图数据
            path=['continent', 'country'],  # 指定路径：从洲到国家
            values='pop', # 数据大小：人口数
            color='lifeExp',  # 颜色
            hover_data=['iso_alpha'] # 显示数据
           )

### 漏斗图

In [None]:
data = dict(   # 创建原始数据
    number = [1000, 800, 400, 200, 100, 30],
    stage = ["UV", "搜索", "搜藏", "加购", "下单", "付款"]
)

# 传入数据和数轴
px.funnel(data, 
          x="number", 
          y="stage",
          color="number"  # 颜色设置
         )

### 联合分布图

In [None]:
px.scatter(
    iris,
    x="sepal_width",
    y="sepal_length",
    color="species",
    marginal_x="histogram",
    marginal_y="rug")

### 小提琴图

In [None]:
px.violin(iris,
           y="sepal_width",
           color="species")

### 散点矩阵图

In [None]:
iris

In [None]:
px.scatter_matrix(iris,
                  dimensions=["sepal_width","sepal_length","petal_width","petal_length"],
                  color="species")

### 并行分类图

In [None]:
px.parallel_categories(
    tips,  # 传入数据
    color="size",  # 颜色取值
    color_continuous_scale=px.colors.sequential.Inferno # 颜色变化趋势
)

### 平行坐标图

In [None]:
px.parallel_coordinates(iris,
                        color="species_id",
                        labels={"species_id":"Species",
                               "sepal_width":"Sepal Width",
                               "sepal_length":"Sepal Length",
                               "petal_length":"Petal Length",
                               "petal_width":"Petal Width"},
                       color_continuous_scale=px.colors.diverging.Tealrose,
                       color_continuous_midpoint=2)

### 密度等值线图

In [None]:
px.density_contour(iris,
                   x="sepal_width",
                   y="sepal_length",
                   color="species",
                   marginal_x="rug",  # 需要传入边缘图形
                   marginal_y="histogram"   
                  )

### 密度热力图

In [None]:
px.density_heatmap(iris,
                   x="sepal_width",
                   y="sepal_length",
                   marginal_y="rug",
                   marginal_x="histogram"   # 在密度图的基础上，指定另外两种图形
                  )

### 直方图

In [None]:
px.histogram(
    tips,  # 绘图数据
    x="sex",  # 指定两个数轴
    y="tip",
    histfunc="avg",  # 直方图函数：均值
    color="smoker",  # 颜色取值
    barmode="group",  # 柱状图模式
    facet_row="time",  # 横纵纵轴的字段设置
    facet_col="day",
    category_orders={"day":["Thur","Fri","Sat","Sun"],  # 分类
                     "time":["Lunch","Dinner"]})

### 基于地图图形

In [None]:
px.choropleth(gapminder,
              locations="iso_alpha",
              color="lifeExp",
              hover_name="country",
              animation_frame="year",
              color_continuous_scale=px.colors.sequential.Plasma,
              projection="natural earth") 

In [None]:
px.line_geo(
  gapminder_2002,
  locations="iso_alpha",
  color="continent",
  projection="orthographic")

### 矩阵式树状图

In [None]:
# 选取2002年数据
gapminder_2002 = gapminder[gapminder["year"] == 2002]

px.treemap(
    gapminder_2002, # 数据
    path=[px.Constant('world'), 'continent', 'country'],   # 绘图路径：world---continent---country
    values='pop',  # 数据取值
    color='pop',   # 颜色取值
    hover_data=['iso_alpha'])  # 显示数据：国家简称

### 散点极坐标

In [None]:
wind = px.data.wind()
wind.head()

In [None]:
px.scatter_polar(
    wind,  #  数据集
    r="frequency",  # 半径
    theta="direction",   # 角度
    color="strength",  # 颜色
    symbol="strength",  # 符号
    color_discrete_sequence=px.colors.sequential.Plasma_r)  # 颜色

In [None]:
fig = px.bar_polar(
    wind,   # 数据集
    r="frequency",   # 半径
    theta="direction",  # 角度
    color="strength",  # 颜色
    template="plotly_dark",  # 主题
    color_discrete_sequence=px.colors.sequential.Plasma_r)  # 颜色
fig.show()