# Визуализация данных с `plotly`

Библиотека `plotly` состоит из следующих модулей:  
* `plotly.express` - для создания простых графиков  
* `plotly.graph_objects` - для создания более сложных и кастомизированных графиков  
* `plotly.figure_factory` - для создания специфичных, нестандартных графиков 

## Что такое `plotly.express`

`plotly.express` - это модуль библиотеки `Plotly`, предназначенный для упрощения процесса создания графиков. Он предоставляет простой и интуитивно понятный API для создания различных типов визуализаций.

Преимущества `plotly.express`:  
* интерактивные графики  
* простой синтаксис для создания графиков  
* широкие возможности кастомизации

## Установка библиотеки

Для установки библиотеки, в командной строке наберите следующую команду:  
```bash 
pip install plotly
```

## Базовый синтаксис

Общий синтаксис создания графиков с помощью `plotly.express` выглядит следующим образом:  
```python
import plotly.express as px

fig = px.<chart_type>(
    data_frame,
    x,
    y
)
fig.show()
```  
где: 
* `<chart_type>` - тип создаваемого графика 
* `data_frame` - датафрейм, содержащий данные
* `x`, `y` - поля данных для осей X и Y   

## Примеры использования

### Юнивариативные графики

In [None]:
import numpy as np
import pandas as pd
import plotly
import plotly.express as px

In [None]:
tips = plotly.data.tips()
tips.shape

In [None]:
tips.sample(10)

In [None]:
fig = px.histogram(
    data_frame = tips,
    x = 'tip',
    title = 'Tips distribution'
)
fig.show();

>Фигура в `plotly` состоит из 3 основных компонентов:  
>* **`layout`** - словарь, контролирующий стиль фигуры. Одна фигура может иметь лишь один `layout`  
>* **`data`** - список словарей, которые определяют тип графика и данные в нём содержащиеся.  
>* **`trace`** - комбинация из словарей по типам и данным: *data* + *type* = `trace`. Один график может состоять из нескольких `trace`

In [None]:
print(fig)

In [None]:
px.bar(
    data_frame = tips.groupby(['sex'], as_index = False)['tip'].sum(),
    y = 'sex',
    x = 'tip'
)

In [None]:
px.scatter(
    data_frame = tips,
    x = 'tip',
    y = 'total_bill'
)

In [None]:
px.scatter(
    data_frame = tips,
    x = 'tip',
    y = 'total_bill',
    trendline='ols'
)

In [None]:
px.box(
    data_frame = tips,
    x = 'tip'
)

In [None]:
px.pie(
    data_frame = tips,
    values = 'tip',
    names = 'sex'
)

In [None]:
px.pie(
    data_frame = tips,
    values = 'tip',
    names = 'sex',
    hole = .5
)

In [None]:
gpm = plotly.data.gapminder()

In [None]:
gpm

In [None]:
px.line(
    data_frame = gpm.groupby(['year'], as_index=False)['lifeExp'].mean(),
    x = 'year',
    y = 'lifeExp'
)

### Бивариативные графики

In [None]:
px.histogram(
    data_frame = tips,
    x = 'total_bill',
    color = 'sex',
)

In [None]:
px.line(
    data_frame = gpm.query("country.isin(['Japan', 'Germany', 'United States', 'China'])"),
    x = 'year',
    y = 'lifeExp',
    color = 'country',
    markers = True
)

In [None]:
px.bar(
    data_frame = tips.groupby(['smoker', 'day'], as_index=False)['tip'].sum(),
    x = 'smoker',
    y = 'tip',
    color = 'day',
    barmode = 'stack'
)

In [None]:
px.bar(
    data_frame = tips.groupby(['smoker', 'day'], as_index=False)['tip'].sum(),
    x = 'smoker',
    y = 'tip',
    color = 'day',
    barmode = 'group'
)

In [None]:
px.bar(
    data_frame = tips.groupby(['smoker', 'day'], as_index=False)['tip'].sum(),
    x = 'smoker',
    y = 'tip',
    color = 'day',
    barmode = 'overlay',
    opacity = .2
)

### Мультивариативные графики

In [None]:
px.bar(
    data_frame = tips, 
    x = 'smoker',
    y = 'tip',
    color = 'day',
    barmode = 'group',
    facet_col = 'sex',
    facet_row = 'time'
)

In [None]:
px.scatter(
    data_frame = tips,
    x = 'tip',
    y = 'total_bill',
    color = 'sex',
    size = 'size',
    symbol = 'smoker',
    facet_col = 'day',
    facet_col_wrap = 2,
    facet_row = 'time',
    height = 1000
)