### Plotly.express

Это очень мощная библиотека для визуализации данных, которая может помочь тебе создавать красивые и интерактивные графики.

Для начала работы с Plotly Express нужно установить ее. Для этого можешь использовать следующую команду:

In [None]:
!pip install plotly==5.3.1


Теперь, когда библиотека установлена, мы можем начать работать с ней. Ниже приведен пример кода, который показывает, как создавать графики с помощью Plotly Express.

# График рассеивания с линией тренда

In [None]:
import plotly.express as px
import pandas as pd

# загрузка набора данных о продажах автомобилей
df = pd.read_csv('https://raw.githubusercontent.com/plotly/datasets/master/imports-85.csv')

# график рассеяния для двух переменных 'horsepower' и 'price'
fig = px.scatter(df, x='horsepower', y='price', trendline='ols')
fig.show()

В этом примере мы импортируем библиотеку Plotly Express и набор данных о продажах автомобилей. Затем мы создаем график рассеяния с помощью метода px.scatter(), указывая переменные, которые мы хотим использовать для осей графика, а также добавляем трендовую линию с помощью параметра trendline.

Когда мы запустим этот код, мы увидим интерактивный график с трендовой линией, который показывает связь между мощностью автомобиля и его ценой.

Давай теперь рассмотрим несколько других типов графиков, которые можно создать с помощью Plotly Express.

# График круговой диаграммы


In [None]:
import plotly.express as px
import pandas as pd

# загрузка набора данных о продажах автомобилей
df = pd.read_csv('https://raw.githubusercontent.com/plotly/datasets/master/gapminderDataFiveYear.csv')

# график круговой диаграммы для доли населения по регионам
fig = px.pie(df, values='pop', names='continent')
fig.show()


Этот код создает круговую диаграмму, которая показывает долю населения по регионам.

# Гистограмма

In [None]:
import plotly.express as px
import pandas as pd

# загрузка набора данных о продажах автомобилей
df = pd.read_csv('https://raw.githubusercontent.com/plotly/datasets/master/iris.csv')

# гистограмма для распределения длин лепестков


Итак, мы загрузили набор данных о цветах Ириса и создали гистограмму, которая показывает распределение длин лепестков. Гистограмма создается с помощью метода px.histogram(), указывая переменную, для которой мы хотим построить гистограмму.

# Ящик с усами

In [None]:
import plotly.express as px
import pandas as pd

# загрузка набора данных о продажах автомобилей
df = pd.read_csv('https://raw.githubusercontent.com/plotly/datasets/master/iris.csv')

# ящик с усами для распределения длин лепестков по видам цветов
fig = px.box(df, x='Name', y='PetalLength')
fig.show()


Этот код создает ящик с усами, который показывает распределение длин лепестков для каждого вида цветка Ириса.

# Диаграмма рассеяния


In [None]:
import plotly.express as px
import pandas as pd

# загрузка набора данных о продажах автомобилей
df = pd.read_csv('https://raw.githubusercontent.com/plotly/datasets/master/iris.csv')

# диаграмма рассеяния для длины лепестков и ширины чашелистика
fig = px.scatter(df, x='PetalLength', y='SepalWidth')
fig.show()


Этот код создает диаграмму рассеяния, которая показывает зависимость длины лепестков от ширины чашелистика. Каждая точка на диаграмме представляет собой цветок Ириса.

# 3D-диаграммы

In [None]:
import plotly.express as px
import pandas as pd

# загрузка набора данных о продажах автомобилей
df = pd.read_csv('https://raw.githubusercontent.com/plotly/datasets/master/iris.csv')

# 3D-диаграмма для длины и ширины лепестков и чашелистиков
fig = px.scatter_3d(df, x='PetalLength', y='PetalWidth', z='SepalLength', color='Name')
fig.show()


Этот код создает 3D-диаграмму, которая показывает зависимость длины и ширины лепестков и чашелистиков от вида цветка Ириса. Каждая точка на диаграмме представляет собой цветок Ириса, а цвет точки соответствует виду цветка.

# Тепловая карта

***Тепловая карта*** - это графическое представление данных в виде матрицы, где каждая ячейка матрицы закрашена определенным цветом в зависимости от значения, которое она представляет. Она используется для отображения связи между двумя переменными, которые могут быть числовыми, категориальными или бинарными.

На тепловой карте обычно используются цветовые градиенты, где оттенок цвета показывает относительное значение в каждой ячейке матрицы. Часто в тепловых картах также используются дополнительные элементы, такие как метки осей и легенда, для облегчения интерпретации данных.

Тепловые карты часто применяются в различных областях, например, для анализа социальных сетей, визуализации финансовых данных, отображения данных о клиентах и т.д. Они позволяют быстро выявлять взаимосвязи между различными переменными и облегчают процесс принятия решений на основе данных.

In [None]:
import plotly.express as px
import pandas as pd

# загрузка набора данных о продажах автомобилей
df = pd.read_csv('https://raw.githubusercontent.com/plotly/datasets/master/iris.csv')

# тепловая карта для корреляционной матрицы
corr = df.corr()
fig = px.imshow(corr)
fig.show()


Этот код создает тепловую карту для корреляционной матрицы набора данных Ирисов. Тепловая карта показывает, как связаны между собой различные переменные в наборе данных. Чем светлее ячейка на карте, тем больше связь между соответствующими переменными.

# Диаграмма Ганта

***Диаграмма Ганта*** (или гантт-диаграмма) — это инструмент для визуализации планов проектов и управления временем, который позволяет представить сроки выполнения задач и зависимости между ними в удобном и понятном формате. Диаграмма Ганта была разработана инженером Генри Гантом в начале XX века для управления временем в производственных процессах, и с тех пор стала широко используемым инструментом в управлении проектами.

В Диаграмме Ганта каждая задача представляется горизонтальной полосой, протянутой через весь временной интервал проекта, соответствующий сроку выполнения задачи. Задачи располагаются на оси X, а временные интервалы - на оси Y. На диаграмме также могут быть показаны зависимости между задачами, например, одна задача не может быть начата, пока не закончена другая. Зависимости обычно отображаются стрелками, указывающими направление выполнения задач.

Диаграмма Ганта может быть полезна для управления проектами, планирования задач и координации работ между участниками проекта. Кроме того, Диаграмма Ганта может помочь визуализировать сроки выполнения задач и их зависимости, что позволяет улучшить планирование проектов и увеличить производительность.

In [None]:
import plotly.express as px
import pandas as pd

# загрузка набора данных о задачах
df = pd.read_csv('https://raw.githubusercontent.com/plotly/datasets/master/gantt_example.csv')

# диаграмма Ганта для планирования задач
fig = px.timeline(df, x_start='Start', x_end='Finish', y='Task', color='Resource')
fig.show()


Этот код создает диаграмму Ганта, которая используется для визуализации плана выполнения задач. На диаграмме каждая задача представлена как горизонтальная линия, а длина этой линии соответствует продолжительности задачи. Диаграмма Ганта может использоваться для планирования проектов, управления процессами и т.д.

# Парные диаграммы

In [None]:
import plotly.express as px
import pandas as pd

# загрузка набора данных о продажах автомобилей
df = pd.read_csv('https://raw.githubusercontent.com/plotly/datasets/master/iris.csv')

# парные диаграммы для визуализации зависимости между различными признаками
fig = px.scatter_matrix(df, dimensions=['SepalLength', 'SepalWidth', 'PetalLength', 'PetalWidth'], color='Name')
fig.show()


Этот код создает набор парных диаграмм, которые позволяют визуализировать зависимость между различными признаками в наборе данных Ирисов.

# Гистограммы с плотностями распределения

In [None]:
import plotly.express as px
import pandas as pd

# загрузка набора данных о продажах автомобилей
df = pd.read_csv('https://raw.githubusercontent.com/plotly/datasets/master/iris.csv')

# гистограммы с плотностями распределения для различных признаков цветков Ириса
fig = px.histogram(df, x='PetalLength', color='Name', marginal='rug', opacity=0.7)
fig.show()


Этот код создает гистограммы с плотностями распределения для длины лепестков цветков Ириса, позволяя визуализировать распределение каждого вида цветка на одном графике.

# scatter_geo

Одним из примеров таких интерактивных графиков является график «scatter_geo», который позволяет визуализировать точки на карте мира с помощью географических координат. Вот пример кода для создания такого графика:

In [None]:
import plotly.express as px
df = px.data.gapminder().query("year == 2007")
fig = px.scatter_geo(df, locations="iso_alpha",
                     size="pop", # size of markers, "pop" is one of the columns of gapminder
                     )
fig.show()


# Пример с GeoPandas

In [None]:
!pip install geopandas

In [None]:
import plotly.graph_objects as go

import pandas as pd

df = pd.read_csv('https://raw.githubusercontent.com/plotly/datasets/master/2011_february_us_airport_traffic.csv')
df['text'] = df['airport'] + '' + df['city'] + ', ' + df['state'] + '' + 'Arrivals: ' + df['cnt'].astype(str)


fig = go.Figure(data=go.Scattergeo(
        locationmode = 'USA-states',
        lon = df['long'],
        lat = df['lat'],
        text = df['text'],
        mode = 'markers',
        marker = dict(
            size = 8,
            opacity = 0.8,
            reversescale = True,
            autocolorscale = False,
            symbol = 'square',
            line = dict(
                width=1,
                color='rgba(102, 102, 102)'
            ),
            colorscale = 'Blues',
            cmin = 0,
            color = df['cnt'],
            cmax = df['cnt'].max(),
            colorbar_title="Incoming flights<br>February 2011"
        )))

fig.update_layout(
        title = 'Most trafficked US airports<br>(Hover for airport names)',
        geo = dict(
            scope='usa',
            projection_type='albers usa',
            showland = True,
            landcolor = "rgb(250, 250, 250)",
            subunitcolor = "rgb(217, 217, 217)",
            countrycolor = "rgb(217, 217, 217)",
            countrywidth = 0.5,
            subunitwidth = 0.5,
            bgcolor="rgb(24,28,24)"
        ),
    )
fig.show()