In [None]:
# Библиотека Plotly
# интерактивные графики
# составления красивых дашбордов
# https://plotly.com/python/

In [1]:
import plotly
import plotly.express as px
print(plotly.__version__)

5.7.0


In [None]:
# ЭКСПРЕСС-РЕЖИМ

In [None]:
# метода line()
# https://plotly.com/python-api-reference/generated/plotly.express.line.html

In [None]:
# Основные параметры метода line()
# data_frame — DataFrame, по которому строится график;
# x — признак по оси абсцисс;
# y — признак по оси ординат;
# height — высота графика;
# width — ширина графика;
# title — название графика

In [2]:
import pandas as pd
import matplotlib.pyplot as plt
# % matplotlib inline
plt.style.use('default')
covid_df = pd.read_csv('data/covid_df.csv')
covid_df.head(3)

Unnamed: 0.1,Unnamed: 0,date,country,confirmed,deaths,recovered,active,daily_confirmed,daily_deaths,daily_recovered,total_vaccinations,people_vaccinated,people_vaccinated_per_hundred,people_fully_vaccinated,people_fully_vaccinated_per_hundred,daily_vaccinations,vaccines,death_rate,recover_rate
0,0,2020-02-24,Afghanistan,1.0,0.0,0.0,1.0,,,,,,,,,,,0.0,0.0
1,1,2020-02-25,Afghanistan,1.0,0.0,0.0,1.0,0.0,0.0,0.0,,,,,,,,0.0,0.0
2,2,2020-02-26,Afghanistan,1.0,0.0,0.0,1.0,0.0,0.0,0.0,,,,,,,,0.0,0.0


In [10]:
# Построим график роста зафиксированного числа случаев заражения (confirmed), смертей (deaths), выздоровлений (recovered) и активных случаев (active) за всё время. 
# Для этого просуммируем статистику по дням и передадим полученный DataFrame в метод line().
line_data = covid_df.groupby('date', as_index=False).sum()

fig = px.line(
    data_frame=line_data, #DataFrame
    x='date', #ось абсцисс
    y=['confirmed', 'recovered', 'deaths', 'active'], #ось ординат
    height=500, #высота
    width=1000, #ширина
    title='Confirmed, Recovered, Deaths, Active cases over Time' #заголовок
)
fig.show()


In [4]:
#pip install plotly
#pip install Jupyter Notebook Renderers
#pip install nbformat>=4.2.0

In [None]:
# метод bar() модуля express
# столбчатая диаграмма
# https://plotly.com/python-api-reference/generated/plotly.express.bar.html

In [None]:
# Добавим несколько параметров:
# color — группирующий признак, в соответствии с которым будут раскрашены столбцы диаграммы;
# text — текст, который будет подписан на столбцах диаграммы;
# orientation — ориентация графика ('v' — вертикальная, 'h' — горизонтальная).


In [None]:
# построим столбчатую диаграмму, 
# показывающую ТОП-10 стран по среднему проценту выздоравливающих пациентов (recover_rate). 

In [15]:
#считаем средний процент выздоровлений для каждой страны
bar_data = covid_df.groupby(
    by=['country'], as_index=False
    )[['recover_rate']].mean().round(2).nlargest(10, columns=['recover_rate'])
#строим график
fig = px.bar(
    data_frame = bar_data,
    x = 'country',
    y = 'recover_rate',
    #color = 'country',
    text = 'recover_rate',
    orientation='v',
    height = 500,
    width = 1000,
    title = 'Top 10 countries for recovering'
)
fig.show()

In [None]:
# график treemap()
# древесная, или иерархическая, диаграмма
# https://plotly.com/python-api-reference/generated/plotly.express.treemap.html
# когда число возможных категорий велико (например, число стран в таблице covid_df).

In [None]:
# схож с круговой диаграммой и столбчатой диаграммой, однако, в отличие от них, позволяет вместить информацию о гораздо большем числе категорий, не потеряв при этом информативность
# Основные параметры метода treemap()
# data_frame — DataFrame, по которому строится график;
# path — категориальные признаки (их может быть несколько), в разрезе которых строится диаграмма;
# values — показатель, по которому рассчитываются размеры прямоугольников.

In [23]:
# Построим иерархическую диаграмму 
# для среднего ежедневного показателя выздоровевших пациентов (daily_recovered) во всех странах
#считаем среднее ежедневно фиксируемое количество выздоровевших по странам
treemap_data = covid_df.groupby(
    by='country', as_index=False)[['daily_recovered']].mean()
# строим график
fig = px.treemap(
    data_frame = treemap_data,
    path = ['country'],
    values = 'daily_recovered',
    height = 500,
    width = 1000,
    title = 'Daily recovered cases by country'
)
fig.show()


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.



In [None]:
# АНИМАЦИЯ ГРАФИКОВ ВО ВРЕМЕНИ
# https://plotly.com/python/animations/
# https://www.geeksforgeeks.org/animated-data-visualization-using-plotly-express/

In [None]:
# график choropleth()
# (тепловая картограмма) — это тепловая карта, которая строится на географической карте мира. 
# Чтобы увидеть, как изменяется значение показателя на карте во времени, можно добавить в график анимацию
# https://plotly.com/python-api-reference/generated/plotly.express.choropleth.html

In [None]:
# Основные параметры метода choropleth()
# data_frame — DataFrame, по которому строится график;
# locations — название столбца, из которого берутся локации (столбец со странами или регионами);
# locationmode — режим геопривязки; определяет, как будет производиться сопоставление данных с картой в Plotly (возможно сопоставление по названию страны, "country_name", или по её трёхзначному шифру, согласно международному стандарту ISO-3);
# range_color — диапазон изменения цвета;
# animation_frame — анимирующий признак, изменяя который, мы получаем визуализацию во времени;
# color_continuous_scale — цветовая палитра.

In [None]:
# построим фоновую картограмму, которая покажет распространение (confirmed) коронавируса в мире во времени
# 