### Визуализация в Python

Сегодня мы разберем с вами несколько библиотек, специалазирующихся на построение визуализаций в Python и попробуем построить различные типы графиков с их использованием:

1. Линейный график
2. Тепловая карта
3. Диаграмма рассеяния (точечная диаграмма)
4. Гистограмма 
5. Столбчатая диаграмма
5. Диаграмма размаха ("ящик с усами")
6. Круговая диаграмма

Также рассмотрим более подробно, как комбинировать графики между собой, поговорим поподробнее о существующих параметрах настройки их отображения и об особенностях каждой библиотеки.

 [Подробнее о Plotly](https://habr.com/ru/articles/502958)

 [Англоязычная статья про визуализации](https://www.geeksforgeeks.org/data-visualization/data-visualization-with-python)

In [None]:
import numpy as np 
import pandas as pd 

### Библиотека Matplotlib

Библиотека Matplotlib — пакет для визуализации данных в Python, который позволяет работать с данными на нескольких уровнях:

* с помощью модуля Pyplot, который рассматривает график как единое целое;
* через объектно-ориентированный интерфейс, когда каждая фигура или её часть является отдельным объектом, — это позволяет выборочно менять их свойства и отображение.

Matplotlib используют для визуализации данных любой сложности. Библиотека позволяет строить разные варианты графиков: линейные, трёхмерные, диаграммы рассеяния и другие, а также комбинировать их.

In [None]:
# для работы в matplotlib установим соответствующую библиотеку
import matplotlib.pyplot as plt

In [None]:
#общая схема построения графиков в matplotlib

# шаг 1 - задание фигуры, в которую вместится график
plt.figure(figsize=(10, 6))  # cоздание фигуры(полотна) и задание размеров графика

# шаг 2 - построение конкретного графика (см. ниже типы)
plt

# шаг 3 - оформление графика
plt.title('название', 
          fontsize=14, #размер шрифта
          fontweight='light') #толщина шрифта (normal, bold, light)
plt.xlabel('X значения', fontsize=12) #подписи осей (где это нужно)
plt.ylabel('Y значения', fontsize=12) #подписи осей (где это нужно)
plt.grid(True, alpha=0.3)  # устанавливает сетку, можно только по горизонтали сделать или вертикали
plt.legend(fontsize=10) # устанавливает легенду
plt.xticks(range(10)) #устанавливает деление и метки
plt.yticks(range(10)) 
plt.tight_layout() # автоматически корректирует расстояние между элементами графика
plt.show() #показывает график

# примечание: могут быть и другие настройки, в зависимости от конкретного графика

In [None]:
#если требуется вместить несколько графиков в один, делаем следующее (в шаге 1)
# способ 1

# создание фигуры и сетки графиков
fig, axes = plt.subplots(
    nrows=2,           # количество строк
    ncols=2,           # количество столбцов
    figsize=(12, 8)    # общий размер фигуры
)

# axes теперь представляет собой массив 2x2 с объектами осей
# axes[0, 0] - левый верхний график
# axes[0, 1] - правый верхний график  
# axes[1, 0] - левый нижний график
# axes[1, 1] - правый нижний график

# график 1 (левый верхний)
axes[0, 0].plot(x1, y1, color='blue', label='График 1')
axes[0, 0].set_title('Первый график')
axes[0, 0].set_xlabel('X1')
axes[0, 0].set_ylabel('Y1')
axes[0, 0].legend()
axes[0, 0].grid(True, alpha=0.3)

# график 2 (правый верхний)
axes[0, 1].scatter(x2, y2, color='red', label='График 2')
axes[0, 1].set_title('Второй график')
axes[0, 1].set_xlabel('X2')
axes[0, 1].set_ylabel('Y2')
axes[0, 1].legend()

# график 3 (левый нижний)
axes[1, 0].bar(categories, values, color='green', alpha=0.7)
axes[1, 0].set_title('Третий график')
axes[1, 0].set_xlabel('Категории')
axes[1, 0].set_ylabel('Значения')

# график 4 (правый нижний)
axes[1, 1].hist(data, bins=30, color='orange', alpha=0.7)
axes[1, 1].set_title('Четвертый график')
axes[1, 1].set_xlabel('Данные')
axes[1, 1].set_ylabel('Частота')

In [None]:
# способ 2

plt.figure(figsize=(12, 8))

# первый график
plt.subplot(2, 2, 1)  # (строки, столбцы, позиция)
plt.plot(x1, y1, 'b-')
plt.title('График 1')
plt.grid(True, alpha=0.3)

# второй график  
plt.subplot(2, 2, 2)
plt.scatter(x2, y2, color='red')
plt.title('График 2')

# третий график
plt.subplot(2, 2, 3)
plt.bar(categories, values)
plt.title('График 3')

# четвертый график
plt.subplot(2, 2, 4)
plt.hist(data, bins=30)
plt.title('График 4')

### Библиотека Seaborn

Seaborn — это библиотека для создания статистических графиков на. Она построена на основе библиотеки Matplotlib и тесно интегрирована со структурами данных из Pandas. Seaborn помогает с минимальными усилиями создавать сложные статистические диаграммы — например, коробчатые и виолончельные диаграммы, гистограммы, диаграммы рассеяния и многое другое.

Она предлагает высокоуровневый интерфейс для создания статистических графиков, в то время как Matplotlib предоставляет низкоуровневый контроль над элементами графика.

In [None]:
# для работы в seaborn установим соответствующую библиотеку
import seaborn as sns

In [None]:
#общая схема построения графиков в seaborn совпадает с matplotlib

In [None]:
#если требуется вместить несколько графиков в один, делаем следующее (в шаге 1)

# создание фигуры и сетки графиков
fig, axes = plt.subplots(
    nrows=2,           # количество строк
    ncols=2,           # количество столбцов
    figsize=(12, 8)    # общий размер фигуры
)

# первый график
sns.lineplot(data=df, x='время', y='продажи', ax=axes[0, 0])
axes[0, 0].set_title('Динамика продаж')  #можно установить заголовки в каждом из графиков
axes[0, 0].set_xlabel('Время')
axes[0, 0].set_ylabel('Продажи')

# второй график 
sns.barplot(data=df, x='категория', y='значения', ax=axes[0, 1])
axes[0, 1].set_title('Продажи по категориям')

# третий график
sns.histplot(data=df, x='возраст', ax=axes[1, 0])
axes[1, 0].set_title('Распределение возраста')

# четвертый график
sns.boxplot(data=df, x='группа', y='результат', ax=axes[1, 1])
axes[1, 1].set_title('Результаты по группам')

### Библиотека Plotly

Plotly — это библиотека визуализации данных с открытым исходным кодом, предоставляющая широкий спектр возможностей интерактивного построения графиков на языке Python. 

Plotly позволяет создавать интерактивные визуализации, включая линейные графики, точечные диаграммы, гистограммы, тепловые карты, трехмерные графики и многое другое. Благодаря своей гибкости и простоте использования библиотека широко используется в различных областях: анализ данных, научные исследования, финансы, веб-разработка и других.

In [None]:
# для работы в plotly установим соответствующие библиотеки
!pip install plotly 
import plotly.express as px #px применяется  для быстрого создания стандартных графиков
import plotly.graph_objects as go #go позволяет применять более тонкие настройки

In [None]:
#общая схема построения графиков в plotly (plotly express)

#шаг 1 - построение самого графика (типы ниже)
fig = px......(
    data_frame=df,           # DataFrame с данными
    x='x',                   # Столбец для оси X
    y='y',                   # Столбец для оси Y
    .....                    # свои настройки в зависимости от графика
    title='Название графика'
)

#или
fig = go......(
    data_frame=df,           # DataFrame с данными
    x='x',                   # Столбец для оси X
    y='y',                   # Столбец для оси Y
    .....                    # свои настройки в зависимости от графика
    title='Название графика'
)

#шаг 2 - обновление макета, общая настройка отображаемых параметров  
fig.update_layout(
    xaxis_title='Подпись оси X',    # Заголовок для оси X
    yaxis_title='Подпись оси Y',    # Заголовок для оси Y
    font=dict(size=12),             # Настройки шрифта для всего графика
    template='plotly_white'         # Визуальный шаблон оформления
)

#более сложные настройки update_layout:
fig.update_layout(
    title='Мой график',                      # Главный заголовок
    title_x=0.5,                            # Выравнивание заголовка по центру (0.5 = 50%)
    xaxis_title='Время (дни)',              # Подпись оси X
    yaxis_title='Температура (°C)',         # Подпись оси Y  
    font=dict(
        family='Arial',                     # Шрифт текста
        size=14,                            # Размер шрифта
        color='black'                       # Цвет шрифта
    ),
    plot_bgcolor='white',                   # Цвет фона области графика
    paper_bgcolor='lightgray',              # Цвет фона вокруг графика
    showlegend=True,                        # Показывать легенду
    legend=dict(
        x=0.8,                              # Позиция легенды по X (0-1)
        y=0.9,                              # Позиция легенды по Y (0-1)
        bgcolor='white',                    # Цвет фона легенды
        bordercolor='black',                # Цвет рамки легенды
        borderwidth=1                       # Толщина рамки легенды
    )
)

# шаг 3 - настрйока отображения данных (строки, столбцы, маркеры)
fig.update_traces(
    marker=dict(opacity=0.7),
    selector=dict(type='scatter')
)

#более сложные настройки update_traces:
fig.update_traces(
    marker=dict(
        size=10,                            # Размер маркеров
        opacity=0.7,                        # Прозрачность
        color='red',                        # Цвет маркеров
        line=dict(                          # Граница маркеров
            width=2,                        # Толщина границы
            color='darkred'                 # Цвет границы
        )
    ),
    line=dict(                              # Для линейных графиков
        width=3,                            # Толщина линии
        dash='dash',                        # Стиль линии: 'solid', 'dash', 'dot', 'dashdot'
        color='blue'                        # Цвет линии
    ),
    selector=dict(type='scatter')           # Применить только к точечным графикам
)

# шаг 4  - показ графика
fig.show()

In [None]:
#если требуется вместить несколько графиков в один, делаем следующее 

from plotly.subplots import make_subplots

# cоздание фигуры с сеткой графиков
fig = make_subplots(
    rows=2,                    # количество строк
    cols=2,                    # количество столбцов
    subplot_titles=('График 1', 'График 2', 'График 3', 'График 4'),  # заголовки
    vertical_spacing=0.08,     # вертикальное расстояние между графиками
    horizontal_spacing=0.05    # горизонтальное расстояние между графиками
)

# график 1 (левый верхний, row=1, col=1)
fig.add_trace(
    go.Scatter(x=x1, y=y1, name='Линия 1'),
    row=1, col=1
)

# график 2 (правый верхний, row=1, col=2)  
fig.add_trace(
    go.Bar(x=categories, y=values1, name='Столбцы 1'),
    row=1, col=2
)

# график 3 (левый нижний, row=2, col=1)
fig.add_trace(
    go.Scatter(x=x2, y=y2, mode='markers', name='Точки 1'),
    row=2, col=1
)

# график 4 (правый нижний, row=2, col=2)
fig.add_trace(
    go.Histogram(x=data, name='Гистограмма'),
    row=2, col=2
)


# настройка осей
fig.update_xaxes(title_text='Дата', row=1, col=1)
fig.update_yaxes(title_text='Продажи', row=1, col=1)

fig.update_xaxes(title_text='Дата', row=1, col=2)
fig.update_yaxes(title_text='Температура (°C)', row=1, col=2)

fig.update_xaxes(title_text='Категория', row=2, col=1)
fig.update_yaxes(title_text='Средние продажи', row=2, col=1)

fig.update_xaxes(title_text='Температура', row=2, col=2)
fig.update_yaxes(title_text='Частота', row=2, col=2)

### Построение линейного графика

#### Matplotlib 

In [None]:
# генерируем данные
x = np.linspace(0, 10, 100)
y = np.sin(x)

In [None]:
# создаем размеры полотная для графика
plt.figure(figsize=(10, 6))

In [None]:
# строим график
plt.plot(x, y, 
         color='blue',        # Цвет линии
         linewidth=2,         # Толщина линии
         linestyle='-',       # Стиль линии (-, --, -., :)
         marker='o',          # Маркер точек (o, s, ^, D, None)
         markersize=4,        # Размер маркера
         markerfacecolor='red', # Цвет маркера
         markeredgecolor='black', # Цвет границы маркера
         markeredgewidth=1,   # Толщина границы маркера
         label='sin(x)')      # Метка для легенды

plt.title('Линейный график sin(x)', 
          fontsize=14, #размер шрифта
          fontweight='light') #толщина шрифта (normal, bold, light)
plt.xlabel('X значения', fontsize=12)
plt.ylabel('Y значения', fontsize=12)
plt.grid(True, alpha=0.3)  # устанавливает сетку с прозрачностью
plt.legend(fontsize=10)
plt.tight_layout() # автоматически корректирует расстояние между элементами графика
plt.show()

####  Seaborn

In [None]:
# генерируем датасет
df = pd.DataFrame({
    'x': x,
    'y': y,
    'category': ['A' if i < 50 else 'B' for i in range(100)]
})


In [None]:
plt.figure(figsize=(10, 6)) #задаем размер
sns.lineplot(data=df, x='x', y='y', 
             hue='category',     # hue - необходим для оттенка, в данном случае он зависит от категорий
             style='category',   # создает разные стили линий для каждой категории
             markers=True,       # настраивает маркеры
             dashes=False,       # устанавливает сплошные линии (если было бы True, использовался бы пунктир)
             palette='viridis',  # цветовая палитра
             linewidth=2.5)

plt.title('Линейный график Seaborn', 
          fontsize=14) #размер шрифта
plt.xlabel('X значения')
plt.ylabel('Y значения')
plt.grid(True, alpha=0.3) # устанавливает сетку с прозрачностью
plt.show()

#### Plotly

In [None]:
fig = px.line(df, x='x', y='y', 
              color='category',      # цветовое кодирование по названию
              title='Интерактивный линейный график',
              labels={'x': 'X значения', 'y': 'Y значения'},
              template='plotly_white')  # темы: plotly, plotly_white, plotly_dark, etc.

fig.update_traces(line=dict(width=3)) #задает толщину линий
 

fig.update_layout(
    width=800, #ширина графика
    height=500, #высота графика
    font=dict(size=14), # размер шрифта (всех подписей на графике)
    hovermode='x unified'  # показывать все значения при наведении
)

fig.show() #отражает график на экране

### Построение тепловой карты

#### Matplotlib

In [None]:
# генерация данных и построение корр. матрицы
np.random.seed(42)
data = pd.DataFrame(np.random.rand(10, 10))
df_corr = data.corr()

In [None]:
#строим график
plt.figure(figsize=(7, 7)) #задаем размер полотна
im = plt.imshow(df_corr, #imshow - функция для построения тепловой карты в matplotlib
                cmap='Spectral_r',      # цветовая тема (в следующей ячейке представлены все варианты)
                interpolation='nearest', # интерполяция
                aspect='auto')       # автоматически настраивает соотношение сторон изображения, 
                                     #чтобы оно занимало всю доступную область на полотне

plt.colorbar(im, label='Значения') #добавляет шкалу
plt.title('Тепловая карта Matplotlib', fontsize=14)
plt.xticks(range(10)) #отражают метки по горизонтали
plt.yticks(range(10)) #отражают метки по вертикали

plt.tight_layout()
plt.show()

**Все темы для cmap:**
'Accent', 'Accent_r', 'Blues', 'Blues_r', 'BrBG', 'BrBG_r', 'BuGn', 'BuGn_r', 'BuPu', 'BuPu_r', 'CMRmap', 'CMRmap_r', 'Dark2', 'Dark2_r', 'GnBu', 'GnBu_r', 'Greens', 'Greens_r', 'Greys', 'Greys_r', 'OrRd', 'OrRd_r', 'Oranges', 'Oranges_r', 'PRGn', 'PRGn_r', 'Paired', 'Paired_r', 'Pastel1', 'Pastel1_r', 'Pastel2', 'Pastel2_r', 'PiYG', 'PiYG_r', 'PuBu', 'PuBuGn', 'PuBuGn_r', 'PuBu_r', 'PuOr', 'PuOr_r', 'PuRd', 'PuRd_r', 'Purples', 'Purples_r', 'RdBu', 'RdBu_r', 'RdGy', 'RdGy_r', 'RdPu', 'RdPu_r', 'RdYlBu', 'RdYlBu_r', 'RdYlGn', 'RdYlGn_r', 'Reds', 'Reds_r', 'Set1', 'Set1_r', 'Set2', 'Set2_r', 'Set3', 'Set3_r', 'Spectral', 'Spectral_r', 'Wistia', 'Wistia_r', 'YlGn', 'YlGnBu', 'YlGnBu_r', 'YlGn_r', 'YlOrBr', 'YlOrBr_r', 'YlOrRd', 'YlOrRd_r', 'afmhot', 'afmhot_r', 'autumn', 'autumn_r', 'binary', 'binary_r', 'bone', 'bone_r', 'brg', 'brg_r', 'bwr', 'bwr_r', 'cividis', 'cividis_r', 'cool', 'cool_r', 'coolwarm', 'coolwarm_r', 'copper', 'copper_r', 'crest', 'crest_r', 'cubehelix', 'cubehelix_r', 'flag', 'flag_r', 'flare', 'flare_r', 'gist_earth', 'gist_earth_r', 'gist_gray', 'gist_gray_r', 'gist_heat', 'gist_heat_r', 'gist_ncar', 'gist_ncar_r', 'gist_rainbow', 'gist_rainbow_r', 'gist_stern', 'gist_stern_r', 'gist_yarg', 'gist_yarg_r', 'gnuplot', 'gnuplot2', 'gnuplot2_r', 'gnuplot_r', 'gray', 'gray_r', 'hot', 'hot_r', 'hsv', 'hsv_r', 'icefire', 'icefire_r', 'inferno', 'inferno_r', 'jet', 'jet_r', 'magma', 'magma_r', 'mako', 'mako_r', 'nipy_spectral', 'nipy_spectral_r', 'ocean', 'ocean_r', 'pink', 'pink_r', 'plasma', 'plasma_r', 'prism', 'prism_r', 'rainbow', 'rainbow_r', 'rocket', 'rocket_r', 'seismic', 'seismic_r', 'spring', 'spring_r', 'summer', 'summer_r', 'tab10', 'tab10_r', 'tab20', 'tab20_r', 'tab20b', 'tab20b_r', 'tab20c', 'tab20c_r', 'terrain', 'terrain_r', 'turbo', 'turbo_r', 'twilight', 'twilight_r', 'twilight_shifted', 'twilight_shifted_r', 'viridis', 'viridis_r', 'vlag', 'vlag_r', 'winter', 'winter_r'

#### Seaborn

In [None]:
# строим корреляционную матрицу
df_corr = pd.DataFrame(np.random.randn(100, 5), 
                      columns=['A', 'B', 'C', 'D', 'E']).corr()


In [None]:
plt.figure(figsize=(10, 8)) # размеры
sns.heatmap(df_corr,
            annot=True,          # Показывать значения внутри ячеек или нет
            fmt='.2f',           # Формат чисел (округление)
            cmap='coolwarm',     # Цветовая схема (выше были)
            center=0,            # отмечает значение относительно которого будет меняться цвет
            square=True,         # делает все ячейки квадратными
            linewidths=0.5,      # настройка ширины линий между ячейками
            cbar_kws={'shrink': 0.8}) # Настройки размера цветовой шкалы

plt.title('Корреляционная тепловая карта в Seaborn', fontsize=14)
plt.tight_layout()
plt.show()

#### Plotly

In [None]:
# создаем объект графика по тем же данным, что и до
fig = go.Figure(data=go.Heatmap(
    z=df_corr.values[::-1], # z - основные данные для тепловой карты (значения матрицы)
    x=df_corr.columns, # x - подписи для оси X (названия столбцов корреляционной матрицы)
    y=df_corr.columns, # y - подписи для оси Y (названия строк корреляционной матрицы)
    colorscale='RdBu',  # colorscale - цветовая схема для отображения данных (в данном случае красно-синяя)
    zmid=0,   #белый цвет будет соответствовать нулевой корреляции                
    text=df_corr.round(2).values, # df_corr.round(2).values - округляем значения матрицы до 2 знаков после запятой
    texttemplate='%{text}',  # настройка шаблона форматирования отображаемого текста
    textfont={"size": 10}, # textfont - настройки шрифта для текста. установлен размер 10 п.
    hoverongaps=False # hoverongaps - определяет поведение при наведении на пустые ячейки
))

In [None]:
fig.update_layout(
    title='Интерактивная тепловая карта',
    width=600,
    height=600,
    xaxis_title='Переменные',
    yaxis_title='Переменные'
)

fig.show()

###  Построение точечной диаграммы (диаграммы рассеяния)

#### Matplotlib

In [None]:
# создание данных
np.random.seed(42)
x = np.random.randn(100)
y = 2 * x + np.random.randn(100) * 0.5

In [None]:
plt.figure(figsize=(10, 6))
scatter = plt.scatter(x, y, 
                     alpha=0.7,
                     color = 'black',  # цвет точек
                     edgecolors='red', # цвет границ точек
                     linewidth=0.5)    # Толщина границ

plt.title('Точечная диаграмма', fontsize=14)
plt.xlabel('X значения')
plt.ylabel('Y значения')
plt.grid(True, alpha=0.3) 
plt.show()

#### Seaborn

In [None]:
df_scatter = pd.DataFrame({
    'x': x,
    'y': y
})

In [None]:
# в seaborn и matplotlib есть разные темы, которые мы можем применить к графикам:
sns.set_theme(style='dark')  # применим эту тему

#sns.set_theme(style='darkgrid')      # ✅ Темная сетка (по умолчанию)
#sns.set_theme(style='whitegrid')     # ✅ Белая сетка
#sns.set_theme(style='dark')          # ✅ Темный фон без сетки
#sns.set_theme(style='white')         # ✅ Белый фон без сетки
#sns.set_theme(style='ticks')         # ✅ Простые оси с делениями

In [None]:
plt.figure(figsize=(10, 6))
sns.scatterplot(data=df_scatter, x='x', y='y', color = 'red', edgecolors='black',
                alpha=0.7)

plt.title('Диаграмма рассеяния в Seaborn', fontsize=14)
plt.xlabel('X значения')
plt.ylabel('Y значения')
plt.tight_layout() 
plt.show()

#### Plotly

In [None]:
# доступные темы plotly:
#fig.update_layout(template='plotly')           # ✅ Светлая тема (по умолчанию)
#fig.update_layout(template='plotly_white')     # ✅ Чистая белая
#fig.update_layout(template='plotly_dark')      # ✅ Темная тема
#fig.update_layout(template='ggplot2')          # ✅ Стиль ggplot2 (R)
#fig.update_layout(template='seaborn')          # ✅ Стиль seaborn
#fig.update_layout(template='simple_white')     # ✅ Минималистичная белая
#fig.update_layout(template='presentation')     # ✅ Для презентаци

In [None]:
fig = px.scatter(df_scatter,         # датафрейм с данными
                 x='x',              # Столбец для оси X
                 y='y',              # Столбец для оси Y
                 size_max=30,        # Ограничиваем максимальный размер точек
                 title='Интерактивная диаграмма рассеяния',  # Основной заголовок
                 labels={'x': 'X значения', 'y': 'Y значения'})  # Переименовываем подписи осей

# настраиваем размеры в пикселях
fig.update_layout(
    width=800,      # Фиксированная ширина 800 пикселей
    height=500      # Фиксированная высота 500 пикселей
)

# настраиваем внешний вид маркеров (точек) - опционально
fig.update_traces(
    marker=dict(
        line=dict(
            width=1,                    # толщина границы точки = 1 пиксель
            color='DarkSlateGrey'       # цвет границы = темный серо-синий
        )
    )
)

fig.update_layout(template='plotly_white') #обновляем тему
fig.show() #отражаем график

### Построение гистограммы

#### Matplotlib

In [None]:
#генерация данных
data = np.random.normal(0, 1, 1000)

In [None]:
plt.figure(figsize=(12, 5))
plt.hist(data,       #данные
         bins=30,              # Количество столбцов (разделений)
         color='skyblue',      # Цвет
         edgecolor='black',    # Цвет границ
         alpha=0.7,           # Прозрачность
         density=False,       # Нормализация
         orientation='vertical') # Ориентация

plt.title('Гистограмма', fontsize=14)
plt.xlabel('Значения')
plt.ylabel('Частота')
plt.grid(True, alpha=0.3) #сетка и ее прозрачность

#### Seaborn

In [None]:
plt.figure(figsize=(12, 5))
sns.histplot(data=data, 
             bins=30,
             kde=True, #отражает/не отражает график плотности распределения
             color='lightgreen',
             edgecolor='black', #цвет границ
             alpha=0.7)

plt.title('Гистограмма с KDE', fontsize=14)

plt.tight_layout()
plt.xlabel('Значения')
plt.ylabel('Частота')
plt.show()

#### Plotly

In [None]:
fig = px.histogram(x=data, 
                   nbins=30,
                   title='Интерактивная гистограмма',
                   labels={'x': 'Значения', 'y': 'Частота'},
                   opacity=0.7,  # Прозрачность столбцов 70%
                   color_discrete_sequence=['lightseagreen']) # Цвет столбцов морской волны

fig.update_layout(
    width=600,
    height=500,
    bargap=0.5,  # промежуток между столбцами
    showlegend=False #показ легенды
)

fig.update_traces(marker=dict(line=dict(width=1, color='red')))

fig.show()

### Построение столбчатых диаграмм

#### Matplotlib

In [None]:
# cоздаем пример датафрейма с категориями товаров и их продажами
df = pd.DataFrame({
    'Категория': ['Электроника', 'Одежда', 'Книги', 'Спорт', 'Красота'],
    'Продажи': [120000, 85000, 45000, 78000, 92000],
    'Количество': [150, 300, 500, 200, 250]
})

In [None]:
plt.figure(figsize=(10, 6))

bars = plt.bar(df['Категория'], df['Продажи'], 
               color=['#FF6B6B', '#4ECDC4', '#45B7D1', '#96CEB4', '#FFEAA7', '#DDA0DD'],
               edgecolor='black', linewidth=0.5)

plt.title('Продажи по категориям товаров (Matplotlib)', fontsize=14, fontweight='bold', pad=20)
plt.xlabel('Категории товаров', fontsize=12)
plt.ylabel('Объем продаж (руб)', fontsize=12)
plt.xticks(rotation=45)
plt.grid(axis='y', alpha=0.3) #отражает только горизонтальную сетку
plt.tight_layout()
plt.show()

#### Seaborn

In [None]:
plt.figure(figsize=(10, 6))

ax = sns.barplot(data=df, x='Категория', y='Продажи',
                 palette='viridis', saturation=0.8) #saturation - насыщенность

plt.title('Продажи по категориям товаров (Seaborn)', fontsize=14, fontweight='bold', pad=10) #pad устанавлиает отступ заголовка
plt.xlabel('Категории товаров', fontsize=12) #fontsize - размер шрифта 
plt.ylabel('Объем продаж (руб)', fontsize=12)
plt.xticks(rotation=45) #угол поворота подписей
plt.tight_layout()
plt.show()

#### Plotly

In [None]:
# строим столбчатую диаграмму
fig = px.bar(df, 
             x='Категория',          # Категории по оси X
             y='Продажи',            # Значения по оси Y
             title='Продажи по категориям товаров',  # Заголовок
             labels={'Продажи': 'Объем продаж (руб)', 'Категория': 'Категория товара'},  # Подписи осей
             color='Категория',      # Разные цвета для каждой категории
             text='Продажи')         # Отображать значения на столбцах

# форматируем текст на столбцах (textposition отвечает, будут ли надписи внутри столбцов или нет)
fig.update_traces(texttemplate='%{text:.0f}', textposition='outside')

# настраиваем положение
fig.update_layout(
    xaxis_title='Категории товаров',
    yaxis_title='Объем продаж (руб)',
    showlegend=False,  # скрываем легенду, так как категории и так подписаны
    template='plotly_white' #тема
)

fig.show()

### Построение диаграммы размаха ("ящик с усами")

#### Matplotlib

In [None]:
# создадим данные
np.random.seed(42)
data_groups = [np.random.normal(i, 1, 100) for i in range(4)]

In [None]:
data_1group = data_groups[1]

In [None]:
#несколько ящиков
plt.figure(figsize=(10, 6))
box = plt.boxplot(data_groups, 
                  tick_labels=['Группа A', 'Группа B', 'Группа C', 'Группа D'], # группы
                  patch_artist=True,      # Заливка цветом
                  showmeans=True,         # Показывать среднее
                  meanline=True,         # Линия для среднего
                  showfliers=True,       # Выбросы
                  notch=True)           # Насечки д


plt.setp(box['whiskers'], color='black', linewidth=1.5) #настройка усов
plt.setp(box['medians'], color='red', linewidth=2) #отражение медиан
plt.setp(box['means'], color='blue', linewidth=2) #отражение средних

plt.grid(True, alpha=0.3)
plt.show()

In [None]:
#один ящик
plt.figure(figsize=(10, 6))
box = plt.boxplot(data_1group, 
                  tick_labels=['Группа A'],
                  patch_artist=True,      # Заливка цветом
                  showmeans=True,         # Показывать среднее
                  meanline=True,         # Линия для среднего
                  showfliers=True,       # Выбросы
                  notch=False)           # Насечки для доверительного интервала

plt.grid(True, alpha=0.3)
plt.xlabel('Категория', fontsize=12) #наименования осей
plt.ylabel('Показатель', fontsize=12)

#### Seaborn

In [None]:
# данные
df_box = pd.DataFrame({
    'value': np.concatenate(data_groups),
    'group': ['Группа A']*100 + ['Группа B']*100 + ['Группа C']*100 + ['Группа D']*100
})

In [None]:
df_boxA = df_box[df_box['group'] == 'Группа A']
df_boxA

In [None]:
plt.figure(figsize=(10, 6))
sns.boxplot(data=df_box, x='group', y='value',
            palette='Set3',           # Цветовая палитра
            showfliers=True,         # Показывать выбросы
            width=0.6,               # Ширина ящиков
            linewidth=1.5,           # Толщина линий
            fliersize=4,             # Размер выбросов
            hue='group')            


plt.title('Boxplot по группам', fontsize=14)
plt.xlabel('Группы')
plt.ylabel('Значения')
plt.legend().set_visible(False)  #можно убрать легенду если она не нужна вам
plt.grid(True, alpha=0.3)
plt.show()

In [None]:
plt.figure(figsize=(10, 6))
sns.boxplot(data=df_boxA, y='value',  x = 'group',
            palette='Set3',           # Цветовая палитра
            showfliers=True,         # Показывать выбросы
            width=0.6,               # Ширина ящиков
            linewidth=1.5,           # Толщина линий
            fliersize=4,             # Размер выбросов
            hue='group')            


plt.title('Boxplot по группе А, fontsize=14')
plt.xlabel('Группы')
plt.ylabel('Значения')
plt.grid(True, alpha=0.3)
plt.show()

#### Plotly

In [None]:
fig = px.box(df_box, x='group', y='value',
             color='group',
             title='Интерактивная диаграмма размаха',
             points='outliers',  # отражать ли точки и какие: False, 'outliers', 'suspectedoutliers', 'all'
             notched=False) # С насечками или без

fig.update_layout(
    width=800,
    height=500,
    showlegend=False,
    xaxis_title='Группы',
    yaxis_title='Значения'
)

fig.update_traces(marker=dict(size=4, opacity=0.6))

fig.show()

In [None]:
fig = px.box(df_boxA, x='group', y='value',
             color='group',
             title='Интерактивная диаграмма размаха',
             points='all',  # отражать ли точки и какие: False, 'outliers', 'suspectedoutliers', 'all'
             notched=False) # С насечками или без

fig.update_layout(
    width=800,
    height=500,
    showlegend=False,
    xaxis_title='Группа',
    yaxis_title='Значения'
)

fig.update_traces(marker=dict(size=4, opacity=0.6))

fig.show()

### Построение круговой диаграммы

#### Matplotlib

In [None]:
# данные
categories = ['Технологии', 'Здравоохранение', 'Финансы', 'Энергетика', 'Транспорт']
values = [25, 30, 20, 15, 10]
colors = ['#ff9999', '#66b3ff', '#99ff99', '#ffcc99', '#ff99cc']
explode = (0.05, 0, 0, 0, 0)  # параметры выделения первого сегмента


In [None]:
plt.figure(figsize=(10, 8))
plt.pie(values, 
            labels=categories,
            colors=colors,
            explode=explode,
            autopct='%1.1f%%',    # Формат процентов
            startangle=90,        # Начальный угол
            shadow=True,          # Тень
            textprops={'fontsize': 10})

plt.title('Распределение по секторам', fontsize=14)

In [None]:
# кольцевая диаграмма
plt.pie(values, 
        labels=categories,
        colors=colors,
        startangle=90,
        wedgeprops=dict(width=0.3),  # Ширина кольца
        autopct='%1.1f%%')

plt.title('Кольцевая диаграмма', fontsize=14)

plt.tight_layout()
plt.show()

#### Plotly

In [None]:
fig = px.pie(names=categories, 
             values=values,
             title='Интерактивная круговая диаграмма',
             color_discrete_sequence=px.colors.qualitative.Set3,
             hole=0.3)  # Для кольцевой диаграммы: 0 - круг, 0.4 - кольцо

fig.update_traces(textposition='inside', 
                  textinfo='percent+label',
                  pull=[0.1, 0, 0, 0, 0])  # Выделение сегментов

fig.update_layout(
    width=600,
    height=500,
    showlegend=True, #можно указать False. если легенда не нужна.
    annotations=[dict(text='Сектора', x=0.5, y=0.5, font_size=16, showarrow=False)]
)

fig.show()