## 1. Основные библиотеки визуализации
### Matplotlib (plt)
Синтаксис:

In [1]:
import matplotlib.pyplot as plt

#### Основные функции:
- plt.plot() – линейный график.
- plt.scatter() – точечный график.
- plt.bar() – столбчатая диаграмма.
- plt.hist() – гистограмма.
- plt.pie() – круговая диаграмма.
- plt.title(), plt.xlabel(), plt.ylabel() – настройки подписей.

### Seaborn (sns)
Синтаксис:

In [2]:
import seaborn as sns

#### Основные функции:
- sns.lineplot() – линейный график с автоматическим доверительным интервалом.
- sns.barplot() – столбчатая диаграмма с агрегацией.
- sns.histplot() – улучшенная гистограмма с поддержкой KDE.
- sns.boxplot() – ящик с усами (boxplot).
- sns.scatterplot() – точечный график с группировкой по цвету/размеру.

### Pandas (df.plot)
Синтаксис:

In [3]:
import pandas as pd

In [None]:
df.plot.<тип_графика>()

#### Основные функции:
- df.plot.line() – линейный график.
- df.plot.bar() – столбчатая диаграмма.
- df.plot.hist() – гистограмма.
- df.plot.scatter() – точечный график.
- df.plot.box() – boxplot.

## 2. Основные типы визуализаций и их применение
### 1. Гистограмма (plt.hist(), sns.histplot(), df.plot.hist())
Для чего: Показывает распределение числовой переменной.

Пример:

In [None]:
# Matplotlib
plt.hist(df['column'], bins=10, color='blue', alpha=0.7)
plt.title('Распределение данных')
plt.xlabel('Значения')
plt.ylabel('Частота')
plt.show()

# Seaborn
sns.histplot(df['column'], kde=True, bins=10)
plt.title('Распределение с KDE')
plt.show()

# Pandas
df['column'].plot.hist(bins=10, alpha=0.7)
plt.show()

### Разница между функциями:

- plt.hist() – базовая гистограмма Matplotlib.
- sns.histplot() – поддерживает KDE (оценку плотности), лучше подходит для анализа.
- df.plot.hist() – удобная обёртка Pandas для быстрой визуализации.

## 2. Столбчатая диаграмма (plt.bar(), sns.barplot(), df.plot.bar())
Для чего: Сравнение категориальных данных.

Пример:

In [None]:
# Matplotlib
plt.bar(df['category'], df['value'])
plt.title('Сравнение категорий')
plt.show()

# Seaborn (автоматически считает среднее)
sns.barplot(x='category', y='value', data=df)
plt.show()

# Pandas
df.groupby('category')['value'].mean().plot.bar()
plt.show()

## 3. Линейный график (plt.plot(), sns.lineplot(), df.plot.line())
Для чего: Тренды и изменения во времени.

Пример:

In [None]:
# Matplotlib
plt.plot(df['date'], df['price'])
plt.title('Динамика цены')
plt.show()

# Seaborn (поддержка нескольких линий)
sns.lineplot(x='date', y='price', hue='category', data=df)
plt.show()

# Pandas
df.set_index('date')['price'].plot.line()
plt.show()

## 4. Boxplot (plt.boxplot(), sns.boxplot(), df.plot.box())
Для чего: Анализ распределения и выбросов.

Пример:

In [None]:
# Matplotlib
plt.boxplot(df['column'])
plt.show()

# Seaborn (группировка по категориям)
sns.boxplot(x='category', y='value', data=df)
plt.show()

# Pandas
df.plot.box()
plt.show()

## 3. Почему несколько функций для одного графика?
- Matplotlib (plt): Базовая библиотека, гибкость, но требует больше кода.

- Seaborn (sns): Упрощённый синтаксис, встроенная статистика (KDE, доверительные интервалы).

- Pandas (df.plot): Быстрая визуализация прямо из DataFrame, но меньше настроек.

---
# 1. Гистограмма (Histogram)
Показывает распределение числовой переменной.

## Matplotlib (plt.hist())

In [None]:
import matplotlib.pyplot as plt

# Данные (df уже загружен)
data = df['column_name']

# Создание гистограммы
plt.hist(
    data,                # Данные
    bins=20,            # Количество столбцов (можно изменить)
    color='skyblue',    # Цвет столбцов ('blue', 'green', 'red', etc.)
    edgecolor='black',  # Цвет границ столбцов
    alpha=0.7,          # Прозрачность (0-1)
)

# Настройки графика
plt.title('Гистограмма распределения', fontsize=14)  # Заголовок
plt.xlabel('Значения', fontsize=12)                 # Подпись оси X
plt.ylabel('Частота', fontsize=12)                  # Подпись оси Y
plt.grid(True, linestyle='--', alpha=0.5)           # Сетка (можно убрать)

# Сохранение (раскомментировать если нужно)
# plt.savefig('histogram.png', dpi=300, bbox_inches='tight')

plt.show()  # Показать график

## Seaborn (sns.histplot())

In [None]:
import seaborn as sns

# Создание гистограммы с KDE (Kernel Density Estimation)
sns.histplot(
    data=df,
    x='column_name',     # Столбец для анализа
    bins=20,            # Количество столбцов
    kde=True,           # Включить/выключить KDE (False если не нужно)
    color='purple',     # Цвет ('blue', 'green', 'red', etc.)
    edgecolor='black',  # Границы столбцов
    alpha=0.6,          # Прозрачность
    line_kws={'lw': 2}, # Настройки линии KDE (толщина и цвет)
)

# Настройки графика
plt.title('Гистограмма с KDE', fontsize=14)
plt.xlabel('Значения', fontsize=12)
plt.ylabel('Плотность', fontsize=12)
plt.grid(True, linestyle=':', alpha=0.3)

# Сохранение
# plt.savefig('histplot_seaborn.png', dpi=300, bbox_inches='tight')

plt.show()

## Pandas (df.plot.hist())

In [None]:
# Гистограмма через Pandas
df['column_name'].plot.hist(
    bins=15,                # Количество столбцов
    color='orange',        # Цвет
    edgecolor='black',     # Границы
    alpha=0.7,            # Прозрачность
    figsize=(8, 5),       # Размер графика (ширина, высота)
    grid=True,            # Сетка (True/False)
)

# Настройки
plt.title('Гистограмма (Pandas)', fontsize=14)
plt.xlabel('Значения', fontsize=12)
plt.ylabel('Частота', fontsize=12)

# Сохранение
# plt.savefig('hist_pandas.png', dpi=300, bbox_inches='tight')

plt.show()

---
# 2. Столбчатая диаграмма (Bar Plot)
Используется для сравнения категориальных данных.

## Matplotlib (plt.bar())

In [None]:
# Пример данных (можно заменить на свои)
categories = ['A', 'B', 'C', 'D']
values = [25, 40, 30, 50]

plt.bar(
    categories,         # Категории (ось X)
    values,             # Значения (ось Y)
    color='teal',       # Цвет столбцов
    edgecolor='black',  # Границы
    width=0.6,         # Ширина столбцов (0-1)
    alpha=0.8,         # Прозрачность
)

# Настройки
plt.title('Столбчатая диаграмма (Matplotlib)', fontsize=14)
plt.xlabel('Категории', fontsize=12)
plt.ylabel('Значения', fontsize=12)
plt.xticks(rotation=45)  # Поворот подписей категорий

# Сохранение
# plt.savefig('bar_matplotlib.png', dpi=300, bbox_inches='tight')

plt.show()

## Seaborn (sns.barplot())

In [None]:
# Пример данных (можно заменить на df)
import pandas as pd
data = pd.DataFrame({
    'category': ['A', 'B', 'C', 'D'],
    'value': [25, 40, 30, 50]
})

sns.barplot(
    data=data,
    x='category',      # Категории (ось X)
    y='value',         # Значения (ось Y)
    palette='viridis', # Цветовая схема ('pastel', 'coolwarm', 'Set2')
    ci=None,           # Убрать доверительные интервалы (если не нужны)
    saturation=0.8,    # Насыщенность цвета (0-1)
)

# Настройки
plt.title('Столбчатая диаграмма (Seaborn)', fontsize=14)
plt.xlabel('Категории', fontsize=12)
plt.ylabel('Значения', fontsize=12)
plt.xticks(rotation=45)

# Сохранение
# plt.savefig('bar_seaborn.png', dpi=300, bbox_inches='tight')

plt.show()

## Pandas (df.plot.bar())

In [None]:
# Данные (можно заменить на df)
data = pd.DataFrame({
    'category': ['A', 'B', 'C', 'D'],
    'value': [25, 40, 30, 50]
})

# Столбчатая диаграмма
data.set_index('category').plot.bar(
    color='salmon',      # Цвет
    edgecolor='black',   # Границы
    alpha=0.8,          # Прозрачность
    figsize=(8, 5),     # Размер графика
    rot=45,             # Поворот подписей
    legend=False,       # Убрать легенду (если не нужна)
)

# Настройки
plt.title('Столбчатая диаграмма (Pandas)', fontsize=14)
plt.xlabel('Категории', fontsize=12)
plt.ylabel('Значения', fontsize=12)

# Сохранение
# plt.savefig('bar_pandas.png', dpi=300, bbox_inches='tight')

plt.show()

---
# 3. Линейный график (Line Plot)
Используется для отображения трендов.

## Matplotlib (plt.plot())

In [None]:
# Пример данных (можно заменить на df)
x = [1, 2, 3, 4, 5]
y = [10, 15, 13, 18, 20]

plt.plot(
    x, y,                # Данные (X и Y)
    color='red',         # Цвет линии
    linestyle='-',       # Стиль линии ('--', ':', '-.')
    linewidth=2,         # Толщина линии
    marker='o',          # Маркеры точек ('s', '^', 'D')
    markersize=8,        # Размер маркеров
    label='Тренд',       # Легенда
)

# Настройки
plt.title('Линейный график (Matplotlib)', fontsize=14)
plt.xlabel('Время', fontsize=12)
plt.ylabel('Значение', fontsize=12)
plt.grid(True, alpha=0.3)
plt.legend()  # Показать легенду

# Сохранение
# plt.savefig('line_matplotlib.png', dpi=300, bbox_inches='tight')

plt.show()

## Seaborn (sns.lineplot())

In [None]:
# Пример данных (можно заменить на df)
data = pd.DataFrame({
    'time': [1, 2, 3, 4, 5],
    'value': [10, 15, 13, 18, 20]
})

sns.lineplot(
    data=data,
    x='time',           # Ось X
    y='value',          # Ось Y
    color='green',      # Цвет
    linewidth=2,        # Толщина линии
    marker='o',         # Маркеры
    markersize=8,       # Размер маркеров
    label='Тренд',      # Легенда
)

# Настройки
plt.title('Линейный график (Seaborn)', fontsize=14)
plt.xlabel('Время', fontsize=12)
plt.ylabel('Значение', fontsize=12)
plt.grid(True, alpha=0.3)
plt.legend()

# Сохранение
# plt.savefig('line_seaborn.png', dpi=300, bbox_inches='tight')
plt.show()

## Pandas (df.plot.line())

In [None]:
# Данные (можно заменить на df)
data = pd.DataFrame({
    'time': [1, 2, 3, 4, 5],
    'value': [10, 15, 13, 18, 20]
})

data.set_index('time').plot.line(
    color='blue',       # Цвет
    linewidth=2,        # Толщина линии
    marker='s',         # Маркеры ('o', '^', 'D')
    markersize=8,       # Размер маркеров
    figsize=(8, 5),     # Размер графика
    grid=True,          # Сетка
    legend=True,        # Легенда
)

# Настройки
plt.title('Линейный график (Pandas)', fontsize=14)
plt.xlabel('Время', fontsize=12)
plt.ylabel('Значение', fontsize=12)

# Сохранение
# plt.savefig('line_pandas.png', dpi=300, bbox_inches='tight')

plt.show()

---
# 4. Boxplot (Ящик с усами)
Используется для визуализации распределения и выбросов.

## Matplotlib (plt.boxplot())

In [None]:
# Данные (можно заменить на df)
data = [df['column1'], df['column2']]  # Список столбцов

plt.boxplot(
    data,
    patch_artist=True,   # Заливка цветом
    boxprops=dict(facecolor='lightblue'),  # Цвет ящика
    whiskerprops=dict(color='black'),      # Цвет усов
    capprops=dict(color='black'),          # Цвет ограничителей
    flierprops=dict(marker='o', markersize=8, markerfacecolor='red'),  # Выбросы
    medianprops=dict(color='black', linewidth=2),  # Медиана
)

# Настройки
plt.title('Boxplot (Matplotlib)', fontsize=14)
plt.xticks([1, 2], ['Column 1', 'Column 2'])  # Подписи категорий
plt.ylabel('Значения', fontsize=12)
plt.grid(True, alpha=0.3)

# Сохранение
# plt.savefig('boxplot_matplotlib.png', dpi=300, bbox_inches='tight')

plt.show()

## Seaborn (sns.boxplot())

In [None]:
# Данные (можно заменить на df)
data = pd.DataFrame({
    'category': ['A']*50 + ['B']*50,
    'value': list(np.random.normal(0, 1, 50)) + list(np.random.normal(1, 1.5, 50))
})

sns.boxplot(
    data=data,
    x='category',       # Категории (ось X)
    y='value',          # Значения (ось Y)
    palette='Set2',     # Цветовая схема
    width=0.5,         # Ширина ящиков
    linewidth=2,       # Толщина линий
    fliersize=6,       # Размер выбросов
)

# Настройки
plt.title('Boxplot (Seaborn)', fontsize=14)
plt.xlabel('Категории', fontsize=12)
plt.ylabel('Значения', fontsize=12)
plt.grid(True, alpha=0.3)

# Сохранение
# plt.savefig('boxplot_seaborn.png', dpi=300, bbox_inches='tight')

plt.show()

## Pandas (df.plot.box())

In [None]:
# Данные (можно заменить на df)
data = pd.DataFrame({
    'Column1': np.random.normal(0, 1, 100),
    'Column2': np.random.normal(1, 1.5, 100)
})

data.plot.box(
    patch_artist=True,   # Заливка цветом
    boxprops=dict(facecolor='lightgreen'),  # Цвет ящиков
    flierprops=dict(marker='o', markersize=8, markerfacecolor='red'),  # Выбросы
    grid=True,          # Сетка
    figsize=(8, 5),     # Размер графика
)

# Настройки
plt.title('Boxplot (Pandas)', fontsize=14)
plt.ylabel('Значения', fontsize=12)

# Сохранение
# plt.savefig('boxplot_pandas.png', dpi=300, bbox_inches='tight')

plt.show()