# Визуализация данных для аналитика

## 1. Роль визуализации в аналитике
Визуализация данных — это ключевой инструмент аналитика, позволяющий:
- Быстро выявлять закономерности, тренды и аномалии.
- Понятно представлять результаты анализа для бизнеса.
- Упрощать принятие решений на основе данных.
- Проверять гипотезы в процессе исследования.

Хорошая визуализация:
- Информативна.
- Минималистична и без лишнего шума.
- Подбирается под задачу и тип данных.

## 2. Основы популярных библиотек

### 2.1 Matplotlib
- Основа экосистемы Python для визуализации.
- Поддержка статических, анимационных и интерактивных графиков.
- Гибкая настройка внешнего вида.

**Пример:**

In [None]:
import matplotlib.pyplot as plt
import numpy as np

x = np.linspace(0, 10, 100)
y = np.sin(x)

plt.plot(x, y, label='sin(x)')
plt.title('Пример Matplotlib')
plt.xlabel('X')
plt.ylabel('Y')
plt.legend()
plt.show()

### 2.2 Seaborn
- Построен на Matplotlib, но с более высоким уровнем абстракции.
- Красивые графики по умолчанию.
- Отлично подходит для статистической визуализации.

**Пример:**

In [None]:
import seaborn as sns

tips = sns.load_dataset('tips')
sns.scatterplot(data=tips, x='total_bill', y='tip', hue='day')

### 2.3 Plotly
- Фокус на интерактивных графиках.
- Легко интегрируется в веб-приложения.
- Поддерживает 2D и 3D визуализацию.

**Пример:**

In [None]:
import plotly.express as px

fig = px.scatter(tips, x='total_bill', y='tip', color='day', size='size')
fig.show()

## 3. Сравнение возможностей библиотек

| Характеристика | Matplotlib | Seaborn | Plotly |
|----------------|------------|---------|--------|
| Статические графики | ✅ | ✅ | ❌ |
| Интерактивность | ⚠️ через mpld3 | ❌ | ✅ |
| Простота синтаксиса | ❌ | ✅ | ✅ |
| Настраиваемость | ✅ | ⚠️ | ✅ |
| Поддержка 3D | ✅ | ❌ | ✅ |

## 4. Статические и интерактивные графики

- **Статические:** лучше для печати, отчётов (Matplotlib, Seaborn).
- **Интерактивные:** удобны для исследовательского анализа и дашбордов (Plotly, Bokeh, hvPlot).

## 5. Как выбирать тип графика

| Задача | Тип графика |
|--------|------------|
| Сравнение категорий | barplot, column chart |
| Распределение | histogram, kdeplot |
| Взаимосвязь переменных | scatterplot |
| Динамика во времени | lineplot |
| Геоданные | choropleth, scatter_geo |

## 6. Новые библиотеки и тренды

### Altair
```python
import altair as alt
from vega_datasets import data

cars = data.cars()
alt.Chart(cars).mark_point().encode(
    x='Horsepower',
    y='Miles_per_Gallon',
    color='Origin'
)
```

### hvPlot
```python
import hvplot.pandas
import pandas as pd

df = pd.DataFrame({'x': range(10), 'y': [v**2 for v in range(10)]})
df.hvplot.line(x='x', y='y')
```

### Bokeh
```python
from bokeh.plotting import figure, show

p = figure(title="Пример Bokeh", x_axis_label='x', y_axis_label='y')
p.line([1, 2, 3], [4, 5, 6], line_width=2)
show(p)
```

### PyEcharts
```python
from pyecharts.charts import Bar
from pyecharts import options as opts

bar = Bar()
bar.add_xaxis(["A", "B", "C"])
bar.add_yaxis("Series", [5, 20, 36])
bar.set_global_opts(title_opts=opts.TitleOpts(title="Bar Chart"))
bar.render_notebook()
```

### Plotnine
```python
from plotnine import ggplot, aes, geom_point
import pandas as pd

df = pd.DataFrame({'x': [1, 2, 3], 'y': [4, 5, 6]})
ggplot(df, aes(x='x', y='y')) + geom_point()
```

## 7. Практические задания
1. Построить линейный график изменения температуры за неделю (Matplotlib).
2. Визуализировать распределение чаевых по дням недели (Seaborn).
3. Построить интерактивный scatter plot зависимости расходов и доходов (Plotly).
4. Использовать Altair для построения диаграммы рассеяния с цветовой группировкой.
5. Сравнить скорость построения графиков для большого датасета в hvPlot и Matplotlib.