# Python: Аналитика и визуализация

**Pandas + Matplotlib + Seaborn** — стандарт для аналитиков.

## Содержание
1. Загрузка и осмотр данных  
2. Очистка и трансформация  
3. Группировка и агрегация  
4. Визуализация (профессиональный уровень)  
5. Полезные функции  

---

## 1. Загрузка и осмотр данных

```python
import pandas as pd

# Загрузка
df = pd.read_csv('sales.csv')

# Осмотр
df.head()
df.info()
df.describe()
df.isna().sum()
```

> **Зачем:** Понимаем структуру, типы, пропуски.

## 2. Очистка и трансформация

```python
# Пропуски
df.fillna(0)
df.dropna(subset=['amount'])

# Типы
df['date'] = pd.to_datetime(df['date'])
df['amount'] = pd.to_numeric(df['amount'], errors='coerce')

# Категоризация
bins = [0, 1000, 10000, float('inf')]
labels = ['low', 'medium', 'high']
df['tier'] = pd.cut(df['amount'], bins=bins, labels=labels)
```

> **Зачем:** Чистые данные — точные выводы.

## 3. Группировка и агрегация

```python
# Группировка
df.groupby('region').agg({
    'amount': ['sum', 'mean', 'count']
})

# Pivot
df.pivot_table(
    values='amount', 
    index='region', 
    columns='month', 
    aggfunc='sum'
)

# Топ
df.nlargest(5, 'amount')
```

> **Зачем:** Метрики по группам, YoY, план-факт.

## 4. Визуализация (80 lvl)

```python
import seaborn as sns
import matplotlib.pyplot as plt

# Стиль
sns.set_style('whitegrid')
plt.rcParams['font.size'] = 12
plt.rcParams['figure.figsize'] = (12, 6)

# Топ-5 товаров
top5 = df.groupby('product')['amount'].sum().nlargest(5)

fig, ax = plt.subplots()
bars = ax.barh(top5.index, top5.values, color='#1f77b4', edgecolor='navy', height=0.7)

# Подписи
for i, bar in enumerate(bars):
    width = bar.get_width()
    ax.text(width * 1.02, bar.get_y() + bar.get_height()/2,
            f'{int(width):,}', va='center', fontweight='bold')

# Оформление
ax.set_title('Топ-5 товаров по выручке', fontsize=14, fontweight='bold', pad=20)
ax.set_xlabel('Выручка, ₽')
ax.invert_yaxis()
ax.grid(axis='x', alpha=0.3)
plt.tight_layout()

# Сохранение
plt.savefig('top5_sales.png', dpi=300, bbox_inches='tight', facecolor='white')
plt.show()
```

> **Зачем:** Читаемые дашборды для бизнеса. Подписи, стиль, экспорт.

## 5. Полезные функции

```python
# Применение
df['profit'] = df['revenue'] - df['cost']
df['margin'] = df.apply(lambda x: x['profit'] / x['revenue'] if x['revenue'] else 0, axis=1)

# Объединение
df_merged = pd.merge(df1, df2, on='id', how='left')
```

> **Зачем:** Гибкость, автоматизация, как SQL JOIN.

---
**Источники:** Pandas docs, Seaborn gallery.  
*Добавляйте свои графики через PR.*