# Домашнее задание №7: Визуализация данных

**Цель:** выполнить анализ и визуализацию данных с помощью pandas, numpy, matplotlib и seaborn.

## Часть 1: Загрузка и очистка данных

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Загрузка данных
url = 'https://raw.githubusercontent.com/OtusTeam/ML-Basic-2024-11/main/homework_07/births.csv'
births = pd.read_csv(url)
births.head()

In [None]:
# Приведение к датам и очистка данных
births['date'] = pd.to_datetime(births[['year', 'month', 'day']])
births = births.dropna()
births = births[births['births'] > 0]
births.info()

## Часть 2: Исследование данных и базовая визуализация

In [None]:
# Распределение количества рождений
plt.figure(figsize=(10, 6))
sns.histplot(births['births'], bins=50, kde=True)
plt.title('Распределение количества рождений')
plt.xlabel('Количество рождений')
plt.ylabel('Частота')
plt.show()

In [None]:
# Среднее число рождений по дням недели
births['weekday'] = births['date'].dt.dayofweek
weekday_births = births.groupby('weekday')['births'].mean()

plt.figure(figsize=(8, 5))
weekday_births.plot(kind='bar')
plt.title('Среднее число рождений по дням недели')
plt.xlabel('День недели (0=Пн)')
plt.ylabel('Среднее число рождений')
plt.show()

## Часть 3: Продвинутая визуализация и выводы

In [None]:
# Тепловая карта рождений по дням и месяцам
births['day'] = births['date'].dt.day
births['month'] = births['date'].dt.month
pivot_table = births.pivot_table(index='day', columns='month', values='births', aggfunc='mean')

plt.figure(figsize=(12, 8))
sns.heatmap(pivot_table, cmap='coolwarm', annot=False)
plt.title('Среднее количество рождений по дням и месяцам')
plt.xlabel('Месяц')
plt.ylabel('День')
plt.show()

### 📌 Выводы
- Распределение рождений приближено к нормальному.
- Наименьшее количество рождений в выходные дни (особенно воскресенье).
- Летом и осенью рождений больше, чем в другие месяцы.
- Тепловая карта выявляет пики в конце лета и начале осени.