# 🧪 CSV Analyzer Automation 

Проект предназначен для автоматизации анализа данных в формате CSV.  
Он выполняет:

- базовый статистический анализ
- поиск пропущенных значений
- формирование отчета в формате HTML


## 📒 Структура проекта

1. 📥 Загрузка данных

2. 📊 Обзор данных

3. 📈 Основной статистический анализ

4. ❓ Поиск пропущенных значений

5. 📄 Формирование отчета с DTale

## Шаг 2: Импорт библиотек

In [1]:
import pandas as pd
import dtale
from IPython.display import display, HTML

## Шаг 3: Загрузка и просмотр данных

In [2]:
data = {
    "Название": ["Товар 1", "Товар 2", "Товар 3"],
    "Цена": [100, 150, 200],
    "Категория": ["Электроника", "Бытовая техника", "Одежда"]
}

df = pd.DataFrame(data)

# Сохраняем CSV с кодировкой UTF-8
df.to_csv('example_data_utf8.csv', encoding='utf-8', index=False)

# Первые строки таблицы
display(df.head())

Unnamed: 0,Название,Цена,Категория
0,Товар 1,100,Электроника
1,Товар 2,150,Бытовая техника
2,Товар 3,200,Одежда


## Шаг 4: Статистический анализ

In [3]:
# Основные статистики по числовым и категориальным признакам
summary = df.describe(include='all').T
display(summary)

Unnamed: 0,count,unique,top,freq,mean,std,min,25%,50%,75%,max
Название,3.0,3.0,Товар 1,1.0,,,,,,,
Цена,3.0,,,,150.0,50.0,100.0,125.0,150.0,175.0,200.0
Категория,3.0,3.0,Электроника,1.0,,,,,,,


## Шаг 5: Поиск пропусков

In [4]:
# Количество пропусков в каждом столбце
missing = df.isnull().sum()
summary["Missing Values"] = missing
display(summary)

Unnamed: 0,count,unique,top,freq,mean,std,min,25%,50%,75%,max,Missing Values
Название,3.0,3.0,Товар 1,1.0,,,,,,,,0
Цена,3.0,,,,150.0,50.0,100.0,125.0,150.0,175.0,200.0,0
Категория,3.0,3.0,Электроника,1.0,,,,,,,,0


## Шаг 6: Визуализация и анализ с помощью Dtale

In [5]:
d = dtale.show(df)

In [6]:
d.open_browser()

## Шаг 7: Формирование HTML-отчета c Dtale

In [7]:
with open("report.html", "w", encoding="utf-8") as f:
    f.write("<h2>CSV Report with DTale</h2>")
    f.write(summary.to_html(escape=False))

In [8]:
HTML("report.html")

Unnamed: 0,count,unique,top,freq,mean,std,min,25%,50%,75%,max,Missing Values
Название,3.0,3.0,Товар 1,1.0,,,,,,,,0
Цена,3.0,,,,150.0,50.0,100.0,125.0,150.0,175.0,200.0,0
Категория,3.0,3.0,Электроника,1.0,,,,,,,,0


## Шаг 8: Итог

✅ Отчет сформирован и сохранен в `report.html`  
Можно открыть файл в браузере для просмотра результатов анализа