# Коэффициенты пролонгации 2023 — Overview (Ноутбук 00)
**Цель:** кратко зафиксировать, что считали и где открыт итог.

**Суть расчётов:** считаем два коэффициента пролонгации (за 1-й и 2-й месяц)
по AM и по отделам: помесячно за 2023 и «итого за год».
Формула: **коэффициент = сумма числителей / сумма знаменателей** (по выбранному срезу и периоду).

**Входы (главное):**
- ТЗ: `ТЗ Data Analyst.docx`
- Итог: `report/report.xlsx` (лист `Dashboard` + таблицы `coef1_*`, `coef2_*`)
- Промежуточные: `sql_results/*.csv` (результаты агрегаций), `out/*.csv` (очистка)

**Как открыть результат:** файл `report/report.xlsx` в папке `report/`.

**Как воспроизвести кратко:**
1) Подготовка данных → `out/*.csv` (см. ноутбук 01).
2) Агрегации коэффициентов → `sql_results/*.csv` (SQL из `sql_requests/` либо ноутбук 02).
3) Сборка Excel-отчёта `report.xlsx` (ноутбук 02).

**Где что лежит:**
`/data` — сырые данные · `/out` — очищенные · `/sql_requests` — запросы · `/sql_results` — результаты · `/report` — итоговый Excel · `/src/utils` — утилиты.

> Детали и Worklog — в ноутбуках 01 и 02.


# Список файлов проекта (кратко)

**Корень**
- `README.md` — краткое описание и как запускать.
- `requirements.txt` — зависимости Python.
- `.gitignore` — что не попадает в Git.

**/data** — сырые источники
- `financial_data.csv` — помесячные суммы оплат по проектам (wide).
- `prolongations.csv` — данные по пролонгациям/последнему месяцу и AM.

**/out** — результаты подготовки
- `financial_clean.csv` — очищенные финданные (числа нормализованы).
- `prolongations_clean.csv` — очищенные пролонгации (`month_canon` = YYYY-MM).
- `shipments.csv` — факт оплат в long-виде: `id × month × shipment`.
- `projects_dim.csv` — размерность проекта: `id × month_last × AM × (Account)`.

**/sql_requests** — SQL-скрипты
- `create_db.sql` — создание БД и таблиц (`shipments`, `projects_dim`).
- `load_shipments.sql` — загрузка `/out/shipments.csv` в таблицу `shipments`.
- `load_project_dim.sql` — загрузка `/out/projects_dim.csv` в `projects_dim`.
- `coef1_by_am_month_2023.sql` — coef1 по AM × месяцам 2023.
- `coef1_by_am_year_2023.sql` — coef1 годовой по AM/отделу.
- `coef1_dept_month_2023.sql` — coef1 по отделам × месяцам 2023.
- `coef1_dept_year_2023.sql` — coef1 годовой по отделам.
- `coef2_by_am_month_2023.sql` — coef2 по AM × месяцам 2023.
- `coef2_by_am_year_2023.sql` — coef2 годовой по AM/отделу.
- `coef2_dept_month_2023.sql` — coef2 по отделам × месяцам 2023.
- `coef2_dept_year_2023.sql` — coef2 годовой по отделам.

**/sql_results** — выгрузки результатов (CSV)
- `coef1_by_am_month_2023.csv`, `coef1_by_am_year_2023.csv`,
  `coef1_dept_month_2023.csv`, `coef1_dept_year_2023.csv` — итоги для coef1.
- `coef2_by_am_month_2023.csv`, `coef2_by_am_year_2023.csv`,
  `coef2_dept_month_2023.csv`, `coef2_dept_year_2023.csv` — итоги для coef2.

**/report**
- `report.xlsx` — итоговый отчёт: Dashboard + таблицы `coef1_*` и `coef2_*`.

**/src/utils** — утилиты подготовки
- `run_inspection.py` — быстрый осмотр сырья (кодировка/форма/первые строки).
- `files_to_check.py` — список проверяемых файлов и параметры чтения.
- `inspector.py` — функции чтения и кратких сводок.
- `clean_data.py` — очистка исходных CSV → сохранение в `/out/*_clean.csv`.
- `prepare_for_sql.py` — wide→long, канонизация месяца → `/out/shipments.csv`, `/out/projects_dim.csv`.

**/notebooks** — ноутбуки
- `00_project_overview.ipynb` — что считаем, где результаты, как воспроизвести.
- `01_data_prep.ipynb` — объяснение Python-скриптов подготовки.
- `02_metrics_and_checks.ipynb` — логика расчётов coef1/coef2 и мини-QA.
