# Дипломный проект: Модель прогнозирования стоимости жилья для агентства недвижимости

## Описание проекта

В рамках данного дипломного проекта была разработана модель прогнозирования стоимости жилья для агентства недвижимости. Цель проекта - обойти конкурентов по скорости и качеству совершения сделок. Для достижения этой цели были выполнены следующие задачи:

1. **Очистка данных**: Проведен разведывательный анализ и очистка исходных данных. Были обнаружены дублирующиеся категории, ошибки ввода, жаргонные сокращения и другие неточности. Произведена обработка пропусков и удаление выбросов. Очистка данных является важным этапом, который напрямую влияет на результаты моделирования.

2. **Выделение значимых факторов**: Были выделены наиболее значимые факторы, влияющие на стоимость недвижимости. Это позволило сузить фокус модели и улучшить ее точность.

3. **Построение модели**: Подобрана модель для прогнозирования стоимости недвижимости. Итоговая модель использует алгоритм градиентного бустинга.

4. **Разработка веб-сервиса**: Разработан небольшой веб-сервис, который принимает данные о недвижимости, выставленной на продажу, и прогнозирует ее стоимость. Веб-сервис позволяет агентству недвижимости быстро и удобно получать прогнозы стоимости для своих клиентов.

## Структура проекта

Проект состоит из следующих файлов:

- `1_data_cleaning.ipynb`: Jupyter Notebook файл, содержащий код для разведывательного анализа и очистки исходных данных.
- `2_eda, preprocessing.ipynb`: Jupyter Notebook файл, содержащий код для подготовки данных к обучению модели.
- `3_ml.ipynb`: Jupyter Notebook файл, содержащий код для обучения модели прогнозирования стоимости недвижимости.
- `4_flask.py`: Python-скрипт, содержащий код для разработки веб-сервиса на Flask, который принимает данные о недвижимости и возвращает прогнозируемую стоимость.
- `data/data.csv`: Исходный датасет в формате CSV, содержащий данные о недвижимости.

## Установка и использование
В среде командной строки необходимо выполнить следующие действия.
1. Склонируйте репозиторий на свой локальный компьютер:

   git clone https://github.com/your-username/your-repo.git

2. Установите необходимые зависимости, выполнив команду:

   pip install -r requirements.txt

3. Запустите Jupyter Notebook файлы `1_data_cleaning.ipynb`, `2_eda, preprocessing.ipynb` и `3_ml.ipynb` для выполнения соответствующих этапов проекта.

4. Для запуска веб-сервиса, выполните следующую команду:

   python deploy.py

5. Откройте веб-браузер и перейдите по адресу `http://localhost:5000` для использования веб-сервиса и получения прогнозов стоимости недвижимости.

## Датасет

Исходный датасет `data.csv` содержит данные о недвижимости, необходимые для обучения модели и прогнозирования стоимости. Датасет доступен для скачивания на [Google Диске](https://drive.google.com/file/d/1g3Ue2BN89ZCgRua8lB05cOgrFmqtCJeT/view?usp=drive_link).
