В нашем проекте содержится датасет с информацией о квартирах в Москве, полученной с площадки "Циан". Он включает разнообразные данные о квартирах, которые будут использованы для обучения моделей машинного обучения.
Данные представлены в виде таблицы, где каждая строка соответствует одному объявлению о квартире на площадке. Всего в датасете содержится 19737 строк и 21 столбец.
На данном этапе мы проводим подготовку данных для разработчиков моделей машинного обучения. Они будут использовать эти данные для обучения моделей, которые будут предсказывать стоимость аренды квартир в Москве.
#Ход нашей работы 1. Анализ имеющихся данных. Начальный анализ позволил нам определить нужные и лишние признаки, а также провести предварительный анализ с помощью графиков, что отражено в файле EDA.html.
2. Препроцессинг данных. Мы провели очистку данных, заполнили пропущенные значения и создали новые признаки для лучшего обучения моделей. Также мы заменили категориальные признаки числовыми для дальнейшего обучения.
3. Финальный коммит. На этом этапе мы удалили все дубликаты и оставили только числовые признаки типа int и float, готовые для дальнейшей работы с моделями.
Данные готовы для обучения моделей
