Skip to content

NikolValerie/data_preprocessing_project

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

18 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

logo.jpeg

Введение

В нашем проекте содержится датасет с информацией о квартирах в Москве, полученной с площадки "Циан". Он включает разнообразные данные о квартирах, которые будут использованы для обучения моделей машинного обучения.

Структура проекта

Данные представлены в виде таблицы, где каждая строка соответствует одному объявлению о квартире на площадке. Всего в датасете содержится 19737 строк и 21 столбец.

Работа над проектом

На данном этапе мы проводим подготовку данных для разработчиков моделей машинного обучения. Они будут использовать эти данные для обучения моделей, которые будут предсказывать стоимость аренды квартир в Москве.

#Ход нашей работы 1. Анализ имеющихся данных. Начальный анализ позволил нам определить нужные и лишние признаки, а также провести предварительный анализ с помощью графиков, что отражено в файле EDA.html.

2. Препроцессинг данных. Мы провели очистку данных, заполнили пропущенные значения и создали новые признаки для лучшего обучения моделей. Также мы заменили категориальные признаки числовыми для дальнейшего обучения.

3. Финальный коммит. На этом этапе мы удалили все дубликаты и оставили только числовые признаки типа int и float, готовые для дальнейшей работы с моделями.

Данные готовы для обучения моделей

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages

  • HTML 57.0%
  • Jupyter Notebook 43.0%