Цель проекта - проанализировать факторы, влияющие на рыночную стоимость подержанных мотоциклов, и научиться её предсказывать. Какую пользу можно вынести из этого простому человеку? Зная, как образуется стоимость мотоцикла, владелец подобного транспортного средства может подобрать подходящую для него цену для продажи. С другой стороны, будущий владелец сможет оценить адекватность заинтересовавшего его предложения.
Источником данных послужил архив объявлений на сайте moto.drom.ru
В качестве описания объявления о продаже были выбраны следующие свойства:
- Модель мотоцикла
- Пробег
- Класс
- Год выпуска
- Объем двигателя
- Число тактов
- Состояние
- Наличие документов
- Город
- Дата публикации объявления
Целевая переменная: стоимость мотоцикла в рублях
Всего было обработано около 7000 объявлений из Москвы. В ходе первичного анализа было обнаружено, что в данных содержатся пропуски, некоторые цены указаны не в рублях. Данные вопросы будут решаться на этапе подготовки выборки для использования моделей анализа данных. Если в ходе обработки данных покажется, что их слишком мало, будет произведена подкачка архивов объявлений других городов.
Ссылка на данные: https://github.com/maxbolgarin/datamining_project/blob/master/project/data/motorcycles.csv