- Определить рыночную стоимость объектов недвижимости.
- Построить автомитизированную систему, которая отследит аномалии и мошенническую деятельность.
- Установить, какие факторы влияют на ценообразование стоимости квартир.
- Предобработка данных (пропуски, дубликаты, выбросы)
- Анализ аномальных данных
- Генерация дополнительных признаков для анализа стоимости квадратного метра
- Анализ факторов, влияющих на стоимость квартир
В рамках исследования архивных данных со сведениями о продаже квартир в Санкт-Петербурге и соседних населенных пунктах можно прийти к следующим выводам:
- В данных представлен разнообразный жилой фонд, который в целом покрывает все варианты жилого фонда Ссанкт-Петербурга и окресностей. В основной массе представлены 1-3 комнатные квартиры, при этом в большинстве - не на первом и не на последнем этажах - в самой распространенной застройке (здания от 5 до 12 этажей).
- Размещение данных в системе происходило постоянно, в основном по будням, пики размещения приходились на зимне-весенние и осенние месяцы с затишьем летом и зимой (декабрь-январь). По времени размещенные объявления уходили с разной скоростью - быстро (до 44 дней), умеренно быстро (от 44 до 100 дней), средне (от 100 до 236 дней), медленно (более 236 дней).
- Основными факторами, влияющими на стоимость квартиры оказались ее величина (как общей площади, так и кухни или жилой площади) и, в меньшей степени, количество комнат.
- Отдельно необходимо отметить, что изначально к сервису проявлялся больший интерес со стороны пользователей - самые крупные объявления были опубликованы на сервисе в первый год работы.
- По средней цене за квадратный метр Санкт-Петербург оказался не самым дорогим местом, его опережает поселок Репино. Однако среди населенных пунктов с наибольшим количеством объявлений средняя цена за квадратный метр в Санкт-Петербурге наивысшая. Следом за ним идет город Пушкин, а наименьшая цена за квадратный метр из 10 населенных пунктов с наибольшим количеством обхявлений в городе Выборг.
- В Санкт-Петербурге средняя цена за квадратный метр варьируется в зависимости от удаленности от центра. Цена падает с каждым километром, за исключением возрастания на 7 км от центра и небольшим возрастанием на 27 км от центра.
- Python
- Pandas
- Matplotlib
- Jupyter Notebook