Skip to content

ivanlipko/ml_boosters_contest_ny

Repository files navigation

ml_boosters_contest_ny

Решение соревнования Happy Data Year от Росбанка (платформа Boosters.pro). Решение заняло 48 место на Public LeaderBoard и 21 место на приватной доске.

Автор: Липко Иван

E-mail: ivanlipko@yandex.ru

О соревновании

Happy Data Year - новогодний чемпионат по анализу данных от Росбанка.

Вам предстоит предсказать индекс популярности геолокации для размещения устройства банкоматной сети.

В обучающей выборке находятся данные о геопозиции шести тысяч банкоматов Росбанка и его партнеров, а также целевая переменная — индекс популярности банкомата. В тестовой выборке еще две с половиной тысячи банкоматов, разделенных поровну на публичную и приватную часть.

О решении

Папка с решением состоит из:

Основное решение.ipynb - файл с основным решением, где есть парсинг данных, создание признаков, анализ и чистка, обучение лучшего оценщика

myutils.py - функции парсинга, исправления названий городов

Другие регрессоры.ipynb - примеры реализации разных оценщиков. Чтобы было видно что сравнение было с другими моделями, но они не дали результата

Полезные заметки.ipynb - заметки, которые я делал в течении и в завершении соревнования

data - папка с данными/словарями/промежуточные и почищенные датафреймы

chromedriver - драйвер для selenium

Сабмиты:

submit.csv - отпарвляемый сабмит

submit_0.0426033.csv - мой сабмит с приватным рейтингом 0.0426033

submit_0.0429679.csv - мой сабмит с приватным рейтингом 0.0429679

сравнение с лучшим submit.ods - визуальное сравнение получаемого сабмита с лучшим мною полученным

About

boostes pro ml competitions

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published