Skip to content

Прогнозирование оттока пользователей (Проект в skillbox)

Notifications You must be signed in to change notification settings

SofiaKhutsieva/ML_outflow_of_clients_from_a_telecommunication_company

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 

Repository files navigation

Отток клиентов из телекоммуникационной компании

Задача

Любой бизнес хочет максимизировать количество клиентов. Для достижения этой цели важно не только пытаться привлечь новых, но и удерживать уже существующих. Удержать клиента обойдется компании дешевле, чем привлечь нового. Кроме того, новый клиент может оказаться слабо заинтересованным в услугах бизнеса и с ним будет сложно работать, тогда как о старых клиентах уже есть необходимые данные по взаимодействию с сервисом.

Соответственно, прогнозируя отток, мы можем вовремя среагировать и попытаться удержать клиента, который хочет уйти. Опираясь на данные об услугах, которыми пользуется клиент, мы можем сделать ему специальное предложение, пытаясь изменить его решение об уходе от оператора. Благодаря этому задача удержания будет легче в реализации, чем задача привлечения новых пользователей, о которых мы еще ничего не знаем.

Вам предоставлен набор данных от телекоммуникационной компании. В данных содержится информация о почти шести тысячах пользователей, их демографических характеристиках, услугах, которыми они пользуются, длительности пользования услугами оператора, методе оплаты, размере оплаты.

Cтоит задача проанализировать данные и спрогнозировать отток пользователей (выявить людей, которые продлят контракт и которые не продлят). Работа должна включать в себя следующие обязательные пункты:

Описание данных (с расчетом базовых статистик), Исследование зависимостей и формулирование гипотез, Построение моделей для прогнозирования оттока (с обоснованием выбора той или иной модели) на основе проверенных гипотез и выявленных взаимосвязей, Сравнение качества полученных моделей. Во втором разделе обязательно должно присутствовать обоснование гипотез, подробное описание выявленных взаимосвязей, а также их визуализация. В четвертом дополнительно должны быть сформулированы общие выводы работы.

Стек: Python, sklearn, numpy, pandas, matplotlib, seaborn

Если файл не открывается - https://colab.research.google.com/drive/1Whq-Bga4Asu04Z-E62G8K8-tNnL4VZYv#scrollTo=QEaF1AEbXM8r

Результат

image

Releases

No releases published

Packages

No packages published