Skip to content

Latest commit

 

History

History
53 lines (49 loc) · 5.3 KB

README.md

File metadata and controls

53 lines (49 loc) · 5.3 KB

Задача проекта

На основе данных клиентов оператора сотовой связи проанализировать поведение клиентов и поиск оптимального тарифа.

Описание проекта

Проведен предварительный анализ использования тарифов на выборке клиентов, проанализировано поведение клиентов при использовании услуг оператора и рекомендованы оптимальные наборы услуг для пользователей. Проведена предобработка данных, их анализ. Проверены гипотезы о различии выручки абонентов разных тарифов и различии выручки абонентов из Москвы и других регионов.

Описание данных

Тарифы:

  • Тариф «Смарт»:

Ежемесячная плата: 550 рублей Включено 500 минут разговора, 50 сообщений и 15 Гб интернет-трафика Стоимость услуг сверх тарифного пакета: Минута разговора — 3 рубля. Количество использованных минут и мегабайтов «Мегалайн» всегда округляет вверх. Если пользователь проговорил всего 1 секунду, в тарифе засчитывается целая минута. Сообщение — 3 рубля. 1 Гб интернет-трафика — 200 рублей.

  • Тариф «Ультра»

Ежемесячная плата: 1950 рублей Включено 3000 минут разговора, 1000 сообщений и 30 Гб интернет-трафика Стоимость услуг сверх тарифного пакета: Минута разговора — 1 рубль; Сообщение — 1 рубль; 1 Гб интернет-трафика: 150 рублей.

Признаки:

Таблица users — информация о пользователях:

  • user_id — уникальный идентификатор пользователя
  • first_name — имя пользователя
  • last_name — фамилия пользователя
  • age — возраст пользователя (годы)
  • reg_date — дата подключения тарифа (день, месяц, год)
  • churn_date — дата прекращения пользования тарифом (если значение пропущено, значит, тариф ещё действовал на момент выгрузки данных)
  • city — город проживания пользователя
  • tarif — название тарифного плана

Таблица calls — информация о звонках:

  • id — уникальный номер звонка
  • call_date — дата звонка
  • duration — длительность звонка в минутах
  • user_id — идентификатор пользователя, сделавшего звонок

Таблица messages — информация о сообщениях:

  • id — уникальный номер звонка
  • message_date — дата сообщения
  • user_id — идентификатор пользователя, отправившего сообщение

Таблица internet — информация об интернет-сессиях:

  • id — уникальный номер сессии
  • mb_used — объём потраченного за сессию интернет-трафика (в мегабайтах)
  • session_date — дата интернет-сессии
  • user_id — идентификатор пользователя

Таблица tariffs — информация о тарифах:

  • tariff_name — название тарифа
  • rub_monthly_fee — ежемесячная абонентская плата в рублях
  • minutes_included — количество минут разговора в месяц, включённых в абонентскую плату
  • messages_included — количество сообщений в месяц, включённых в абонентскую плату
  • mb_per_month_included — объём интернет-трафика, включённого в абонентскую плату (в мегабайтах)
  • rub_per_minute — стоимость минуты разговора сверх тарифного пакета (например, если в тарифе 100 минут разговора в месяц, то со 101 минуты будет взиматься плата)
  • rub_per_message — стоимость отправки сообщения сверх тарифного пакета
  • rub_per_gb — стоимость дополнительного гигабайта интернет-трафика сверх тарифного пакета (1 гигабайт = 1024 мегабайта)

Ключевые слова

Обработка данных, histogram, boxplot, статистический тест, критерий Стьюдента.