# Определение перспективного тарифа для телеком-компании

Клиентам предлагают два тарифных плана: «Смарт» и «Ультра».

Чтобы скорректировать рекламный бюджет, коммерческий департамент хочет понять, какой тариф приносит больше денег.

In [1]:
import numpy as np

import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['figure.figsize'] = (10, 6)

import seaborn as sns

sns.set_context('notebook', font_scale=1.5)
sns.set_style('darkgrid', rc={'ytick.left':True, 'ytick.direction':'in',
                              'xtick.bottom':True, 'xtick.direction':'in'})

## Содержание:
* [1. Общая информация](#section_1)
* [2. Подготовка данных](#section_2)

## 1. Общая информация <a class="anchor" id="section_1"></a>

In [2]:
users_df = pd.read_csv('datasets/users.csv')
messages_df = pd.read_csv('datasets/messages.csv')
calls_df = pd.read_csv('datasets/calls.csv')
internet_df = pd.read_csv('datasets/internet.csv')
tariffs_df = pd.read_csv('datasets/tariffs.csv')

При попытке посмотреть `calls_df.info()` вышла следующая ошибка:

TypeError: Cannot interpret '<attribute 'dtype' of 'numpy.generic' objects>' as a data type

Похожая проблема обсуждалась __[здесь](https://github.com/numpy/numpy/issues/18355)__. В итоге (загадочным образом) помогло:

`conda install pandas`

Дальше разбираться не стал.

In [6]:
users_df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 500 entries, 0 to 499
Data columns (total 8 columns):
 #   Column      Non-Null Count  Dtype 
---  ------      --------------  ----- 
 0   user_id     500 non-null    int64 
 1   age         500 non-null    int64 
 2   churn_date  38 non-null     object
 3   city        500 non-null    object
 4   first_name  500 non-null    object
 5   last_name   500 non-null    object
 6   reg_date    500 non-null    object
 7   tariff      500 non-null    object
dtypes: int64(2), object(6)
memory usage: 31.4+ KB


- user_id — уникальный идентификатор пользователя

- first_name — имя пользователя

- last_name — фамилия пользователя

- age — возраст пользователя (годы)

- reg_date — дата подключения тарифа (день, месяц, год)

- churn_date — дата прекращения пользования тарифом (если значение пропущено, то тариф ещё действовал на момент выгрузки данных)

- city — город проживания пользователя

- tarif — название тарифного плана


## 2. Подготовка данных <a class="anchor" id="section_2"></a>