# Servicio de Telefonía CallMeMaybe

El servicio de telefonía virtual CallMeMaybe está desarrollando una nueva función que brindará a los supervisores y las supervisores información sobre los operadores menos eficaces. Se considera que un operador es ineficaz si tiene una gran cantidad de llamadas entrantes perdidas (internas y externas) y un tiempo de espera prolongado para las llamadas entrantes. Además, si se supone que un operador debe realizar llamadas salientes, un número reducido de ellas también será un signo de ineficacia. Por estas razones, la empresa tiene el siguiente objetivo:

- Desarrollar una nueva función que proporcione a los supervisores información sobre los operadores menos eficaces en el servicio de telefonía virtual CallMeMaybe.

Para esto se tiene que:

- Analizar el registro de llamadas para determinar la cantidad de llamadas perdidas por operador.
- Evaluar el tiempo de espera para las llamadas entrantes atendidas por cada operador.
- Registrar el número de llamadas salientes realizadas por cada operador.
- Calcular la probabilidad de ineficacia para cada operador en función de los criterios establecidos.
- Identificar la probabilidad de que un operador sea ineficaz según la cantidad de llamadas perdidas (internas y externas), el tiempo de espera prolongado y el número reducido de llamadas salientes.
- Sacar conclusiones básicas y elaborar recomendaciones para mejorar el servicio de los operadores.

## Inicialización

In [2]:
import matplotlib.pyplot as plt
from scipy import stats as st
import seaborn as sns
import numpy as np
import pandas as pd

### Cargar los datos

In [3]:
telecom_data = pd.read_csv('telecom_dataset_us.csv')
telecom_data

Unnamed: 0,user_id,date,direction,internal,operator_id,is_missed_call,calls_count,call_duration,total_call_duration
0,166377,2019-08-04 00:00:00+03:00,in,False,,True,2,0,4
1,166377,2019-08-05 00:00:00+03:00,out,True,880022.0,True,3,0,5
2,166377,2019-08-05 00:00:00+03:00,out,True,880020.0,True,1,0,1
3,166377,2019-08-05 00:00:00+03:00,out,True,880020.0,False,1,10,18
4,166377,2019-08-05 00:00:00+03:00,out,False,880022.0,True,3,0,25
...,...,...,...,...,...,...,...,...,...
53897,168606,2019-11-10 00:00:00+03:00,out,True,957922.0,True,1,0,38
53898,168606,2019-11-11 00:00:00+03:00,out,True,957922.0,False,2,479,501
53899,168606,2019-11-15 00:00:00+03:00,out,True,957922.0,False,4,3130,3190
53900,168606,2019-11-15 00:00:00+03:00,out,True,957922.0,False,4,3130,3190


In [5]:
clients_data = pd.read_csv('telecom_clients_us.csv')
clients_data

Unnamed: 0,user_id,tariff_plan,date_start
0,166713,A,2019-08-15
1,166901,A,2019-08-23
2,168527,A,2019-10-29
3,167097,A,2019-09-01
4,168193,A,2019-10-16
...,...,...,...
727,166554,B,2019-08-08
728,166911,B,2019-08-23
729,167012,B,2019-08-28
730,166867,B,2019-08-22


### Explorar la información general.

In [6]:
telecom_data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 53902 entries, 0 to 53901
Data columns (total 9 columns):
 #   Column               Non-Null Count  Dtype  
---  ------               --------------  -----  
 0   user_id              53902 non-null  int64  
 1   date                 53902 non-null  object 
 2   direction            53902 non-null  object 
 3   internal             53785 non-null  object 
 4   operator_id          45730 non-null  float64
 5   is_missed_call       53902 non-null  bool   
 6   calls_count          53902 non-null  int64  
 7   call_duration        53902 non-null  int64  
 8   total_call_duration  53902 non-null  int64  
dtypes: bool(1), float64(1), int64(4), object(3)
memory usage: 3.3+ MB


In [7]:
clients_data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 732 entries, 0 to 731
Data columns (total 3 columns):
 #   Column       Non-Null Count  Dtype 
---  ------       --------------  ----- 
 0   user_id      732 non-null    int64 
 1   tariff_plan  732 non-null    object
 2   date_start   732 non-null    object
dtypes: int64(1), object(2)
memory usage: 17.3+ KB


In [8]:
telecom_data.describe()

Unnamed: 0,user_id,operator_id,calls_count,call_duration,total_call_duration
count,53902.0,45730.0,53902.0,53902.0,53902.0
mean,167295.344477,916535.993002,16.451245,866.684427,1157.133297
std,598.883775,21254.123136,62.91717,3731.791202,4403.468763
min,166377.0,879896.0,1.0,0.0,0.0
25%,166782.0,900788.0,1.0,0.0,47.0
50%,167162.0,913938.0,4.0,38.0,210.0
75%,167819.0,937708.0,12.0,572.0,902.0
max,168606.0,973286.0,4817.0,144395.0,166155.0


In [10]:
clients_data.describe()

Unnamed: 0,user_id
count,732.0
mean,167431.927596
std,633.810383
min,166373.0
25%,166900.75
50%,167432.0
75%,167973.0
max,168606.0


## Preprocesar los datos