# Hola &#x1F600;

Soy **Hesus Garcia**, revisor de código de Triple Ten, y voy a examinar el proyecto que has desarrollado recientemente. Si encuentro algún error, te lo señalaré para que lo corrijas, ya que mi objetivo es ayudarte a prepararte para un ambiente de trabajo real, donde el líder de tu equipo actuaría de la misma manera. Si no puedes solucionar el problema, te proporcionaré más información en la próxima oportunidad. Cuando encuentres un comentario,  **por favor, no los muevas, no los modifiques ni los borres**. 

Revisaré cuidadosamente todas las implementaciones que has realizado para cumplir con los requisitos y te proporcionaré mis comentarios de la siguiente manera:


<div class="alert alert-block alert-success">
<b>Comentario del revisor</b> <a class=“tocSkip”></a>
Si todo está perfecto.
</div>

<div class="alert alert-block alert-warning">
<b>Comentario del revisor</b> <a class=“tocSkip”></a>
Si tu código está bien pero se puede mejorar o hay algún detalle que le hace falta.
</div>

<div class="alert alert-block alert-danger">
<b>Comentario del revisor</b> <a class=“tocSkip”></a>
Si de pronto hace falta algo o existe algún problema con tu código o conclusiones.
</div>

Puedes responderme de esta forma:
<div class="alert alert-block alert-info">
<b>Respuesta del estudiante</b> <a class=“tocSkip”></a>
</div>

</br>

**¡Empecemos!**  &#x1F680;


# Telecomunicaciones: Identificar operadores ineficientes


A través del análisis del comportamiento descrito en la data de trabajo de un conjunto de operadores de un centro de llamadas investigaremos y demostraremos que tipo de operador no resulta eficiente en su trabajo.

Inicialmente estudiaremos nuestros datos para comprobar que contamos con los medios necesarios para realizar el análisis, esto a través de un análisis exploratorio donde verificaremos estructura de datos, valores ausentes, distribuciones, duplicados, entre otros.

Continuando con la descripción de la tarea, ennumero el número de características que a priori nos dejan en evidencia que un operador no es eficiente.

 > - El operador tiene un alto volumen de llamadas perdidas tanto internas como externas.
 > - El operador tarda mucho para atender las llamadas entrantes
 > - El operador (en caso de que aplique) tiene pocas llamadas salientes, dependiendo de sus funciones
 
Considerando los datos que tenemos a la mano, agruparemos por identificador de operador para calcular agregaciones de: 

 > - Número de llamadas
 > - Tiempo que duran en sus llamadas
 > - Cuánto tiempo tardan en responder sus llamadas (calculando el total call duration - call duration)
 > - Calcularemos el promedio general de todas estas agregaciones y determinaremos individualmente si el operador cumple o no cumple con lo esperado.
 > - También realizaremos una comparación del comportamiento entre llamadas internas y llamadas externas. Un operador que consuma más tiempo en llamadas internas podría no estar efectuando su trabajo eficientemente.
 
Una vez identifiquemos las variables arriba descritas podremos establecer grupos comparativos para probar hipótesis sobre igualdad en diferentes métricas como:

 > - ¿El grupo de operadores que duró más de la media de tiempo para responder sus llamadas recibió igual número de llamadas que su contraparte?
 > - ¿La duración de las llamadas del grupo que duró más tiempo para responder sus llamadas fue estadíticamente igual que su contraparte?
 > - ¿Los operadores que tienen más llamadas internas que externan tardan lo mismo en atender sus llamadas?


<div class="alert alert-block alert-warning">
    <b>Comentarios del Revisor</b> <a class="tocSkip"></a><br>
Muy buen trabajo con la descripción necesaria de lo que se requiere en el proyecto. Es interesante como has planteado la solución como un solo markdown. Sin embargo, para esto proyecto necesitamos que estas secciones comienzen a detallar un esqueleto del proyecto. para esto es necesario que comienzes a construir la estructura general del notebook con markdown. Recuerda también ser especifico en algunos puntos: 
- Qué vamos a considerar como un operador ineficiente? , por ejemplo, qué tanto es un 'alto número de llamada' ? 
- Además recuerda incluir una sección que no sólo concluya el proyecto si no que nos dé una serie de recomendaciones de negocio.</div>

Puedes responderme de esta forma:
<div class="alert alert-block alert-info">
<b>Respuesta del estudiante</b> <a class=“tocSkip”></a>
    
Hola Hesús, debajo traté de estructurar el esqueleto del notebook de la forma en la que creí correcta. Realmente me pareción un poco ambigua la descripción de la tarea y por ello lo traté inicialmente en un solo bloque.
    
Si es necesario ser más específico en la descripción de la tarea o incluir pasos adicionales, por favor me dejas saber, realmente no describo más lo que haría ya que no he desarrollado justamente las secciones del proyecto que me indicarían que pasos harían falta para completar la problemática inicial.
    
De antemano, gracias por tus comentarios.
</div>


# Telecomunicaciones: Identificar operadores ineficientes


El objetivo de este análisis es determinar cuando un operador es ineficiente en sus labores. Estaremos importando dos tablas: La primera con la información de las llamadas recibidas e información del operador que recibió la llamada.

Los campos que contiene esta primera tabla son los siguientes:

- `user_id`: ID de la cuenta de cliente
- `date`: fecha en la que se recuperaron las estadísticas
- `direction`: "dirección" de llamada (`out` para saliente, `in` para entrante)
- `internal`: si la llamada fue interna (entre los operadores de un cliente o clienta)
- `operator_id`: identificador del operador
- `is_missed_call`: si fue una llamada perdida
- `calls_count`: número de llamadas
- `call_duration`: duración de la llamada (sin incluir el tiempo de espera)
- `total_call_duration`: duración de la llamada (incluido el tiempo de espera)

La segunda tabla que estaremos importando contiene la información de los clientes y se organiza de la siguiente manera:

- `user_id`: ID de usuario/a
- `tariff_plan`: tarifa actual de la clientela
- `date_start`: fecha de registro de la clientela

## Preprocesamiento de datos

Luego de importar las tablas, realizaremos la importación de datos asegurandonos de cumplir los siguientes pasos:

 > - Revisar los tipo de datos importados en nuestros datasets
 > - Imprimir los datos iniciales y finales de la tabla
 > - Observar la distribución general de los datos
 > - Buscar datos ausentes
 > - Buscar duplicados implícitos
 > - Enriquecer los datos, incluyendo una columna donde calculemos cuánto tiempo duró el operador en atender una llamada
 > - Enriquecer los datos, incluyendo en la tabla de la operación la tarifa que tiene el cliente que llamó a determinado operador
 
 Al finalizar con el procesamiento procederemos con el análisis exploratorio de datos.

## Análisis exploratorio de datos

En esta sección nos centraremos en: 

 > - Trazar histogramas para observar la distribución de nuestros datos por variable
 > - En caso de existir valores atípicos, filtrar los mismos de acuerdo a las observaciones realizadas en la distribución para luego observar las distribuciones con los datos filtrados
 > - Realizar agregaciones por operador calculando para tiempo en llamada, el promedio, mínimo, máximo, moda, desviación estándar y promedio de tiempo en espera para atender una llamada
 > - Calcular cuantas llamadas internas y externas recibe cada operador y trazar gráficos
 > - Con base en los cálculos que preceden, determinaremos el porcentaje de llamadas perdidas para cada operador, internas o externas incluidas y trazar gráficos
 
Con base en las conclusiones del anterior análisis, definir:

 > - Umbral sobre cuánto debe tardar un operador en atender una llamada y trazar un gráfico relativo al grupo por debajo del umbral
 > - Umbral sobre cuántas llamadas perdidas para un operador es "demasiado" y trazar un gráfico relativo al grupo por debajo del umbral
 > - Umbral para calcular cuándo el operador no cumple con una cuota mínima de llamadas salientes en caso de que aplique y trazar un gráfico relativo al grupo por debajo del umbral
 
Al completar esta sección, formulamos conclusiones y nos dedicamos a la prueba de hipótesis.

## Prueba de hipótesis

Partiendo de las conclusiones obtenidas podemos probar las hipótesis de:

 > - ¿El grupo de operadores que excedió el umbral de tiempo para responder sus llamadas recibió igual número de llamadas que el resto?
 > - ¿La duración de las llamadas del grupo excedió el umbral de tiempo responder sus llamadas fue estadíticamente igual que el resto?
 > - ¿Los operadores que tienen más llamadas internas que externan tardan lo mismo en atender sus llamadas?
 
Una vez comprobadas las hipótesis podemos proceder a realizar conclusiones generales y recomendaciones

## Conclusiones generales

En esta sección redactaremos conclusiones y recomendaciones en aras de identificar y realizar acciones correctivas para los operadores que no estén realizando sus funciones eficientemente.

<div class="alert alert-block alert-success">    
<b>Comentario del revisor</b> <a class="tocSkip"></a>Este proyecto es un testimonio de tu capacidad para abordar Muy bien con esto es suficiente. Podemos proceder a la siguiente parte del proyecto.</div>