# Descomposición del Proyecto: Identificar Operadores Ineficaces en CallMeMaybe

El servicio de telefonía virtual CallMeMaybe está desarrollando una nueva función que brindará a los supervisores y las supervisores información sobre los operadores con oportunidades de mejora (bajo desempeño). Se considera que un operador con bajo desempeño, si tiene una gran cantidad de llamadas entrantes perdidas (internas y externas) y un tiempo de espera prolongado para las llamadas entrantes. Además, si se supone que un operador debe realizar llamadas salientes, un número reducido de ellas también será un signo de bajo desempeño.

## 1. Definir el objetivo

**¿Qué queremos conseguir y por qué?**  
Identificar operadores ineficaces para ayudar a los supervisores a mejorar el desempeño del equipo de atención y llamadas.

**¿A quién le interesa lo que produces?**  
A los supervisores/as del servicio CallMeMaybe.

**¿Qué decisiones se tomarán?**  
Decisiones sobre capacitación, reasignación de tareas o mejora del rendimiento de los operadores.


## 2. Especificar los detalles

Un operador es ineficaz cuando:

- Tiene muchas llamadas entrantes perdidas (internas o externas).
- Tiene tiempos de espera prolongados para las llamadas entrantes.
- Realiza pocas llamadas salientes si tiene asignada esa responsabilidad.

El cliente solicita también:

- Análisis exploratorio de datos.
- Identificación de operadores ineficaces.
- Pruebas de hipótesis estadísticas.
- Dashboards interactivos.
- Documentación de fuentes consultadas.
- Presentación de resultados en PDF.


## 3. Proponer hipótesis

- H1: Los operadores con una alta proporción de llamadas entrantes perdidas son menos eficaces.
- H2: Los operadores con un tiempo de espera promedio más alto son menos eficaces.
- H3: Los operadores que deben realizar llamadas salientes y hacen pocas son menos eficaces.
- H4: Existen diferencias significativas entre operadores según el plan tarifario de sus cuentas.


## 4. Convertir hipótesis en plan de acción

### Carga y preprocesamiento
- Cargar los datasets (`telecom_dataset_us.csv`, `telecom_clients_us.csv`).
- Unirlos por `user_id`.
- Estandarizar formatos y nombres de columnas.


### Para H1: llamadas entrantes perdidas
- Filtrar llamadas entrantes.
- Calcular la tasa de llamadas perdidas por operador.
- Establecer umbral de ineficacia (por percentil o valor absoluto).


### Para H2: tiempo de espera
- Calcular `tiempo_espera = total_call_duration - call_duration`.
- Obtener promedio por operador.
- Clasificar operadores con mayor tiempo de espera.


### Para H3: volumen de llamadas salientes
- Filtrar llamadas salientes.
- Calcular número de llamadas salientes por operador.
- Detectar operadores con volúmenes bajos (por ejemplo, percentil 25 o mínimo absoluto).


### Para H4: comparación entre tarifas
- Unir con dataset de tarifas.
- Comparar volumen y rendimiento por tipo de tarifa.


## 5. Etapas obligatorias de análisis

### Preprocesamiento
- Estudiar valores nulos y decidir si eliminarlos o rellenarlos.
- Verificar y convertir tipos de datos donde sea necesario.
- Eliminar duplicados si es que no afectan a las métricas.
- Renombrar columnas si es necesario.


### Análisis exploratorio
- Obtener las estadísticas generales de llamadas.
- Generar un histograma de duración de llamadas.
- Generar un pie chart de participación de llamadas internas vs externas.
- Obener las llamadas por día.
- Segmentar por tipo de llamada (interna, externa, entrante, saliente).


## 6. Descomposición adicional (ejemplo complementario)

Inactividad reciente en llamadas salientes:

- Calcular la fecha de la última llamada saliente por operador.
- Agrupar operadores por rangos de antigüedad en llamadas.
- Ver si los operadores ineficaces han estado inactivos recientemente.


## 7. Evaluación de la descomposición

Antes de iniciar la codificación:

- Validar hipótesis con el cliente
- Confirmar la disponibilidad y calidad de los datos.
- Asegurar que los criterios de ineficacia estén alineados con los objetivos del negocio.
