# PROYECTO FINAL  – TELECOMUNICACIONES (DESCOMPOSICIÓN)
## Identificación de Operadores Ineficaces  
**Autor:** José Enrique Piñango Bustamante  
**Programa:** TripleTen – Data Analysis Bootcamp  

---

## 1. Contexto

El servicio de telefonía virtual **CallMeMaybe** busca desarrollar una función que permita a los supervisores identificar **operadores ineficaces**, basándose en el comportamiento de sus llamadas.  

**Objetivos del proyecto:**
- Detectar operadores menos eficientes según su desempeño en llamadas entrantes, salientes e internas.  
- Medir indicadores clave como **tiempo promedio de espera**, **porcentaje de llamadas perdidas** y **volumen de llamadas salientes**.  
- Establecer **criterios objetivos de ineficacia** y validarlos mediante **pruebas estadísticas**.  
- Generar **recomendaciones prácticas** para optimizar la gestión del personal y mejorar la experiencia del cliente.

El propósito final es ofrecer información cuantitativa que respalde decisiones de supervisión y capacitación en el call center.

---

## 2. Preprocesamiento de datos

El preprocesamiento asegura que los datos sean confiables y consistentes antes del análisis.

**Pasos a realizar:**
- **Carga de los datasets:**  
  - `telecom_dataset_us.csv` → registro detallado de llamadas.  
  - `telecom_clients_us.csv` → datos de clientes y planes tarifarios.  
- **Revisión de estructura:** verificación de tipos de datos, dimensiones y valores esperados.  
- **Detección y eliminación de duplicados:** 
- **Tratamiento de valores nulos:**  
  - `operator_id`: llamadas sin operador asignado se marcaran como “sin asignación”.  
  - `internal`: valores faltantes se imputaran como `False`.  
- **Creación de variables derivadas:**  
  - `waiting_time = total_call_duration - call_duration` para calcular el tiempo de espera por llamada.  
- **Tratamiento de valores atípicos:**  
  - Se eliminaran  registros con duraciones extraordinarias, por considerarse errores operativos o de registro.



---

## 3. Análisis exploratorio de datos (EDA)

El EDA permite comprender el comportamiento general del servicio y los patrones de desempeño de los operadores.

** Propuesta de Análisis a realizar:**
- **Distribución de duración de llamadas (con y sin espera):**  
- **Proporción de llamadas internas vs externas:**  
- **Relación entre llamadas entrantes y salientes:**  
- **Carga de trabajo por operador:**  


Cada visualización ser+a acompañada de una interpretación, identificando posibles focos de ineficiencia.

---

## 4. Criterios de eficiencia

Revisando la información sobre Call Centers disponible en la web se intento definir los criterios más comunes que caracterizan a un operador ineficaz, estabelciendo **métricas y umbrales cuantitativos:**

- **Tiempo promedio de espera (avg_waiting_time):**  
  Operadores por encima del percentil 75 → “espera alta”.
- **Porcentaje de llamadas perdidas (%_missed_calls):**  
  Operadores en el percentil 75 o superior → “pérdidas altas”.
- **Llamadas salientes (outgoing_calls):**  
  En roles con <50% de llamadas entrantes, los operadores en el percentil 25 inferior → “pocas salientes”.

**Clasificación general:**
- Se crearan **tres banderas de ineficacia:** espera alta, pérdidas altas y pocas salientes.  
- Se sumaran en una métrica de **reglas cumplidas (0–3)**.  
- Se definió un indicador **criterios_fuertes**, que identifica operadores con espera alta y pérdidas altas simultáneamente.  
- Operadores con **2 o más banderas activas** serán considerados **ineficaces**.

---

## 5. Prueba de hipótesis

Con los grupos definidos, se aplicaran pruebas estadísticas para validar si las diferencias observadas son significativas.

**Posibles pruebas a aplicar:**
1. **Mann–Whitney U Test**  
   - Comparar los tiempos de espera de operadores ineficaces vs eficaces.  
      los ineficaces esperan significativamente más.

2. **Correlación de Spearman**  
   - Observar a relación entre % de llamadas perdidas y tiempos de espera.  
   

3. **Mann–Whitney U (roles)**  
   - Comparar el número de llamadas salientes según el perfil de operador (entrante vs saliente).  
   - Resultado: *p < 0.001* → diferencia significativa entre roles.

Estas pruebas confirmarían  que las diferencias que se detectasen en el análisis exploratorio serían estadísticamente sólidas.

---

**Recomendaciones:**

  Una vez identificados los operadores ineficientes, realizar las siguientes acciones

1. **Intervención inmediata:** capacitar y monitorear a los operadores críticos.  
2. **Gestión de carga:** redistribuir llamadas para evitar saturación y esperas largas.  
3. **Reducción de pérdidas:** implementar sistemas de *call-back* y alertas automáticas.  
4. **Optimización de roles:** revisar perfiles con baja actividad saliente respecto a su rol.  
5. **Monitoreo continuo:** mantener un dashboard con métricas clave (% pérdidas, tiempos de espera, salientes).

---

## 7. Fuentes consultadas

1. **Pandas Documentation:** para carga y manipulación de datos.  
   [https://pandas.pydata.org/docs/](https://pandas.pydata.org/docs/)
2. **Matplotlib & Seaborn Documentation:** para visualización de distribuciones y comparativos.  
   [https://matplotlib.org/stable/](https://matplotlib.org/stable/)  
   [https://seaborn.pydata.org/](https://seaborn.pydata.org/)
3. **Scipy.stats Documentation:** para pruebas estadísticas (Mann–Whitney, Spearman).  
   [https://docs.scipy.org/doc/scipy/reference/stats.html](https://docs.scipy.org/doc/scipy/reference/stats.html)
4. **Call Center KPIs (Talkdesk, Genesys):** referencia de métricas estándar (<60s de espera, <5% de pérdidas).  
   [https://www.talkdesk.com/blog/call-center-metrics/](https://www.talkdesk.com/blog/call-center-metrics/)
5. **Kaggle – Telecom Datasets:** referencia de análisis exploratorios en datos de llamadas.  
   [https://www.kaggle.com/datasets](https://www.kaggle.com/datasets)
6. **Towards Data Science – Hypothesis Testing:** guía de validación estadística en contextos de negocio.  
   [https://towardsdatascience.com/hypothesis-testing-in-data-science](https://towardsdatascience.com/hypothesis-testing-in-data-science)

---



In [1]:
# Nota al revisor

No estoy mu seguro si esto es lo que quería. Voy a eliminar el reso de archivos y dejar solo éste. 