# **Proyecto: Telecomunicaciones: identificar operadores ineficaces**


El servicio de telefonía virtual CallMeMaybe está desarrollando una nueva función que brindará a los supervisores y las supervisores información sobre los operadores menos eficaces. Se considera que un operador es ineficaz si tiene una gran cantidad de llamadas entrantes perdidas (internas y externas) y un tiempo de espera prolongado para las llamadas entrantes. Además, si se supone que un operador debe realizar llamadas salientes, un número reducido de ellas también será un signo de ineficacia.



Según la información contenida en [Proyecto Final: Telecomunicaciones: identificar operadores ineficaces](https://coding-bootcamps.notion.site/Proyecto-Final-Telecomunicaciones-identificar-operadores-ineficaces-6f04c12cd9934057a816065922ec5a60)

Se tienen los siguientes datasets:


El dataset comprimido **telecom_dataset_us**.csv contiene las siguientes columnas:

- user_id: ID de la cuenta de cliente
- date: fecha en la que se recuperaron las estadísticas
- direction: "dirección" de llamada (out para saliente, in para entrante)
- internal: si la llamada fue interna (entre los operadores de un cliente o clienta)
- operator_id: identificador del operador
- is_missed_call: si fue una llamada perdida
- calls_count: número de llamadas
- call_duration: duración de la llamada (sin incluir el tiempo de espera)
- total_call_duration: duración de la llamada (incluido el tiempo de espera)

 

El conjunto de datos **telecom_clients_us**.csv tiene las siguientes columnas:

- user_id: ID de usuario/a
- tariff_plan: tarifa actual de la clientela
- date_start: fecha de registro de la clientela

# **1 Definir el Objetivo**



## **1.1 ¿Qué quieres conseguir y por qué?**

**Objetivo:**
En este caso, el objetivo principal es identificar a aquellos operadores que sean los menos eficaces en el servicio de telefonía virtual CallMeMaybe con el propósito de mejorar la eficiencia operativa y la calidad del servicio ofrecido a los clientes.

**Justificación:**
El propósito del objetivo va dirigido a optimizar el rendimiento de los operadores y garantizar una experiencia de calidad estandarizada a los usuarios finales. Al identificar a los operadores ineficaces se logrará proponer y ejecutar acciones correctivas en función a mejorar las habilidades/fortaleza y reforzar deficiencias/debilidades de los operadores. Proponer acciones como capacitación adicional, reestructuración de tareas o, si es necesario, reemplazar al operador.

La mejora en la eficiencia reducirá las llamadas perdidas, disminuirá el tiempo de espera y aumentará la productividad de las llamadas salientes, mejorando así la satisfacción del cliente.

## **1.2 ¿A quién le interesa lo que produces?**

- **Supervisores de operadores:** Son la primera capa de interés jerárquico en el proceso. Necesitan información para identificar a los operadores menos eficaces y tomar medidas correctivas y/o de retroalimentación al proceso.
- **Gerentes de CallMeMaybe:** Interesados en mejorar la calidad del servicio y la satisfacción del cliente, además de optimizar la utilización del personal a su cargo.
- **Clientes (organizaciones):** Se beneficiarán de un servicio más eficiente y una menor cantidad de llamadas perdidas o tiempos de espera prolongados.
- **Operadores:** Al ser los directamente los implicados en el proceso de interacción con los clientes, una mejora en su rendimiento les ayudará a obtener mayor tranquilidad al saber que están haciendo bien su trabajo.

## **1.3¿Qué decisiones se tomarán de acuerdo a tu análisis?**

- **Capacitación de operadores:** Identificar necesidades de capacitación para mejorar el desempeño de operadores ineficaces y de aquellos que estén haciendo bien su trabajo actualmente (ejemplos a seguir).
- **Redistribución de tareas:** Ajustar la carga de trabajo y responsabilidades de los operadores para equilibrar la eficiencia operativa. Además de eliminar tareas que puedan resultar innecesarias.
- **Revisión de procedimientos:** Implementar cambios en los procedimientos de manejo de llamadas para reducir los tiempos de espera y las llamadas perdidas.
- **Evaluación de rendimiento:** Realizar evaluaciones periódicas del rendimiento de los operadores utilizando métricas clave para garantizar la mejora continua.
- **Optimización del servicio:** Ajustar las estrategias operativas y los planes de acción para mejorar la eficiencia general del servicio de telefonía virtual.
- **Retroalimentación del proceso:** Al establecer acciones de retroalimentación, se garantiza la vinculación de todos aquellos actores implicados en el proceso y que tengan la capacidad de establecer acciones propositivas, documentadas y de mejora continua que alimenten el proceso constantemente, indiferente de su posición jerárquica en la empresa.

Con estos objetivos y decisiones en mente, podemos proceder a especificar los detalles y desarrollar un plan de acción claro para llevar a cabo el análisis.

# **2. Especificar los Detalles**

## **2.1 Establecer el contexto del problema:**

Los operadores de CallMeMaybe son considerados ineficaces si:
- Tienen una gran cantidad de llamadas entrantes perdidas (internas y externas).
- Tienen un tiempo de espera prolongado para las llamadas entrantes.
- Tienen un número reducido de llamadas salientes, especialmente si se supone que deben realizar dichas llamadas.

## **2.2 Ineficacia: ¿Cómo definirla?**

Para definir la ineficacia de los operadores, podemos establecer los siguientes parámetros y umbrales basados en las métricas clave:

1. **Cantidad de llamadas entrantes perdidas (internas y externas):**
   - **Umbral:** Un operador se consideraría ineficaz si su porcentaje de llamadas entrantes perdidas es superior al promedio general de llamadas entrantes perdidas más 1 desviación estándar.

2. **Tiempo de espera prolongado para llamadas entrantes:**
   - **Umbral:** Un operador se consideraría ineficaz si el tiempo de espera promedio para las llamadas entrantes es superior al promedio general del tiempo de espera promedio para llamadas entrantes más 1 desviación estándar.

3. **Número reducido de llamadas salientes:**
   - **Umbral:** Un operador se consideraría ineficaz si el número de llamadas salientes realizadas está por debajo del promedio general menos 1 desviación estándar, considerando eso sí, solo a aquellos operadores que tienen la tarea asignada de realizar llamadas salientes.

# **3. Etapa de Preprocesamiento**

## **3.1 Información Preliminar y Significado de la información**

Según la información contenida en [Proyecto Final: Telecomunicaciones: identificar operadores ineficaces](https://coding-bootcamps.notion.site/Proyecto-Final-Telecomunicaciones-identificar-operadores-ineficaces-6f04c12cd9934057a816065922ec5a60)

Se tienen los siguientes datasets:


El dataset comprimido **telecom_dataset_us**.csv contiene las siguientes columnas:

- user_id: ID de la cuenta de cliente
- date: fecha en la que se recuperaron las estadísticas
- direction: "dirección" de llamada (out para saliente, in para entrante)
- internal: si la llamada fue interna (entre los operadores de un cliente o clienta)
- operator_id: identificador del operador
- is_missed_call: si fue una llamada perdida
- calls_count: número de llamadas
- call_duration: duración de la llamada (sin incluir el tiempo de espera)
- total_call_duration: duración de la llamada (incluido el tiempo de espera)

 

El conjunto de datos **telecom_clients_us**.csv tiene las siguientes columnas:

- user_id: ID de usuario/a
- tariff_plan: tarifa actual de la clientela
- date_start: fecha de registro de la clientela

## **3.2 Importación de librerías:**

Importante definir las librerías a utilizar según el caso del análisis que se requiera realizar. En este caso, **a manera de ejemplo** usaremos pandas para revisar de forma superficial la estructura de los datos contenidos en **telecom_dataset_us** y **telecom_clients_us**:

In [1]:
# Importe de librería pandas para mostrar la información preliminar de los datasets (ejemplo):

import pandas as pd

## **3.3 Carga de datos y revisión preliminar de la estructura de los datos:**

In [10]:
# Carga de datos de ambos datasets:

df_1 = pd.read_csv('telecom_dataset_us.csv')
display(df_1.info())

df_2 = pd.read_csv('telecom_clients_us.csv')
display(df_2.info())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 53902 entries, 0 to 53901
Data columns (total 9 columns):
 #   Column               Non-Null Count  Dtype  
---  ------               --------------  -----  
 0   user_id              53902 non-null  int64  
 1   date                 53902 non-null  object 
 2   direction            53902 non-null  object 
 3   internal             53785 non-null  object 
 4   operator_id          45730 non-null  float64
 5   is_missed_call       53902 non-null  bool   
 6   calls_count          53902 non-null  int64  
 7   call_duration        53902 non-null  int64  
 8   total_call_duration  53902 non-null  int64  
dtypes: bool(1), float64(1), int64(4), object(3)
memory usage: 3.3+ MB


None

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 732 entries, 0 to 731
Data columns (total 3 columns):
 #   Column       Non-Null Count  Dtype 
---  ------       --------------  ----- 
 0   user_id      732 non-null    int64 
 1   tariff_plan  732 non-null    object
 2   date_start   732 non-null    object
dtypes: int64(1), object(2)
memory usage: 17.3+ KB


None

In [14]:
#Revisión de algunos registros de los datasets:
display(df_1.head())

display(df_2.head())

Unnamed: 0,user_id,date,direction,internal,operator_id,is_missed_call,calls_count,call_duration,total_call_duration
0,166377,2019-08-04 00:00:00+03:00,in,False,,True,2,0,4
1,166377,2019-08-05 00:00:00+03:00,out,True,880022.0,True,3,0,5
2,166377,2019-08-05 00:00:00+03:00,out,True,880020.0,True,1,0,1
3,166377,2019-08-05 00:00:00+03:00,out,True,880020.0,False,1,10,18
4,166377,2019-08-05 00:00:00+03:00,out,False,880022.0,True,3,0,25


Unnamed: 0,user_id,tariff_plan,date_start
0,166713,A,2019-08-15
1,166901,A,2019-08-23
2,168527,A,2019-10-29
3,167097,A,2019-09-01
4,168193,A,2019-10-16


In [15]:
# Revisión de la distribución estadística de los datasets:
display(df_1.describe(include='all'))
display(df_2.describe(include='all'))


Unnamed: 0,user_id,date,direction,internal,operator_id,is_missed_call,calls_count,call_duration,total_call_duration
count,53902.0,53902,53902,53785,45730.0,53902,53902.0,53902.0,53902.0
unique,,119,2,2,,2,,,
top,,2019-11-25 00:00:00+03:00,out,False,,False,,,
freq,,1220,31917,47621,,30334,,,
mean,167295.344477,,,,916535.993002,,16.451245,866.684427,1157.133297
std,598.883775,,,,21254.123136,,62.91717,3731.791202,4403.468763
min,166377.0,,,,879896.0,,1.0,0.0,0.0
25%,166782.0,,,,900788.0,,1.0,0.0,47.0
50%,167162.0,,,,913938.0,,4.0,38.0,210.0
75%,167819.0,,,,937708.0,,12.0,572.0,902.0


Unnamed: 0,user_id,tariff_plan,date_start
count,732.0,732,732
unique,,3,73
top,,C,2019-09-24
freq,,395,24
mean,167431.927596,,
std,633.810383,,
min,166373.0,,
25%,166900.75,,
50%,167432.0,,
75%,167973.0,,


Como podemos ver, usando los métodos de .info(), head(), y describe() de la librería pandas podemos percibir la estructura de los datos, el número de columnas y registros que posee cada dataset, como también cuales registros tienen valores ausentes y aquellas columnas que requieren ser transformadas tanto en el nombre de sus columnas como en el formato y/o tipo de dato que contienen.

## **3.4 Limpieza y estandarización de los datos previos al análisis:**

### **3.4.1 Estudiar los valores ausentes:**

En este paso se define cuantos registros ausentes existen en los datasets, se define la relevancia y su proporción respecto al resto de registros y en base a eso se define sí los valores ausentes:

    - Se eliminan
    - Se reemplazan por un valor coherente
    - Se les asigna un valor de 0, o de la media/mediana en función de los valores que se registren en dicha columna.

### **3.4.2 Eliminación de datos duplicados:**

Dependiendo de la estructura del dataset, se define si los datos enteramente duplicados tienen coherencia o no. En caso que haya una fecha específica (como en el ejemplo del dataset de telecom_dataset_us) un dato enteramente duplicado debería ser eliminado para no afectar el análisis.

### **3.4.3 Conversión del tipo de datos:**

Convertir los datos según el tipo de datos que estén en los registros.

# **4. Análisis Exploratorio de Datos (EDA):**

## **4.1 Descripción estadística de los datos**
Se determinan aquellos registros que agreguen valor a los indicadores previamente definidos. A partir de ahí se definen la distribución estadística de los datos, valores máximos, mínimos, promedios, desviaciones estándar entre otros.

## **4.2 Visualización de distribuciones de las métricas clave (llamadas perdidas, tiempos de espera, llamadas salientes)**


A partir de aquí, el propósito es facilitar el panorama a partir de gráficos y visualizaciones claves que ayuden a determinar el estado actual de la problemática en cuestión.

## **4.3 Identificación de correlaciones y patrones**

Identficar si existen patrones y correlaciones es clave para definir si existen comportamientos, labores, o patrones ineficientes dentro del proceso.

# **5. Definición de Umbrales de Ineficacia:**


## **5.1 Calcular promedios y desviaciones estándar de las métricas clave.**



## **Definir umbrales de ineficacia para cada métrica según lo descrito anteriormente.**

Ayudarse de los valores estadísticos y análisis previo para definir los valores límite y/o umbrales que ayuden a definir cuando estaríamos tratando con operadores ineficaces o no:

# **6. Identificación de Operadores Ineficaces:**
   - Aplicar los umbrales definidos para identificar a los operadores ineficaces a partir de métodos que ayuden a filtrar los datasets previamente analizados en función de aquellos que estén por debajo de los umbrales definidos.
   - Generar un reporte de operadores ineficaces con detalles de sus métricas.

# **7. Etapa de Hipótesis**

En esta etapa se definen las hipótesis a partir de una noción previa producto del análisis. **Por ejemplo** se podría establecer que:

1. **Hipótesis 1:** Los operadores con un alto porcentaje de llamadas perdidas son ineficaces.
2. **Hipótesis 2:** Los operadores con tiempos de espera prolongados para las llamadas entrantes son ineficaces.
3. **Hipótesis 3:** Los operadores que realizan pocas llamadas salientes, cuando se supone que deben hacerlas, son ineficaces.
4. **Hipótesis 4:** Los operadores que contactan con clientes con fechas de registros más recientes suelen ser ineficaces.

## **7.1 Definir el tipo de prueba estadística en función de los resultados obtenidos en el análisis.**

En este paso se definen y realizan las pruebas estadísticas correspondiente en función de la hipótesis a probar y el comportamiento de los datos en el análisis. Confirmar y/o rechazar las hipótesis a partir de los resultados de las pruebas.

# **8. Conclusiones de los análisis realizados y proposiciones de acciones de mejora**

Finalmente, elaborar conclusiones a partir de los estudios analíticos realizados.

Conclusiones y sugerencias que aporten valor a los actores interesados en el proceso de estudio definidos en el apartado 1.2



## **8.1 Verificar si las conclusiones van en función de las posibles soluciones propuestas en el paso 1.3**

A manera de ejemplo, se podría contrastar las acciones propuestas en el paso 1.3 y verificar si se validan y/o se agregan las posibles soluciones a la problemática de la ineficacia de los operadores.

**Posibles soluciones luego del análisis y las pruebas de hipótesis:**

- **Capacitación de operadores:** Identificar necesidades de capacitación para mejorar el desempeño de operadores ineficaces y de aquellos que estén haciendo bien su trabajo actualmente (ejemplos a seguir).
- **Redistribución de tareas:** Ajustar la carga de trabajo y responsabilidades de los operadores para equilibrar la eficiencia operativa. Además de eliminar tareas que puedan resultar innecesarias.
- **Revisión de procedimientos:** Implementar cambios en los procedimientos de manejo de llamadas para reducir los tiempos de espera y las llamadas perdidas.
- **Evaluación de rendimiento:** Realizar evaluaciones periódicas del rendimiento de los operadores utilizando métricas clave para garantizar la mejora continua.
- **Optimización del servicio:** Ajustar las estrategias operativas y los planes de acción para mejorar la eficiencia general del servicio de telefonía virtual.
- **Retroalimentación del proceso:** Al establecer acciones de retroalimentación, se garantiza la vinculación de todos aquellos actores implicados en el proceso y que tengan la capacidad de establecer acciones propositivas, documentadas y de mejora continua que alimenten el proceso constantemente, indiferente de su posición jerárquica en la empresa.

# **9. Presentación de los análisis de los resultados en función del actor interesado (stakeholder):**

En este paso final, es importante establecer a quien irá dirigido el reporte a presentar:

1. **Dashboard para seguimiento de indicadores:** Esta solución podría interesar a los supervisores y a los mismos operadores para tener presente su estado actual en términos de eficacia en su operación.
2. **Reporte/Presentación de los resultados en diapositivas o reporte corporativo:** En este caso, simplemente se puede tener un estado actual de la situación que puede interesar a cargos administrativos más altos que ayuden a entender las acciones a tomar y poder retroalimentar a su personal y a los clientes. 