# **Guía 2**

Objetivo: aplicar los conceptos de Pandas en la manipulación y análisis de datos estructurados. Se trabajará con Series y DataFrames, aplicando técnicas de acceso, selección, filtrado y agregación de datos.

### **Caso de Negocio: Análisis de Deserción de Clientes en una Empresa de Telecomunicaciones**

**Contexto**

En la industria de las telecomunicaciones, la retención de clientes es un factor crítico para la sostenibilidad del negocio. La competencia es feroz y adquirir nuevos clientes suele ser más costoso que mantener a los actuales. En este análisis, exploraremos un conjunto de datos que contiene información detallada sobre clientes que han abandonado el servicio (churn) y aquellos que permanecen activos.

Nuestro objetivo es identificar los factores clave que influyen en la deserción, comprender patrones de comportamiento y generar estrategias efectivas para reducir la tasa de abandono.

La empresa ha experimentado un aumento en la tasa de deserción de clientes, lo que ha provocado:
- Pérdida de ingresos recurrentes.
- Incremento en los costos de adquisición de nuevos clientes.
- Menor estabilidad en la base de clientes a largo plazo.

Para abordar esta problemática, es crucial identificar las razones detrás de la deserción y desarrollar estrategias para mejorar la retención de clientes.



**Entrega del Trabajo**

Los estudiantes deben trabajar en grupos de entre 2 y 4 personas. Cada grupo deberá subir su trabajo a un repositorio de GitHub, asegurándose de que el código y los archivos necesarios estén bien organizados y documentados. Posteriormente, deberán enviar el enlace del repositorio en la plataforma Canvas para su evaluación.

Instrucciones para la entrega:

Crear un repositorio en GitHub con un nombre descriptivo para el proyecto.

Subir el código en Jupyter Notebook (.ipynb) o en formato Python (.py).

Incluir un archivo README.md con una breve descripción del trabajo y las instrucciones de ejecución.

Compartir el enlace del repositorio en Canvas dentro del plazo establecido.



**Descripción de las variables del dataset telecom_churn**

El dataset telecom_churn contiene información detallada sobre clientes de una empresa de telecomunicaciones, incluyendo datos generales, planes contratados, uso del servicio telefónico y llamadas al servicio al cliente. Su propósito principal es analizar patrones de deserción de clientes, identificados a través de la variable churn, que indica si un cliente ha abandonado la empresa (1) o sigue siendo cliente (0).

Dentro del dataset, encontramos información general como el estado (state) donde reside el cliente, el código de área (area code), y el número de teléfono (phone number), aunque esta última variable no aporta información útil para el análisis, ya que es un identificador único.

Además, el dataset registra el tiempo que un cliente ha estado en la empresa a través de la variable account length, lo que puede ayudar a analizar si la duración del contrato influye en la deserción. También se incluyen detalles sobre los planes contratados, como si el cliente tiene un plan internacional (international plan), que le permite realizar llamadas internacionales, o un buzón de voz (voice mail plan), que le permite recibir mensajes de voz.

En cuanto al uso del servicio, se registran datos detallados sobre el tiempo en llamadas y los costos asociados. Se divide en tres períodos del día: diurno (total day minutes, total day calls, total day charge), vespertino (total eve minutes, total eve calls, total eve charge) y nocturno (total night minutes, total night calls, total night charge), lo que permite evaluar si hay patrones de consumo que influyen en la deserción. También se incluye información sobre el uso del servicio internacional, con variables como total intl minutes (minutos en llamadas internacionales), total intl calls (cantidad de llamadas internacionales) y total intl charge (costos por llamadas internacionales).

Otro aspecto clave del dataset es el número de llamadas al servicio al cliente (customer service calls), ya que una mayor cantidad de llamadas puede indicar insatisfacción y estar relacionada con la decisión del cliente de abandonar la empresa.

Finalmente, la variable más importante del análisis es churn, que indica si un cliente ha desertado de la empresa. A partir de esta variable, podemos analizar qué factores influyen en la deserción y encontrar patrones en los clientes que tienen mayor probabilidad de abandonar el servicio.


**Exploración y Limpieza de Datos**

Cargar y explorar el dataset

Importa Pandas y carga el dataset telecom_churn.csv en un DataFrame.

Muestra las primeras 5 filas del DataFrame.

Verifica cuántas filas y columnas tiene el dataset.

Muestra información general del dataset, incluyendo los tipos de datos.

Identifica si hay valores nulos en alguna columna.

In [1]:
# Solución propuesta
import pandas as pd

print(pd.__version__)

2.1.0


In [2]:
import os
os.getcwd()


'c:\\Users\\eslun\\OneDrive\\Documentos\\EAN\\PANDAS\\GUIA_2\\Analisis-BD-Telecom'

In [3]:
os.listdir()

['.git', 'Copia_de_Guia_2_ver_2.ipynb', 'README.md']

In [4]:
os.makedirs("Guia 2", exist_ok=True) # creamos la carpeta para cargar el archivo

In [7]:
# importamos la libreria pandas
import pandas as pd
df1 = pd.read_csv('Guia 2/telecom_churn.csv') #cargamos el Datasheet en el un Dataframe llamado df1

In [None]:
# mostramos las 5 primeras filas del Dataframe
df1.head(5)

Unnamed: 0,state,account length,area code,phone number,international plan,voice mail plan,number vmail messages,total day minutes,total day calls,total day charge,...,total eve calls,total eve charge,total night minutes,total night calls,total night charge,total intl minutes,total intl calls,total intl charge,customer service calls,churn
0,KS,128,415,382-4657,no,yes,25,265.1,110,45.07,...,99,16.78,244.7,91,11.01,10.0,3,2.7,1,False
1,OH,107,415,371-7191,no,yes,26,161.6,123,27.47,...,103,16.62,254.4,103,11.45,13.7,3,3.7,1,False
2,NJ,137,415,358-1921,no,no,0,243.4,114,41.38,...,110,10.3,162.6,104,7.32,12.2,5,3.29,0,False
3,OH,84,408,375-9999,yes,no,0,299.4,71,50.9,...,88,5.26,196.9,89,8.86,6.6,7,1.78,2,False
4,OK,75,415,330-6626,yes,no,0,166.7,113,28.34,...,122,12.61,186.9,121,8.41,10.1,3,2.73,3,False


In [8]:
df1.shape #mostramos cuantas filas y columnas tiene el dataframe df1

(3333, 21)

In [9]:
# información general del Dataframe

type(df1)

pandas.core.frame.DataFrame

In [10]:
# identificar valores nulos en alguna columna

print(" Valores nulos en cada columna:")
print(df1.isnull().sum())

 Valores nulos en cada columna:
state                     0
account length            0
area code                 0
phone number              0
international plan        0
voice mail plan           0
number vmail messages     0
total day minutes         0
total day calls           0
total day charge          0
total eve minutes         0
total eve calls           0
total eve charge          0
total night minutes       0
total night calls         0
total night charge        0
total intl minutes        0
total intl calls          0
total intl charge         0
customer service calls    0
churn                     0
dtype: int64


In [11]:
# Solución propuesta ELP
# Mostrar las primeras 5 filas del DataFrame
print(df1.head())

# Verificar cuántas filas y columnas tiene el dataset
print("\nDimensiones del DataFrame (filas, columnas):", df1.shape)

# Mostrar información general del dataset
print("\nInformación general del DataFrame:")
print(df1.info())

# Identificar valores nulos en cada columna
print("\nValores nulos por columna:")
print(df1.isnull().sum())

  state  account length  area code phone number international plan  \
0    KS             128        415     382-4657                 no   
1    OH             107        415     371-7191                 no   
2    NJ             137        415     358-1921                 no   
3    OH              84        408     375-9999                yes   
4    OK              75        415     330-6626                yes   

  voice mail plan  number vmail messages  total day minutes  total day calls  \
0             yes                     25              265.1              110   
1             yes                     26              161.6              123   
2              no                      0              243.4              114   
3              no                      0              299.4               71   
4              no                      0              166.7              113   

   total day charge  ...  total eve calls  total eve charge  \
0             45.07  ...           

**Análisis de Churn y Factores Relacionados**

Calcula el porcentaje de clientes que han desertado (churn = 1).

Identifica si los clientes con plan internacional (international plan) tienen mayor tasa de deserción.

Identifica si los clientes con buzón de voz (voice mail plan) tienen menor tasa de deserción.

In [12]:
# Solución propuesta
#Calculo de porcentaje de clientes desertores
clientes_desertores = df1['churn'].sum()
porcentaje_desertores = (clientes_desertores / len(df1)) * 100

print("El total de clientes es: ", len(df1))
print("El total de clientes desertores es: ",clientes_desertores)
print("El porcentaje de clientes desertores es: ",round(porcentaje_desertores, 2), "%")


El total de clientes es:  3333
El total de clientes desertores es:  483
El porcentaje de clientes desertores es:  14.49 %


In [13]:
# Identifica si los clientes con plan internacional (international plan) tienen mayor tasa de deserción.
# determinamos el total de clientes con plan internacional
clientes_int = (df1['international plan'] == "yes").sum()
print("Clientes con plan internacional: ",clientes_int)
clientes_noint = (df1['international plan'] == "no").sum()
print("Clientes sin plan internacional: ",clientes_noint)

# determinamos de estos clientes cuantos han desertado y cuantos no
clientes_int_desertores = ((df1['international plan'] == "yes") & (df1['churn'] == True)).sum()
clientes_int_nodesertores = ((df1['international plan'] == "yes") & (df1['churn'] == False)).sum()
clientes_noint_desertores = ((df1['international plan'] == "no") & (df1['churn'] == True)).sum()
clientes_noint_nodesertores = ((df1['international plan'] == "no") & (df1['churn'] == False)).sum()

print("\nClientes con plan internacional y desertores: ",clientes_int_desertores)
print("Clientes con plan internacional y no desertores: ",clientes_int_nodesertores)
print("Clientes sin plan internacional y desertores: ",clientes_noint_desertores)
print("Clientes sin plan internacional y no desertores: ",clientes_noint_nodesertores)

# Determinamos el % de deserción para clientes inter y no inter
tasa_int_desert = (clientes_int_desertores / clientes_int) * 100
print("\nTasa de desertores con plan internacional: ",round(tasa_int_desert, 2), "%")
tasa_noint_desert = (clientes_noint_desertores / clientes_noint) * 100
print("Tasa de desertores sin plan internacional: ",round(tasa_noint_desert, 2), "%")

if tasa_int_desert > tasa_noint_desert:
  print("\nLos clientes con plan internacional tienen mayor tasa de deserción")
else:
  print("\nLos clientes sin plan internacional tienen mayor tasa de deserción")

Clientes con plan internacional:  323
Clientes sin plan internacional:  3010

Clientes con plan internacional y desertores:  137
Clientes con plan internacional y no desertores:  186
Clientes sin plan internacional y desertores:  346
Clientes sin plan internacional y no desertores:  2664

Tasa de desertores con plan internacional:  42.41 %
Tasa de desertores sin plan internacional:  11.5 %

Los clientes con plan internacional tienen mayor tasa de deserción


In [14]:
# Identifica si los clientes con buzón de voz (voice mail plan) tienen menor tasa de deserción.
  # determinamos el total de clientes con buzon de voz
clientes_buzon = (df1['voice mail plan'] == "yes").sum()
print("Clientes con buzon de voz: ",clientes_buzon)
clientes_nobuzon = (df1['voice mail plan'] == "no").sum()
print("Clientes sin buzon de voz: ",clientes_nobuzon)

# determinamos de estos clientes cuantos han desertado y cuantos no
clientes_buzon_desertores = ((df1['voice mail plan'] == "yes") & (df1['churn'] == True)).sum()
clientes_buzon_nodesertores = ((df1['voice mail plan'] == "yes") & (df1['churn'] == False)).sum()
clientes_nobuzon_desertores = ((df1['voice mail plan'] == "no") & (df1['churn'] == True)).sum()
clientes_nobuzon_nodesertores = ((df1['voice mail plan'] == "no") & (df1['churn'] == False)).sum()

print("\nClientes con buzon de voz y desertores: ",clientes_buzon_desertores)
print("Clientes con buzon de voz y no desertores: ",clientes_buzon_nodesertores)
print("Clientes sin buzon de voz y desertores: ",clientes_nobuzon_desertores)
print("Clientes sin buzon de voz y no desertores: ",clientes_nobuzon_nodesertores)

# Determinamos el % de deserción para clientes buzon y no buzon
tasa_buzon_desert = (clientes_buzon_desertores / clientes_buzon) * 100
print("\nTasa de desertores con plan buzon de voz: ",round(tasa_buzon_desert, 2), "%")
tasa_nobuzon_desert = (clientes_nobuzon_desertores / clientes_nobuzon) * 100
print("Tasa de desertores sin plan buzon de voz: ",round(tasa_nobuzon_desert, 2), "%")

if tasa_buzon_desert > tasa_nobuzon_desert:
  print("\nLos clientes con plan buzon de voz tienen mayor tasa de deserción")
else:
  print("\nLos clientes sin plan buzon de voz tienen mayor tasa de deserción")

Clientes con buzon de voz:  922
Clientes sin buzon de voz:  2411

Clientes con buzon de voz y desertores:  80
Clientes con buzon de voz y no desertores:  842
Clientes sin buzon de voz y desertores:  403
Clientes sin buzon de voz y no desertores:  2008

Tasa de desertores con plan buzon de voz:  8.68 %
Tasa de desertores sin plan buzon de voz:  16.72 %

Los clientes sin plan buzon de voz tienen mayor tasa de deserción


**Análisis de la Duración del Servicio y Deserción**

¿Cuál es la duración promedio de la cuenta (account length) entre clientes que desertaron y los que permanecen?

¿Los clientes con cuentas más antiguas tienen más probabilidades de desertar?

In [15]:
# ¿Cuál es la duración promedio de la cuenta (account length) entre clientes que desertaron y los que permanecen?

# Asignamos a una variable el valor del promedio para los elementos filtrado por desertores
promedio_desertores = df1[df1['churn'] == True]['account length'].mean()
print("El promedio de cuenta de clientes que desertaron es: ",round(promedio_desertores, 2))

# Asignamos a una variable el valor del promedio para los elementos filtrado por no desertores
promedio_no_desertores = df1[df1['churn'] == False]['account length'].mean()
print("El promedio de cuenta de clientes que permanecen es: ",round(promedio_no_desertores, 2))


El promedio de cuenta de clientes que desertaron es:  102.66
El promedio de cuenta de clientes que permanecen es:  100.79


In [16]:
# Determinar el punto de corte para cuentas antiguas y nuevas (usando la media)
threshold = df1["account length"].mean()

# Calcular la probabilidad de deserción de clientes antiguos y nuevos
churn_rate_old = df1[df1["account length"] >= threshold]["churn"].mean() * 100
churn_rate_new = df1[df1["account length"] < threshold]["churn"].mean() * 100

# Imprimir resultados específicos
print(f"\nProbabilidad de deserción en clientes con cuentas más antiguas: {churn_rate_old:.2f}%")
print(f"Probabilidad de deserción en clientes con cuentas más nuevas: {churn_rate_new:.2f}%")


Probabilidad de deserción en clientes con cuentas más antiguas: 14.98%
Probabilidad de deserción en clientes con cuentas más nuevas: 14.03%


**Relación entre Deserción y Uso del Servicio**

Compara la cantidad de minutos usados en llamadas diurnas (total day minutes) entre clientes con y sin churn.

Compara la cantidad de minutos usados en llamadas nocturnas (total night minutes).

Compara el número total de llamadas (total day calls) entre clientes con y sin churn.

In [17]:
# Compara la cantidad de minutos usados en llamadas diurnas (total day minutes) entre clientes con y sin churn

# Asignamos a una variable el total de minutos para los elementos filtrado por desertores
total_minutos_desertores = df1[df1['churn'] == True]['total day minutes'].sum()
print("El total de minutos usados por clientes que desertaron es: ",round(total_minutos_desertores, 2))
total_minutos_no_desertores = df1[df1['churn'] == False]['total day minutes'].sum()
print("El total de minutos usados por clientes que permanecen es: ",round(total_minutos_no_desertores, 2))

if total_minutos_desertores > total_minutos_no_desertores:
  print("\nLos clientes que desertaron tienen más minutos usados en llamadas diurnas")
else:
  print("\nLos clientes que permanecen tienen más minutos usados en llamadas diurnas")

El total de minutos usados por clientes que desertaron es:  99939.5
El total de minutos usados por clientes que permanecen es:  499250.9

Los clientes que permanecen tienen más minutos usados en llamadas diurnas


In [18]:
# Compara la cantidad de minutos usados en llamadas nocturnas (total night minutes) entre clientes con y sin churn

total_minutos_nocturnos_desertores = df1[df1['churn'] == True]['total night minutes'].sum()
print("El total de minutos usados por clientes que desertaron en llamadas nocturnas es: ",round(total_minutos_nocturnos_desertores, 2))
total_minutos_nocturnos_no_desertores = df1[df1['churn'] == False]['total night minutes'].sum()
print("El total de minutos usados por clientes que permanecen en llamadas nocturnas es: ",round(total_minutos_nocturnos_no_desertores, 2))

if total_minutos_nocturnos_desertores > total_minutos_nocturnos_no_desertores:
  print("\nLos clientes que desertaron tienen más minutos usados en llamadas nocturnas")
else:
  print("\nLos clientes que permanecen tienen más minutos usados en llamadas nocturnas")

El total de minutos usados por clientes que desertaron en llamadas nocturnas es:  99126.9
El total de minutos usados por clientes que permanecen en llamadas nocturnas es:  570379.6

Los clientes que permanecen tienen más minutos usados en llamadas nocturnas


In [19]:
# Compara el número total de llamadas (total day calls) entre clientes con y sin churn.
total_daycalls_desertores = df1[df1['churn'] == True]['total day calls'].sum()
print("El total de llamadas diurnas por clientes que desertaron es: ", total_daycalls_desertores)
total_daycalls_no_desertores = df1[df1['churn'] == False]['total day calls'].sum()
print("El total de llamadas diurnas por clientes que permanecen es: ", total_daycalls_no_desertores)

El total de llamadas diurnas por clientes que desertaron es:  48945
El total de llamadas diurnas por clientes que permanecen es:  285807


**Impacto de las Llamadas al Servicio al Cliente en la Deserción**

Calcula el número promedio de llamadas al servicio al cliente (customer service calls) entre clientes que desertaron y los que no.

Divide los clientes en dos grupos:

- Grupo 1: Clientes que llamaron más de 3 veces al servicio al cliente.
- Grupo 2: Clientes que llamaron 3 veces o menos.
Compara la tasa de churn entre ambos grupos.

In [20]:
# Calcula el número promedio de llamadas al servicio al cliente (customer service calls) entre clientes que desertaron y los que no.

# Asignamos a una variable el valor del promedio para los elementos filtrado por desertores
promedio_desertores_calls = df1[df1['churn'] == True]['customer service calls'].mean()
print("El promedio de llamadas de servicio al cliente que desertaron es: ",round(promedio_desertores_calls, 2), "llamadas")

# Asignamos a una variable el valor del promedio para los elementos filtrado por no desertores
promedio_nodesertores_calls = df1[df1['churn'] == False]['customer service calls'].mean()
print("El promedio de llamadas de servicio al cliente que no desertaron es: ",round(promedio_nodesertores_calls, 2), "llamadas")

El promedio de llamadas de servicio al cliente que desertaron es:  2.23 llamadas
El promedio de llamadas de servicio al cliente que no desertaron es:  1.45 llamadas


In [21]:
# Divide los clientes en dos grupos:

# Grupo 1: Clientes que llamaron más de 3 veces al servicio al cliente.
# Grupo 2: Clientes que llamaron 3 veces o menos. Compara la tasa de churn entre ambos grupos.

# determinamos el numero de clientes por grupo
clientes_grupo_1 = (df1['customer service calls'] > 3).sum()
print("Clientes que llamaron más de 3 veces (grupo 1) al servicio al cliente: ",clientes_grupo_1,)
clientes_grupo_2 = (df1['customer service calls'] <= 3).sum()
print("Clientes que llamaron 3 veces o menos (grupo 2) al servicio al cliente: ",clientes_grupo_2,)

# determinamos el numero de clientes desertores por grupo
clientes_grupo_1_desertores = ((df1['customer service calls'] > 3) & (df1['churn'] == True)).sum()
clientes_grupo_2_desertores = ((df1['customer service calls'] <= 3) & (df1['churn'] == True)).sum()
print("\nClientes que llamaron más de 3 veces (grupo 1) al servicio al cliente y desertaron: ",clientes_grupo_1_desertores,)
print("Clientes que llamaron 3 veces o menos (grupo 2) al servicio al cliente y desertaron: ",clientes_grupo_2_desertores,)

#determinamos la tasa de desercion por grupo
tasa_grupo_1 = (clientes_grupo_1_desertores / clientes_grupo_1) * 100
tasa_grupo_2 = (clientes_grupo_2_desertores / clientes_grupo_2) * 100
print("\nTasa de desertores grupo 1: ",round(tasa_grupo_1, 2), "%")
print("Tasa de desertores grupo 2: ",round(tasa_grupo_2, 2), "%")

if tasa_grupo_1 > tasa_grupo_2:
  print("\nEl grupo 1 tiene mayor tasa de deserción")
else:
  print("\nEl grupo 2 tiene mayor tasa de deserción")


Clientes que llamaron más de 3 veces (grupo 1) al servicio al cliente:  267
Clientes que llamaron 3 veces o menos (grupo 2) al servicio al cliente:  3066

Clientes que llamaron más de 3 veces (grupo 1) al servicio al cliente y desertaron:  138
Clientes que llamaron 3 veces o menos (grupo 2) al servicio al cliente y desertaron:  345

Tasa de desertores grupo 1:  51.69 %
Tasa de desertores grupo 2:  11.25 %

El grupo 1 tiene mayor tasa de deserción


**Análisis del Costo de las Llamadas y Churn**

Compara el costo total de llamadas diurnas (total day charge) entre clientes con y sin churn.

Compara el costo total de llamadas nocturnas (total night charge).

¿Los clientes con mayor gasto en llamadas internacionales (total intl charge) tienen más probabilidades de desertar?

In [22]:
# Solución propuesta

# Compara el costo total de llamadas diurnas (total day charge) entre clientes con y sin churn.

#calculamos el costo total de llamadas para clientes desertores
costo_llamadas_diurnas_desertores = df1[df1['churn'] == True]['total day charge'].sum()
print("El costo total de llamadas diurnas por clientes que desertaron es: $",round(costo_llamadas_diurnas_desertores, 2))

#calculamos el costo total de llamadas para clientes no desertores
costo_llamadas_diurnas_no_desertores = df1[df1['churn'] == False]['total day charge'].sum()
print("El costo total de llamadas diurnas por clientes que permanecen es: $",round(costo_llamadas_diurnas_no_desertores, 2))

#hacemos la comparación y determinamos que grupo de clientes gasto mas en llamadas diurnas
if costo_llamadas_diurnas_desertores > costo_llamadas_diurnas_no_desertores:
  print("\nLos clientes que desertaron tienen más gasto en llamadas diurnas")
else:
  print("\nLos clientes que permanecen tienen más gasto en llamadas diurnas")


El costo total de llamadas diurnas por clientes que desertaron es: $ 16989.97
El costo total de llamadas diurnas por clientes que permanecen es: $ 84874.2

Los clientes que permanecen tienen más gasto en llamadas diurnas


In [23]:
# Compara el costo total de llamadas nocturnas (total night charge).

costo_llamadas_nocturnas_desertores = df1[df1['churn'] == True]['total night charge'].sum()
print("El costo total de llamadas nocturnas por clientes que desertaron es: $",round(costo_llamadas_nocturnas_desertores, 2))
costo_llamadas_nocturnas_no_desertores = df1[df1['churn'] == False]['total night charge'].sum()
print("El costo total de llamadas nocturnas por clientes que permanecen es: $",round(costo_llamadas_nocturnas_no_desertores, 2))

if costo_llamadas_nocturnas_desertores > costo_llamadas_nocturnas_no_desertores:
  print("\nLos clientes que desertaron tienen más gasto en llamadas nocturnas")
else:
  print("\nLos clientes que permanecen tienen más gasto en llamadas nocturnas")

El costo total de llamadas nocturnas por clientes que desertaron es: $ 4460.76
El costo total de llamadas nocturnas por clientes que permanecen es: $ 25667.31

Los clientes que permanecen tienen más gasto en llamadas nocturnas


In [24]:
# Solución propuesta ELP
# Costo total de llamadas diurnas para clientes que desertaron y los que no
costo_total_diurnas_desertores = df1[df1['churn']]['total day charge'].sum()
costo_total_diurnas_no_desertores = df1[~df1['churn']]['total day charge'].sum()

# Costo total de llamadas nocturnas
costo_total_nocturnas_desertores = df1[df1['churn']]['total night charge'].sum()
costo_total_nocturnas_no_desertores = df1[~df1['churn']]['total night charge'].sum()

# Costo total de llamadas internacionales
costo_total_intl_desertores = df1[df1['churn']]['total intl charge'].sum()
costo_total_intl_no_desertores = df1[~df1['churn']]['total intl charge'].sum()

#  Mostramos los resultados de manera clara
print("\n Costo total de llamadas diurnas:")
print(f"   - Clientes que desertaron: ${costo_total_diurnas_desertores:.2f}")
print(f"   - Clientes que permanecen: ${costo_total_diurnas_no_desertores:.2f}")

print("\n Costo total de llamadas nocturnas:")
print(f"   - Clientes que desertaron: ${costo_total_nocturnas_desertores:.2f}")
print(f"   - Clientes que permanecen: ${costo_total_nocturnas_no_desertores:.2f}")

print("\n Costo total de llamadas internacionales:")
print(f"   - Clientes que desertaron: ${costo_total_intl_desertores:.2f}")
print(f"   - Clientes que permanecen: ${costo_total_intl_no_desertores:.2f}")

# Análisis de gasto en llamadas diurnas
if costo_total_diurnas_desertores > costo_total_diurnas_no_desertores:
    print("\n Los clientes que desertaron generaron un MAYOR costo total en llamadas diurnas.")
else:
    print("\n Los clientes que permanecen generaron un MAYOR costo total en llamadas diurnas.")

# Análisis de gasto en llamadas nocturnas
if costo_total_nocturnas_desertores > costo_total_nocturnas_no_desertores:
    print("\n Los clientes que desertaron generaron un MAYOR costo total en llamadas nocturnas.")
else:
    print("\n Los clientes que permanecen generaron un MAYOR costo total en llamadas nocturnas.")

# Análisis de gasto en llamadas internacionales
if costo_total_intl_desertores > costo_total_intl_no_desertores:
    print("\n Los clientes con MAYOR gasto en llamadas internacionales tienen más probabilidades de desertar.")
else:
    print("\n Los clientes con MENOR gasto en llamadas internacionales tienen más probabilidades de desertar.")


 Costo total de llamadas diurnas:
   - Clientes que desertaron: $16989.97
   - Clientes que permanecen: $84874.20

 Costo total de llamadas nocturnas:
   - Clientes que desertaron: $4460.76
   - Clientes que permanecen: $25667.31

 Costo total de llamadas internacionales:
   - Clientes que desertaron: $1395.65
   - Clientes que permanecen: $7818.70

 Los clientes que permanecen generaron un MAYOR costo total en llamadas diurnas.

 Los clientes que permanecen generaron un MAYOR costo total en llamadas nocturnas.

 Los clientes con MENOR gasto en llamadas internacionales tienen más probabilidades de desertar.
