# Predicción de Respuesta a una Campaña de Marketing

## Introducción
El presente dataset para la **Predicción de Respuesta a una Campaña de Marketing** es un conjunto de datos que simula un escenario de marketing directo, donde una empresa se comunica con clientes potenciales seleccionados previamente. El objetivo es identificar qué clientes tienen más probabilidades de responder positivamente a una campaña de marketing. El dataset incluye información demográfica y financiera de los clientes, como la edad, el puntaje de crédito, el estado civil, el tipo de residencia, los ingresos, la propiedad de vehículos, la historia crediticia, el historial de pagos y el estado de empleo.

La variable objetivo es **"resp"**, que es binaria e indica si un cliente respondió (1) o no (0) a la campaña. El análisis se centrará en identificar patrones en las características de los clientes que estén correlacionados con una mayor probabilidad de respuesta.

## Hipótesis
Es posible predecir con precisión la probabilidad de que un cliente responda a una campaña de marketing directo utilizando sus características demográficas, financieras y residenciales, así como su historial de crédito y comportamiento con la empresa.

## Objetivo
El objetivo de este proyecto es analizar los factores que influyen en la respuesta de los clientes a una campaña de marketing directo y, a partir de este análisis, desarrollar un modelo de aprendizaje automático que pueda predecir la probabilidad de que un cliente responda positivamente a la campaña.

### Preguntas clave a responder:

- ¿Qué características de los clientes están más correlacionadas con la probabilidad de respuesta?
- ¿Cómo afectan las variables demográficas y financieras a la respuesta de los clientes?
- ¿Es posible mejorar la eficiencia de las campañas de marketing directo mediante un modelo predictivo que identifique a los clientes más propensos a responder?


## Análisis de los datos
### Importación de las librerías requeridas

In [280]:
import pandas as pd
import numpy as np
from sklearn.preprocessing import LabelEncoder

### Lectura del dataset

In [281]:
df = pd.read_csv('https://raw.githubusercontent.com/garcia-damian/direct-mail-marketing/main/DirectMail.txt', sep='\t', engine='python')
df.head()

Unnamed: 0,AGE,CRED,MS,HEQ,INCOME,DEPC,MOB,MILEAGE,RESTYPE,GENDER,...,resp,female,HOME,CONDO,COOP,renter,emp1,emp2,msn,cuscode
0,20,543.0,U,0.1,20,N,Y,14.418,HOME,M,...,0,0,1,0,0,1,1,0,0,1
1,18,445.0,U,0.1,20,N,Y,0.311,HOME,M,...,0,0,1,0,0,1,0,0,0,2
2,19,423.0,U,0.1,20,N,N,17.876,HOME,M,...,0,0,1,0,0,1,1,0,0,3
3,18,416.0,X,0.1,20,N,Y,17.084,HOME,F,...,0,1,1,0,0,1,1,0,0,4
4,18,522.0,U,0.1,20,Y,Y,16.51,HOME,F,...,0,1,1,0,0,1,1,0,0,5


### Descripción de las columnas del dataset

- **AGE**: Edad del cliente (en años).
- **CRED**: Puntaje de crédito del cliente.
- **MS**: Estado civil (la codificación específica no está proporcionada, pero probablemente representa diferentes estados civiles).
- **HEQ**: Equidad en el hogar como porcentaje.
- **INCOME**: Ingreso del cliente (posiblemente en miles u otra unidad, pero no especificado).
- **DEPC**: Indicador de depreciación (Y/N), probablemente indica si el cliente tiene un activo que se deprecia.
- **MOB**: Indicador de cliente existente (Y/N), indica si la persona es un cliente actual.
- **MILEAGE**: Kilometraje del automóvil, posiblemente representando el kilometraje del vehículo del cliente.
- **RESTYPE**: Tipo de residencia, probablemente categorizando el tipo de residencia (por ejemplo, CASA, CONDOMINIO, etc.).
- **GENDER**: Género del cliente (M para Masculino, F para Femenino).
- **EMP_STA**: Estado del empleo, posiblemente indicando diferentes tipos o condiciones de empleo. Puede tomar tres valores: "0", "1,2" o "3+".
- **RES_STA**: Estado residencial, probablemente reflejando la estabilidad o el tipo de residencia.
- **DELINQ**: Estado de morosidad, indicando si el cliente tiene un historial de morosidad (por ejemplo, pagos atrasados).
- **NUMTR**: Número de operaciones activas, posiblemente representando el número de líneas de crédito o operaciones activas.
- **MRTGI**: Indicador de hipoteca (Y/N), indica si el cliente tiene una hipoteca.
- **MFDU**: Indicador de Unidad de Vivienda Multifamiliar, posiblemente indicando si el cliente vive en una unidad multifamiliar.
- **resp**: Indicador de respuesta (Y/N), indicando si el cliente respondió a una campaña de marketing.
- **female**: Indicador femenino, una bandera binaria que parece redundante dado que existe la columna GENDER.
- **HOME**: Indicador de propiedad (Y/N), muestra si el cliente es propietario de una casa.
- **CONDO**: Indicador de condominio (Y/N), indica si el cliente vive en un condominio.
- **COOP**: Indicador de cooperativa (Y/N), indica si el cliente vive en una unidad de vivienda cooperativa.
- **renter**: Indicador de alquiler de vivienda (Y/N), indica si el cliente alquila su residencia.
- **emp1**: Variable booleana indicando si EMP_STA es igual a "1,2".
- **emp2**: Variable booleana indicando si EMP_STA es igual a "3+".
- **msn**: Programa de Red de Seguridad Médica (Y/N), indicando si el cliente forma parte de un programa de red de seguridad médica.
- **cuscode**: Código de identificación del cliente, un identificador único para cada cliente.

In [282]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 29904 entries, 0 to 29903
Data columns (total 26 columns):
 #   Column   Non-Null Count  Dtype  
---  ------   --------------  -----  
 0   AGE      29904 non-null  int64  
 1   CRED     29871 non-null  float64
 2   MS       29904 non-null  object 
 3   HEQ      29904 non-null  float64
 4   INCOME   29904 non-null  int64  
 5   DEPC     29904 non-null  object 
 6   MOB      29904 non-null  object 
 7   MILEAGE  29904 non-null  float64
 8   RESTYPE  29904 non-null  object 
 9   GENDER   29904 non-null  object 
 10  EMP_STA  29904 non-null  object 
 11  RES_STA  29904 non-null  object 
 12  DELINQ   29904 non-null  int64  
 13  NUMTR    29904 non-null  int64  
 14  MRTGI    29904 non-null  object 
 15  MFDU     29904 non-null  int64  
 16  resp     29904 non-null  int64  
 17  female   29904 non-null  int64  
 18  HOME     29904 non-null  int64  
 19  CONDO    29904 non-null  int64  
 20  COOP     29904 non-null  int64  
 21  renter   299

### Data Wrangling
#### Eliminación de posibles duplicados
Se comprueba que no haya registros duplicados y se eliminan en caso de que sí.

In [283]:
print(df.shape)
df= df.drop_duplicates()
print(df.shape)

(29904, 26)
(29904, 26)


#### Columnas redundantes y sin valor agregado
- La columna 'renter' tiene un valor constante para todos los registros del dataset, por lo que no aporta ningún valor.
- La columna 'female' es redundante con la columna 'GENDER', de modo que también será eliminada.
- La columna 'cuscode' es un id y no aporta ningún valor al análisis, por lo que será eliminada.
- Si bien las columnas 'HOME', 'CONDO' y 'COOP' parecen ser redundantes con la columna 'RESTYPE', pueden ayudar a la performance de los modelos, por lo que no serán eliminadas aún.
- Lo mismo sucede entre las columnas 'emp1' y 'emp2' con respecto a la columna 'EMP_STA'.

In [284]:
df.drop(columns=['renter', 'female', 'cuscode'], inplace=True)
df.head()

Unnamed: 0,AGE,CRED,MS,HEQ,INCOME,DEPC,MOB,MILEAGE,RESTYPE,GENDER,...,NUMTR,MRTGI,MFDU,resp,HOME,CONDO,COOP,emp1,emp2,msn
0,20,543.0,U,0.1,20,N,Y,14.418,HOME,M,...,2,N,0,0,1,0,0,1,0,0
1,18,445.0,U,0.1,20,N,Y,0.311,HOME,M,...,2,Y,0,0,1,0,0,0,0,0
2,19,423.0,U,0.1,20,N,N,17.876,HOME,M,...,0,Y,0,0,1,0,0,1,0,0
3,18,416.0,X,0.1,20,N,Y,17.084,HOME,F,...,0,Y,0,0,1,0,0,1,0,0
4,18,522.0,U,0.1,20,Y,Y,16.51,HOME,F,...,0,Y,0,0,1,0,0,1,0,0


#### Tratamiento de nulos

In [285]:
df.isnull().sum()

AGE         0
CRED       33
MS          0
HEQ         0
INCOME      0
DEPC        0
MOB         0
MILEAGE     0
RESTYPE     0
GENDER      0
EMP_STA     0
RES_STA     0
DELINQ      0
NUMTR       0
MRTGI       0
MFDU        0
resp        0
HOME        0
CONDO       0
COOP        0
emp1        0
emp2        0
msn         0
dtype: int64

Dado que sólo hay 33 registros de los cuales no se conoce el puntaje crediticio del cliente, se imputará este valor con el promedio del dataset.

In [286]:
df['CRED'].fillna(df['CRED'].mean(), inplace=True)


A value is trying to be set on a copy of a DataFrame or Series through chained assignment using an inplace method.
The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.





#### Nombres y tipos de columnas
Por último, se renombrarán las columnas con nombres más representativos y se asignarán los tipos de datos correspondientes.

In [287]:
df = df.rename(columns={
    'AGE': 'Age',
    'CRED': 'CreditScore',
    'MS': 'MaritalStatus',
    'HEQ': 'HomeEquity',
    'INCOME': 'Income',
    'DEPC': 'Depreciation',
    'MOB': 'IsExistingCustomer',
    'MILEAGE': 'CarMileage',
    'RESTYPE': 'RealEstateType',
    'GENDER': 'Gender',
    'EMP_STA': 'EmplomentStatus',
    'RES_STA': 'ResidentialStatus',
    'DELINQ': 'DelinquencyStatus',
    'NUMTR': 'ActiveTrades',
    'MRTGI': 'Mortgage',
    'resp': 'Response',
    'HOME': 'Home',
    'CONDO': 'Condo',
    'COOP': 'Coop',
    'emp1': 'EmpSta1or2',
    'emp2': 'EmpSta3+',
    'msn': 'MedicalProgram'
})
df['MaritalStatus'] = df['MaritalStatus'].astype('category')
df['Depreciation'] = df['Depreciation'].astype('category')
df['IsExistingCustomer'] = df['IsExistingCustomer'].astype('category')
df['RealEstateType'] = df['RealEstateType'].astype('category')
df['Gender'] = df['Gender'].astype('category')
df['EmplomentStatus'] = df['EmplomentStatus'].astype('category')
df['ResidentialStatus'] = df['ResidentialStatus'].astype('category')
df['Mortgage'] = df['Mortgage'].astype('category')
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 29904 entries, 0 to 29903
Data columns (total 23 columns):
 #   Column              Non-Null Count  Dtype   
---  ------              --------------  -----   
 0   Age                 29904 non-null  int64   
 1   CreditScore         29904 non-null  float64 
 2   MaritalStatus       29904 non-null  category
 3   HomeEquity          29904 non-null  float64 
 4   Income              29904 non-null  int64   
 5   Depreciation        29904 non-null  category
 6   IsExistingCustomer  29904 non-null  category
 7   CarMileage          29904 non-null  float64 
 8   RealEstateType      29904 non-null  category
 9   Gender              29904 non-null  category
 10  EmplomentStatus     29904 non-null  category
 11  ResidentialStatus   29904 non-null  category
 12  DelinquencyStatus   29904 non-null  int64   
 13  ActiveTrades        29904 non-null  int64   
 14  Mortgage            29904 non-null  category
 15  MFDU                29904 non-null  

In [288]:
df.describe()

Unnamed: 0,Age,CreditScore,HomeEquity,Income,CarMileage,DelinquencyStatus,ActiveTrades,MFDU,Response,Home,Condo,Coop,EmpSta1or2,EmpSta3+,MedicalProgram
count,29904.0,29904.0,29904.0,29904.0,29904.0,29904.0,29904.0,29904.0,29904.0,29904.0,29904.0,29904.0,29904.0,29904.0,29904.0
mean,49.300361,603.627364,38.328892,41.360688,11.803395,0.766152,0.763343,0.452749,0.095539,0.547251,0.018927,0.029595,0.907772,0.059858,0.575876
std,15.546298,98.082496,37.205701,15.441137,5.744523,1.140847,1.143284,0.497771,0.293963,0.497771,0.13627,0.169469,0.289353,0.237228,0.494218
min,18.0,300.0,0.1,20.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
25%,36.0,574.0,10.0,30.0,7.77575,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,0.0
50%,50.0,617.0,30.0,40.0,12.5365,0.0,0.0,0.0,0.0,1.0,0.0,0.0,1.0,0.0,1.0
75%,61.0,652.0,50.0,50.0,16.19325,1.0,1.0,1.0,0.0,1.0,0.0,0.0,1.0,0.0,1.0
max,90.0,1789.0,200.0,110.0,94.64,7.0,7.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0


### Visualización de los datos
#### Distribución de las edades de los clientes
El primer dato a analizar es la distribución de edades y género de los clientes. La distribución es algo peculiar, con un extraño valle entre los 30 y los 50 años. A nivel de género, parece estar distribuida  de forma pareja.

In [289]:
px.histogram(df, x='Age', color='Gender', title='Distribución de los clientes por edad y género')

Extrañamente, la columna HomeEquity no tiene ningún valor 100% y en su lugar tiene muchos registros con 200%, lo cual no tiene sentido, por lo que haremos la corrección.

In [290]:
# Reemplazar todos los valores 200 por 100 en la columna HomeEquity
df['HomeEquity'] = df['HomeEquity'].replace(200, 100)
print(df['HomeEquity'].describe())
fig = px.violin(df, y='HomeEquity', title='Violin plot del HomeEquity')
fig.update_layout(yaxis_title="HomeEquity (%)")

count    29904.000000
mean        35.322606
std         26.528719
min          0.100000
25%         10.000000
50%         30.000000
75%         50.000000
max        100.000000
Name: HomeEquity, dtype: float64


#### Análisis del puntaje crediticio de los clientes

In [291]:
px.box(df, y='CreditScore', points='all', color='Gender', title='Boxplot de CreditScore según género')

Los valores de CreditScore por encima de 1000 parecen un error ya que son un valor muy específico y son muy pocos casos. Los reemplazaremos con el valor máximo 1000.

In [292]:
# Reemplazar valores mayores a 1000 en la columna CreditScore por 1000
df['CreditScore'] = df['CreditScore'].apply(lambda x: 1000 if x > 1000 else x)
print(df['CreditScore'].describe())
px.box(df, y='CreditScore', points='all', color='Gender', title='Boxplot de CreditScore según género')

count    29904.000000
mean       603.205213
std         94.616280
min        300.000000
25%        574.000000
50%        617.000000
75%        652.000000
max       1000.000000
Name: CreditScore, dtype: float64


#### Distribución del millaje de los vehículos de los clientes discriminados por género
La gran mayoría de los clientes (tanto hombres como mujeres) parecen tener vehículos con menos de 20.000 millas de rodaje.

In [293]:
fig = px.box(df, 
             y='CarMileage', 
             points='all', 
             color='Gender', 
             title='Boxplot de CarMileage según género')

fig.update_layout(
    yaxis_title="Car Mileage (thousands of miles)"  
)

fig.show()

#### Distribución de clientes existentes
Un 62% de los clientes ya ha realizado compras previas

In [294]:
fig = px.pie(df, 
             names='IsExistingCustomer',    
             title="Distribución de Clientes Existentes",  
             hole=0.3)  

fig.show()

#### Distribución de clientes que tienen hipotecas a su nombre
Aproximadamente un tercio de los clientes tienen hipotecas a su nombre.

In [295]:
fig = px.pie(df, 
             names='Mortgage',    
             title="Distribución de Mortgage",  
             hole=0.3)  

fig.show()

#### Histograma de respuestas positivas discriminadas por género
Ahora vamos a centrarnos en los clientes que respondieron positivamente a la campaña de email marketing. Primero realizaremos un histograma de sus edades discriminadas por género. La mayoría se encuentran entre los 25 y los 30 años, o entre los 50 y los 65.

In [296]:
px.histogram(df, x='Age', y='Response', color='Gender', title='Distribución de respuestas positivas según edad y género')

#### Distribución de clientes según su tipo de vivienda, discriminados por respuesta a la campaña
La gran mayoría de los clientes viven en casas, tanto propias como alquiladas.

In [297]:
px.histogram(df, x='RealEstateType', color='Response', title='Distribución de las respuestas por RealEstateType')

#### Distribución de clientes por estado civil, discriminados por respuesta a la campaña

Si bien el dataset no lo especifica, se asume que los posibles valores de la columna MaritalStatus son:

- M: Married (casado)
- X: Divorced o widowed (divorciado o viudo)
- U: Unknown (desconocido) 

In [298]:
px.histogram(df, x='MaritalStatus', color='Response', title='Distribución de las respuestas por MaritalStatus')

#### Distribución de la cantidad de líneas de crédito activas por usuario en relación a su respuesta a la campaña
Los clientes que respondieron a la campaña parecen tener una leve tendencia a tener más líneas de crédito activas que los que no respondieron.

In [299]:
px.box(df, y='ActiveTrades', color='Response', title='Boxplot de ActiveTrades discriminados por tipo de respuesta')



#### Scatterplot de los usuarios que respondieron a la campaña, en relación a sus ingresos y su puntaje crediticio
La mayor concentración de clientes que respondieron a la campaña parece tener un ingreso anual entre los 20 y los 50 mil dólares y un puntaje crediticio que va desde los 550 hasta los 680 puntos

In [300]:
# Agrupamos los datos por 'Income' y 'CreditScore' y contamos las respuestas positivas
df_grouped = df[df['Response'] == 1].groupby(['Income', 'CreditScore']).size().reset_index(name='Response')

fig = px.scatter(df_grouped, 
                 y="Income", 
                 x="CreditScore",
                 size="Response",     
                 size_max=30,            
                 opacity=0.3,                          
                 )         
fig.update_layout(
    title="Distribución de respuestas positivas según Income y CreditScore",
    yaxis_title="Income (thousands of dollars per year)"  
)

# Eliminamos el borde blanco de las burbujas
fig.update_traces(marker=dict(line=dict(width=0)))   
fig.show()

#### Scatterplot de los usuarios que respondieron a la campaña en relación a su registro de delitos y el millaje de su vehículo
Otras dos variables interesantes a analizar pueden ser el millaje de los vehículos y el registro delictivo de los clientes que respondieron a la campaña. La gran mayoría parece tener un registro delictivo menor o igual a 4 y vehículos con menos de 20 mil millas de rodaje.

In [301]:
# Agrupamos los datos por 'CarMileage' y 'DelinquencyStatus' y contamos las respuestas positivas
df_grouped = df[df['Response'] == 1].groupby(['CarMileage', 'DelinquencyStatus']).size().reset_index(name='Response')

fig = px.scatter(df_grouped, 
                 y="CarMileage", 
                 x="DelinquencyStatus",
                 size="Response",     
                 size_max=10,           
                 opacity=0.3,                           
                 )         
fig.update_layout(
    title="Distribución de respuestas positivas según CarMileage y DelinquencyStatus",
    yaxis_title="Car Mileage (thousands of miles)"  
)

# Eliminamos el borde blanco de las burbujas
fig.update_traces(marker=dict(line=dict(width=0)))   
fig.show()

### Matriz de correlación

Finalmente, evaluaremos la correlación lineal entre todas las variables del dataset con una matriz de correlación

In [302]:
# Copia del DataFrame
df_encoded = df.copy()

# Codificamos las variables categóricas con LabelEncoder
label_encoders = {}
for column in df_encoded.select_dtypes(include=['category']).columns:
    label_encoders[column] = LabelEncoder()
    df_encoded[column] = label_encoders[column].fit_transform(df_encoded[column])

# Cálculo la matriz de correlación
corr_matrix = df_encoded.corr()
print(corr_matrix)

# Visualización
fig = px.imshow(corr_matrix, 
                text_auto=True, 
                labels=dict(color="Correlación"),
                color_continuous_scale="RdBu",
                x=corr_matrix.columns,
                y=corr_matrix.columns)

# Tamaño y la orientación de las etiquetas
fig.update_layout(
    title="Matriz de Correlación",
    width=800,  
    height=800,  
    xaxis=dict(tickangle=-45),  
    yaxis=dict(tickmode='linear')  
)

fig.show()



                         Age  CreditScore  MaritalStatus  HomeEquity  \
Age                 1.000000     0.194187       0.007672    0.241509   
CreditScore         0.194187     1.000000       0.002257    0.063622   
MaritalStatus       0.007672     0.002257       1.000000   -0.001216   
HomeEquity          0.241509     0.063622      -0.001216    1.000000   
Income              0.050044     0.019443      -0.013277   -0.005728   
Depreciation        0.005754     0.001696      -0.011167   -0.011134   
IsExistingCustomer -0.009979     0.005545      -0.014135   -0.002690   
CarMileage         -0.002332    -0.004864      -0.000444   -0.009735   
RealEstateType      0.010848    -0.000728      -0.001647    0.004305   
Gender              0.006071    -0.007157      -0.007137   -0.002339   
EmplomentStatus    -0.002432    -0.001735       0.001964   -0.004893   
ResidentialStatus  -0.006802     0.000182       0.002003    0.000052   
DelinquencyStatus  -0.001819    -0.000699       0.000360   -0.00

## Conclusiones y próximos pasos
A pesar de que el análisis exploratorio de datos no muestra correlaciones lineales fuertes entre la variable objetivo y las variables independientes, los resultados sugieren que la campaña de marketing tiene una mayor probabilidad de generar respuestas positivas en personas pertenecientes a ciertos segmentos. En particular, los individuos en determinadas franjas etarias, que viven en viviendas (ya sean de su propiedad o alquiladas), con un puntaje crediticio en el rango de 550 a 680 puntos, y con un ingreso anual entre 20.000 y 50.000 dólares, tienden a responder de manera más favorable a las campañas. Esto implica que ciertos factores demográficos y financieros pueden desempeñar un papel crucial en la efectividad de las campañas dirigidas.

Además, se detecta que los usuarios con un puntaje de delincuencia menor a 5, aquellos que están casados (MaritalStatus = M), y los que mantienen varias líneas de crédito activas (ActiveTrades) presentan una mayor propensión a participar y responder positivamente a las acciones de marketing, en comparación con aquellos que no comparten estas características. 

Sin embargo, se destaca un problema significativo en el conjunto de datos: existe un desbalance considerable en la distribución de la variable objetivo, con menos del 10% de las respuestas siendo positivas. 

De cara al futuro, es esencial abordar este desequilibrio antes de implementar modelos predictivos. Una posible estrategia sería el uso de técnicas de remuestreo, como undersampling de la clase mayoritaria, para equilibrar la distribución de las respuestas. Otra opción sería la implementación de algoritmos de clasificación robustos frente a datasets desbalanceados, tales como XGBoost o Random Forest con pesos ajustados para las clases. Además, se podría aplicar un enfoque basado en la optimización de métricas específicas para datasets desbalanceados, como el F1-score, que balancea precisión y sensibilidad.

En cuanto a los modelos predictivos, una opción viable es desarrollar una serie de modelos de clasificación, como regresión logística, árboles de decisión, o redes neuronales, para predecir la probabilidad de una respuesta positiva. Estos modelos pueden ajustarse para mejorar su rendimiento en un entorno de datos desbalanceados. También es recomendable realizar una validación cruzada y utilizar métricas como ROC-AUC y la curva Precision-Recall, para evaluar el desempeño de los modelos de forma más robusta.

Finalmente, implementar un modelo de regresión logística podría ser especialmente útil para entender mejor la relación entre las variables explicativas y la probabilidad de respuesta, dado que este tipo de modelo no solo proporciona predicciones, sino también coeficientes interpretables que permiten identificar cuáles son los factores más influyentes en la decisión de responder positivamente a la campaña de marketing. Con base en estos resultados, la empresa podría ajustar sus estrategias de marketing, focalizando sus esfuerzos en los segmentos de clientes con mayor probabilidad de responder favorablemente, optimizando así el uso de recursos y maximizando el retorno de la inversión.