# Análisis de Datos de Marketing
Este cuaderno realiza un análisis de datos básico utilizando un conjunto de datos de marketing de Kaggle. El análisis incluirá la carga de datos, la inspección y limpieza de datos, un análisis exploratorio de datos (EDA), y visualización de datos para comprender mejor las características del conjunto de datos y el comportamiento del cliente.

## 1. Carga de datos
Cargamos el conjunto de datos desde un archivo CSV en un DataFrame de pandas. Este conjunto de datos contiene información sobre las campañas de marketing y las respuestas de los clientes.

## 2. Inspección y limpieza de datos
Realizamos una inspección inicial de los datos para entender su estructura. Luego, revisamos y manejamos los valores faltantes o nulos.

## 3. Análisis exploratorio de datos (EDA)
Exploramos los datos estadísticamente y visualmente para identificar patrones o anomalías.

## 4. Visualización de datos
Visualizamos las relaciones entre diferentes variables para comprender mejor los datos y encontrar insights.

In [None]:
# Importar las bibliotecas necesarias
import pandas as pd
import matplotlib.pyplot as plt

In [None]:
# Reemplaza 'path_to_file.csv' con la ruta de tu archivo CSV
df = pd.read_csv('path_to_file.csv')

In [None]:
# Inspeccionar las primeras filas del DataFrame
print(df.head())

# Verificar la cantidad de valores nulos en cada columna
print(df.isnull().sum())

# Decidir una estrategia para manejar los valores nulos (por ejemplo, llenarlos con la media o mediana)
# df['column_with_nulls'] = df['column_with_nulls'].fillna(df['column_with_nulls'].mean())

In [None]:
# Estadísticas descriptivas de las variables numéricas
print(df.describe())

# Histograma de una variable numérica, por ejemplo 'Income'
df['Income'].hist(bins=50)
plt.title('Distribución de Ingresos')
plt.xlabel('Ingreso')
plt.ylabel('Frecuencia')
plt.show()

In [None]:
# Comparación de respuestas en campañas de marketing
campaign_cols = ['AcceptedCmp1', 'AcceptedCmp2', 'AcceptedCmp3', 'AcceptedCmp4', 'AcceptedCmp5', 'Response']
df[campaign_cols].sum().plot(kind='bar')
plt.title('Respuestas en Campañas de Marketing')
plt.xlabel('Campaña')
plt.ylabel('Número de Respuestas')
plt.show()