## Análisis del Porcentaje de Clientes por Campaña

En este análisis utilizaremos SQL para calcular el porcentaje de clientes que realizaron compras en cada campaña. El término **CMP** en marketing hace referencia a **"Campaign"** o **"Campaña"**.

### Detalles del Dataset

- Cada columna relacionada con una campaña tiene un valor **booleano**: 
  - **1** indica que el cliente compró durante esa campaña.
  - **0** indica que no realizó ninguna compra.

### Importancia

Este análisis nos ayuda a:
1. **Medir la efectividad de cada campaña.**
2. **Identificar tendencias en el comportamiento de los clientes.**
3. **Mejorar estrategias futuras basadas en datos concretos.**

El objetivo es optimizar el impacto de las campañas y maximizar el retorno de inversión (ROI).



In [None]:
# instalaremos duckdb para conectarnos a  la base de datos que creamos gracias a los scripts
# y usaremos pandas para visualizar los datos en formato de dataframe.
%pip install duckdb
%pip install pandas

In [2]:
# impotamos duckdb y mos conectamos a la db
import duckdb
conexion = duckdb.connect(database=r'D:\proyectos de codigo\ddb project\Data\base_de_datos.duckdb') 

In [7]:
# Consulta SQL para obtener:
# 1. Número de clientes que compraron en la primera campaña (AcceptedCmp1 = 1).
# 2. Porcentaje de compradores respecto al total de clientes registrados.
# Repetiremos este análisis para las demás campañas (AcceptedCmp2, AcceptedCmp3, etc.).
cmp1_porcentaje_total = conexion.execute("SELECT COUNT(AcceptedCmp1) AS total_compradores_primera_campaña, (CAST(COUNT(AcceptedCmp1) AS FLOAT) / (SELECT COUNT(*) FROM clientes)) * 100 AS porcentaje_compraron_primera_campaña FROM clientes WHERE AcceptedCmp1 = 1").fetchdf()
print(cmp1_porcentaje_total)

   total_compradores_primera_campaña  porcentaje_compraron_primera_campaña
0                                144                              6.428572


In [11]:
# Analizamos la segunda campaña
# El desempeño de esta campaña fue peor que el de la primera, 
# ya que menos personas aceptaron comprar. Continuemos con el análisis.
cmp2_porcentaje_total = conexion.execute("SELECT COUNT(AcceptedCmp2) AS total_compradores_segunda_campaña, (CAST(COUNT(AcceptedCmp2) AS FLOAT) / (SELECT COUNT(*) FROM clientes)) * 100 AS porcentaje_compraron_segunda_campaña FROM clientes WHERE AcceptedCmp2 = 1").fetchdf()
print(cmp2_porcentaje_total)

   total_compradores_segunda_campaña  porcentaje_compraron_segunda_campaña
0                                 30                              1.339286


In [3]:
# En esta campaña (tercera), mejoramos el rendimiento con un 7% de aceptación.
# Calculamos el porcentaje de personas que aceptaron la oferta en esta campaña.
cmp3_porcentaje_total = conexion.execute("SELECT COUNT(AcceptedCmp3) AS total_compradores_tercera_campaña, (CAST(COUNT(AcceptedCmp3) AS FLOAT) / (SELECT COUNT(*) FROM clientes)) * 100 AS porcentaje_compraron_tercera_campaña FROM clientes WHERE AcceptedCmp3 = 1").fetchdf()
print(cmp3_porcentaje_total)

   total_compradores_tercera_campaña  porcentaje_compraron_tercera_campaña
0                                163                              7.276785


In [4]:
# En la cuarta campaña, logramos un rendimiento superior, con más personas comprando.
# La tasa de aceptación de esta campaña es cerca del 7.50%, lo que es muy cercano a la tercera campaña.
cmp4_porcentaje_total = conexion.execute("SELECT COUNT(AcceptedCmp4) AS total_compradores_cuarta_campaña, (CAST(COUNT(AcceptedCmp4) AS FLOAT) / (SELECT COUNT(*) FROM clientes)) * 100 AS porcentaje_compraron_cuarta_campaña FROM clientes WHERE AcceptedCmp4 = 1").fetchdf()
print(cmp4_porcentaje_total)

   total_compradores_cuarta_campaña  porcentaje_compraron_cuarta_campaña
0                               167                             7.455357


In [5]:
# Observamos que los valores de la quinta campaña son casi idénticos a los de la tercera campaña. 
# Este hallazgo es relevante y debe ser comunicado al equipo de marketing.
cmp5_porcentaje_total = conexion.execute("SELECT COUNT(AcceptedCmp5) AS total_compradores_cuarta_campaña, (CAST(COUNT(AcceptedCmp5) AS FLOAT) / (SELECT COUNT(*) FROM clientes)) * 100 AS porcentaje_compraron_cuarta_campaña FROM clientes WHERE AcceptedCmp5 = 1").fetchdf()
print(cmp5_porcentaje_total)

   total_compradores_cuarta_campaña  porcentaje_compraron_cuarta_campaña
0                               163                             7.276785


In [7]:
# Creamos un ranking con las 5 campañas, ordenando por total de compradores
ranking_cmp = conexion.execute("SELECT 'Primera Campaña' AS campaña, 144 AS total_compradores UNION ALL SELECT 'Segunda Campaña', 30 UNION ALL SELECT 'Tercera Campaña', 163 UNION ALL SELECT 'Cuarta Campaña', 167 UNION ALL SELECT 'Cuarta Campaña Repetida', 163 ORDER BY total_compradores DESC").fetchdf()
print(ranking_cmp)

                   campaña  total_compradores
0           Cuarta Campaña                167
1  Cuarta Campaña Repetida                163
2          Tercera Campaña                163
3          Primera Campaña                144
4          Segunda Campaña                 30
