### Habilidades demostradas en este proyecto
Conciencia del impacto en negocio: foco constante en la mejora de la eficiencia operativa y aumento de la retención de clientes

Conocimiento profundo del negocio y enfoque estratégico: formulación de preguntas clave alineadas con los objetivos empresariales para transformar datos en decisiones

Buenas prácticas en calidad, validación y gobernanza del dato: validación de consistencia, tratamiento de nulos y outliers, normalización y limpieza con enfoque en la integridad de la información

Automatización con inteligencia artificial: uso de IA para documentar procesos, asistir en tareas repetitivas y generar código, lo que permite centrar el esfuerzo en el análisis de valor

Mentalidad orientada a la optimización y al rendimiento: uso de funciones en python (optimización del tiempo), buenas prácticas en PowerBI y SQL (mejora del rendimiento).

Análisis exploratorio de datos (EDA)

Aplicación de un modelo de regresión logística en R con el objetivo de identificar los factores que más influyen en la pérdida de clientes, utilizando las librerías dplyr, broom, janitor y ggplot2. 

Diseño e implementación de una base de datos relacional en PostgreSQL

Consultas SQL orientadas al negocio

Visualización y storytelling con Power BI

ETL básico y modelado de datos

de datos a acciones de negocio: tabla acciones de negocio

Si se implementan las acciones de negocio propuestas Amazon Prime podría evitar la pérdida de más de 1.700 clientes y permitir a la empresa recuperar miles de euros en ingresos mensuales. 

---
## Historia del proyecto Amazon Prime. Detrás del abandono: lo que cuesta perder a un cliente


### **Contexto**

Amazon Prime es uno de los servicios de suscripción más utilizados a nivel mundial. Sin embargo, como en cualquier modelo basado en suscripción, la retención de clientes es un factor crítico para su rentabilidad y sostenibilidad. A medida que el mercado se vuelve más competitivo, entender por qué los clientes deciden cancelar su suscripción se ha vuelto más importante que nunca.

### **¿Cuál era el verdadero problema?**

Un análisis inicial de los datos reveló un problema alarmante: una parte significativa de los clientes de Amazon Prime está abandonando el servicio, especialmente durante los primeros meses de contratación. Además, existen ciertos patrones que se repiten en los clientes que se marchan, lo que sugiere que el abandono no es aleatorio, sino que responde a causas específicas que pueden ser abordadas.

### **¿Dónde estaba el origen del problema?**

Mediante el análisis exploratorio, visualizaciones interactivas y un modelo de regresión logística realizado en R, se detectaron los factores con mayor influencia en el abandono:

* Los **clientes con contrato mensual** tienen una tasa de abandono mucho mayor que aquellos con contratos de mayor duración.
* A partir de la **tercera llamada al servicio de atención al cliente**, el abandono es casi inevitable.
* Los **clientes sin plan familiar** presentan mayor propensión a cancelar el servicio.
* Los **descuentos aplicados** no están funcionando para reducir el abandono.


### **Soluciones propuestas**

Basado en los datos y en los patrones detectados, se propusieron acciones específicas orientadas a reducir el abandono como, entre otras:

1. **Fomentar contratos de largo plazo**, con beneficios como descuentos o servicios exclusivos.
2. **Mejorar la eficiencia del soporte**, resolviendo los problemas en las primeras llamadas.
3. **Incentivar planes familiares**, que han demostrado una tasa de retención mucho mayor.
4. **Rediseñar la estrategia de descuentos**, redirigiendo el esfuerzo a acciones que generen verdadero compromiso.
5. **Reforzar la experiencia inicial del cliente**, con onboarding personalizado, tutoriales y seguimiento proactivo.

La acción más recomendable es reforzar la experiencia inicial del cliente con un onboarding proactivo. Esto significa acompañar al usuario desde el primer día, anticipándose a sus dudas y guiándole para que entienda el valor del servicio desde el inicio. Los datos muestran que la mayoría de cancelaciones ocurren en los primeros tres meses, por lo que actuar en esa fase es clave para reducir el abandono.

Dentro del onboarding, una de las acciones más efectivas es invitar a activar el plan familiar, ya que los clientes que lo utilizan presentan una tasa de abandono muy baja. Por ello, se considera también la segunda acción más recomendada.



### **Consecuencias de no actuar**

Si no se aplican estas soluciones, el servicio seguirá perdiendo cientos de clientes al mes, lo que implica pérdidas considerables en ingresos recurrentes y un impacto negativo en la imagen de marca. El modelo predictivo mostró que solo en tres segmentos críticos (contrato mensual, sin plan familiar y 3+ llamadas al soporte) se podrían estar perdiendo más de **1.700 clientes al año** que serían recuperables con las acciones adecuadas.


 ### **Beneficios de implementar las soluciones**

* **+1.700 clientes retenidos** con acciones dirigidas
* **Más de 65.000 € al mes en ingresos recuperables**, según el valor medio mensual por cliente
* Mejor experiencia del cliente, mayor fidelidad y valor de vida del usuario
* Uso más eficiente de recursos de soporte y marketing
* Imagen de marca reforzada gracias a la personalización y la atención a las necesidades reales del usuario


### **Conclusión**

Este proyecto demuestra que, con los datos adecuados y un análisis enfocado, es posible convertir patrones invisibles en acciones concretas de negocio. 
El análisis de datos no solo ha permitido identificar los factores de abandono, sino también proyectar el impacto de actuar sobre ellos. 

Implementar estas soluciones es una decisión estratégica con beneficios medibles y sostenibles a corto y largo plazo.


----
## Explicación del proceso técnico
### Herramientas utilizadas
- Python (Pandas, Numpy, psycopg2, matplotlib, seaborn)

- R (dplyr, janitor, broom, ggplot2)

- SQL (PostgreSQL)

- Power BI (Storytelling, Power Query, modelado, DAX)

- Inteligencia artificial (ChatGPT, algoritmos de aprendizaje)

- GitHub (mantenimiento en la nube)

- Jupyter Notebook

### ¿Cómo he realizado el proyecto?
Antes de comenzar el análisis, dediqué un tiempo a estudiar el contexto de la empresa, comprender sus necesidades reales, identificar claramente el problema y formular múltiples preguntas de negocio orientadas a posibles soluciones. También analicé los datos disponibles para asegurarme de que respondían a esos objetivos y ofrecían el potencial necesario para extraer valor.

**Python**: Limpieza, validación y análisis exploratorio.

Para optimizar tanto el tiempo como el rendimiento del desarrollo, el código ha sido modularizado en funciones dentro de un archivo src, que se importa en los notebooks correspondientes. Esto evita la duplicación de código y facilita su mantenimiento y reutilización. 

Comencé trabajando con Python, no solo para cargar y explorar los datos, sino para asegurarme de que todo lo que analizara fuera válido y coherente. Validé la calidad del dataset, normalicé formatos, detecté y traté outliers según el contexto del negocio, y gestioné los valores nulos de forma inteligente (explicado detalladamente en el enlace a GitHub). Esto no solo garantizó integridad técnica, sino también coherencia con la realidad operativa de la empresa.
Además, realicé un análisis exploratorio y detallado, tanto univariado como multivariado, relacionando variables clave para detectar patrones y descubrir insights relevantes. Estas relaciones fueron fundamentales encontrar oportunidades reales de mejora.

**R**: Modelo de regresión logística (dplyr, broom, janitor, ggplot2)

Desarrollé un modelo predictivo en R con el objetivo de identificar los factores que más influían en la pérdida de clientes. Incluí todas las variables relevantes como predictoras, tras una limpieza de datos y transformación de variables categóricas. Los coeficientes estadísticamente significativos fueron visualizados mediante un gráfico de barras para facilitar la interpretación del modelo.

Resultado: El modelo permitió detectar que variables como el tipo de contrato, el número de llamadas al soporte y la pertenencia a un plan familiar tienen un impacto claro sobre la probabilidad de abandono. Esta información fue clave para proponer acciones de retención concretas y orientar decisiones estratégicas.

**SQL (PostgreSQL)**:
Diseñé un modelo relacional en PostgreSQL que reflejara correctamente las relaciones entre las tablas del dataset. Una vez preparados y cargados los datos desde Python, comencé a realizar consultas SQL específicas para responder preguntas de negocio clave. Cada consulta estaba pensada para convertir información en decisiones prácticas y reproducir los principales insights del análisis exploratorio realizado previamente en Python.

**Power BI**:
En Power BI integré los datos directamente desde PostgreSQL, manteniendo la estructura relacional optimizada y evitando pasos intermedios innecesarios. Validé los datos en Power Query, creé relaciones en el modelado y desarrollé medidas DAX personalizadas para los KPIs seleccionados, así como una tabla calendario para el análisis temporal detallado.

Se desarrollaron tres dashboards principales:

Página 1 y página 2: Análisis de segmentos y factores

Página 3: Resumen ejecutivo
- Modelo predictivo (R): Los factores más determinantes en el abandono.
- Tabla resumen de patrones detectados, conclusiones y acciones de negocio recomendadas.

Se aplicó **storytelling visual** en los títulos de cada gráfico para guiar al lector, y se utilizó la paleta de colores corporativa.

Construí los dashboards con foco en:
- Responder directamente a preguntas clave del negocio
- Mostrar insights claros, rápidos y accionables
- Aplicar principios de visualización, jerarquía visual y atributos preatentivos para destacar los puntos más críticos.

Incorporé marcadores para alternar visualizaciones y para la navegación entre páginas, tooltips personalizados para mostrar información contextual sin saturar el panel, y visuales de alerta para indicadores críticos. El resultado es un dashboard preparado tanto para usuarios técnicos como perfiles de negocio, que facilita la toma de decisiones desde el primer vistazo.

A lo largo de todo el proceso también integré automatizaciones para tareas repetitivas, desde la generación asistida de funciones en Python hasta el uso de inteligencia artificial para documentar automáticamente cada paso, lo que permitió ahorrar tiempo y centrar los esfuerzos en descubrir oportunidades de negocio.

Todo el desarrollo técnico de este proyecto está documentado paso a paso en mi repositorio de GitHub.
Puedes acceder al código completo aquí: