# 2.6 Segmentaci√≥n B√°sica

**Resumen Ejecutivo**: Agrupa clientes y productos en categor√≠as (alto/medio/bajo margen, ticket sobre promedio, RFM) para priorizar acciones comerciales y de producto.

---

## üéØ Objetivos de Aprendizaje
- Clasificar productos/clientes con `CASE` basado en m√©tricas (margen, ticket, frecuencia).
- Construir segmentaciones RFM simplificadas (Recency, Frequency, Monetary).
- Combinar m√©tricas y etiquetas para an√°lisis multi-dimensional.

## üß∞ Prerrequisitos
- Haber completado `05_kpis_avanzados.ipynb`.
- Dominar agregaciones, `CASE`, y CTEs.
- Comprender distribuciones y umbrales de negocio.

---

## üìö Conceptos Clave
- **Categorizaci√≥n**: `CASE` para etiquetar (ALTO/MEDIO/BAJO) basado en umbrales.
- **RFM**: Recency (√∫ltima compra), Frequency (d√≠as activos), Monetary (valor acumulado).
- **Segmentaci√≥n multi-nivel**: combinar dimensiones (segmento + categor√≠a margen).
- **Separaci√≥n m√©trica/etiqueta**: calcular primero, etiquetar despu√©s.

In [None]:
-- Segmento vs volumen de unidades
SELECT c.segmento, SUM(fv.cantidad) AS unidades
FROM dbo.fact_ventas fv
JOIN dbo.dim_clientes c ON fv.cliente_id = c.cliente_id
GROUP BY c.segmento;

In [None]:
-- Clasificaci√≥n simple de productos por margen (alto, medio, bajo)
SELECT producto_id, nombre,
       CASE WHEN (precio_unitario - costo_unitario) >= 30 THEN 'ALTO'
            WHEN (precio_unitario - costo_unitario) >= 15 THEN 'MEDIO'
            ELSE 'BAJO' END AS categoria_margen
FROM dbo.dim_productos;

---

## üß™ Ejercicios Guiados
- üü¢ Tabla derivada con unidades y margen por producto y categor√≠a de margen (ALTO/MEDIO/BAJO).
- üü† Clientes con ticket promedio > ticket promedio global (JOIN vs subconsulta con CTEs).
- üî¥ Crear segmentaci√≥n RFM simplificada (Recency, Frequency, Monetary) y asignar etiqueta compuesta.

In [None]:
WITH prod AS (
  SELECT p.producto_id, p.nombre, (p.precio_unitario - p.costo_unitario) AS margen_u,
         CASE WHEN (p.precio_unitario - p.costo_unitario) >= 30 THEN 'ALTO'
              WHEN (p.precio_unitario - p.costo_unitario) >= 15 THEN 'MEDIO'
              ELSE 'BAJO' END AS categoria_margen
  FROM dbo.dim_productos p
)
SELECT categoria_margen, SUM(fv.cantidad) AS unidades, SUM(fv.cantidad*margen_u) AS margen_total
FROM prod
LEFT JOIN dbo.fact_ventas fv ON prod.producto_id = fv.producto_id
GROUP BY categoria_margen;

In [None]:
WITH global AS (
  SELECT CAST(SUM(fv.cantidad*p.precio_unitario*(1 - fv.descuento_pct/100.0)) AS DECIMAL(10,2)) / COUNT(*) AS ticket_global
  FROM dbo.fact_ventas fv
  JOIN dbo.dim_productos p ON fv.producto_id = p.producto_id
), cliente AS (
  SELECT c.cliente_id, c.segmento,
         CAST(SUM(fv.cantidad*p.precio_unitario*(1 - fv.descuento_pct/100.0)) AS DECIMAL(10,2)) / COUNT(*) AS ticket_cliente
  FROM dbo.fact_ventas fv
  JOIN dbo.dim_clientes c ON fv.cliente_id = c.cliente_id
  JOIN dbo.dim_productos p ON fv.producto_id = p.producto_id
  GROUP BY c.cliente_id, c.segmento
)
SELECT cliente_id, segmento, ticket_cliente
FROM cliente CROSS JOIN global
WHERE ticket_cliente > ticket_global;

---

## ‚ö†Ô∏è Errores Comunes
- Etiquetar antes de limpiar datos (nulos/outliers distorsionan umbrales).
- Usar `CASE` anidados sin cubrir todos los rangos (valores inesperados quedan sin etiqueta).
- No separar c√°lculo de m√©trica y asignaci√≥n de etiqueta (dificulta auditor√≠a).
- Umbrales arbitrarios sin validaci√≥n de negocio (segmentaciones in√∫tiles).

---

## ‚úÖ Conclusiones
- Segmentaci√≥n con `CASE` facilita agrupaciones por umbrales de negocio.
- RFM combina tres dimensiones (recency, frequency, monetary) para priorizar clientes.
- Modularizar m√©tricas en CTEs antes de etiquetar mejora claridad y reusabilidad.

---

## üöÄ Aplicaci√≥n Pr√°ctica
- Campa√±as dirigidas a segmentos de alto margen o bajo ticket.
- Priorizar inventario y descuentos por categor√≠a de producto.
- Dashboards RFM para equipos de CRM y retenci√≥n.

---

## üíº Perspectiva de Negocio
- Segmentaci√≥n permite personalizar oferta (pricing, promociones, contenido).
- RFM identifica campe ones (alta recency/frequency/monetary) y at-risk (baja recency).
- Categorizaci√≥n automatizada reduce esfuerzo manual y acelera decisiones t√°cticas.

---

## üîñ Pie Editorial

**Curso**: Fundamentos de SQL Server - Nivel 2  
**M√≥dulo**: 2.6 Segmentaci√≥n B√°sica  
**Versi√≥n**: 2.0 (Actualizado Enero 2025)  
**Autor**: lraigosov / LuisRai  
**Licencia**: Uso educativo - Atribuci√≥n requerida

> üí° Nota sobre IA: Este material fue estructurado con asistencia de modelos de lenguaje (OpenAI GPT-4, Anthropic Claude); el contenido fue validado y curado por especialistas para evitar alucinaciones y asegurar aplicabilidad pr√°ctica.

---
## Navegaci√≥n
[‚¨ÖÔ∏è Anterior](05_kpis_avanzados.ipynb) | [Siguiente ‚û°Ô∏è](07_optimizar_consultas_basico.ipynb)
---
