In [1]:
import pandas as pd
import numpy as np
from datetime import datetime
import os

## Cargar datos


In [3]:
transacciones = pd.read_csv('../Datos/transacciones_con_features.csv', encoding='utf-8')
cotizaciones = pd.read_csv('../Datos/cotizaciones_con_features.csv', encoding='utf-8')

print(f"Transacciones: {transacciones.shape}")
print(f"Cotizaciones: {cotizaciones.shape}")


Transacciones: (2099287, 43)
Cotizaciones: (178378, 22)


## Convertir fechas

In [4]:
transacciones['fecha'] = pd.to_datetime(transacciones['fecha'])

print(f"Rango transacciones: {transacciones['fecha'].min()} a {transacciones['fecha'].max()}")


Rango transacciones: 1971-01-02 00:00:00 a 1973-01-31 00:00:00


# Dividir transacciones


In [5]:
fecha_corte = datetime(1973, 1, 1)

train_data = transacciones[transacciones['fecha'] < fecha_corte].copy()
test_data = transacciones[transacciones['fecha'] >= fecha_corte].copy()

print(f"Transacciones entrenamiento (1971-1972): {len(train_data):,}")
print(f"Transacciones validación (1973): {len(test_data):,}")


Transacciones entrenamiento (1971-1972): 2,015,795
Transacciones validación (1973): 83,492



## Analisis de Overlap

In [6]:
clientes_entrenamiento = set(train_data['id'].unique())
clientes_validacion = set(test_data['id'].unique())
clientes_comunes = clientes_entrenamiento.intersection(clientes_validacion)

productos_entrenamiento = set(train_data['producto'].unique())
productos_validacion = set(test_data['producto'].unique())
productos_comunes = productos_entrenamiento.intersection(productos_validacion)

print(f"Clientes comunes: {len(clientes_comunes):,} / {len(clientes_entrenamiento):,} ({len(clientes_comunes)/len(clientes_entrenamiento)*100:.1f}%)")
print(f"Productos comunes: {len(productos_comunes):,} / {len(productos_entrenamiento):,} ({len(productos_comunes)/len(productos_entrenamiento)*100:.1f}%)")


Clientes comunes: 11,330 / 404,601 (2.8%)
Productos comunes: 3,085 / 7,177 (43.0%)


## Guardar datos divididos

In [7]:
output_dir = '../Datos/validacion_historica'
os.makedirs(output_dir, exist_ok=True)
train_data.to_csv(f'{output_dir}/transacciones_entrenamiento.csv', index=False)
test_data.to_csv(f'{output_dir}/transacciones_validacion.csv', index=False)


## Importar Modelos

In [120]:
import os
import joblib
import pandas as pd
import numpy as np
from collections import defaultdict

# Obtener la ruta del directorio actual (Modelos)
MODELOS_DIR = "../Modelos"

# Cargar los modelos entrenados desde archivos .pkl
print("Cargando modelos entrenados...")

try:
    content_model = joblib.load(os.path.join(MODELOS_DIR, 'content_model.pkl'))
    print("✓ Modelo de contenido cargado")
except Exception as e:
    print(f"⚠️ Error cargando modelo de contenido: {e}")
    content_model = None

try:
    copurchase_model = joblib.load(os.path.join(MODELOS_DIR, 'co_purchase_model.pkl'))
    print("✓ Modelo de co-compra cargado")
except Exception as e:
    print(f"⚠️ Error cargando modelo de co-compra: {e}")
    copurchase_model = None

try:
    coquote_model = joblib.load(os.path.join(MODELOS_DIR, 'co_quotation_model.pkl'))
    print("✓ Modelo de co-cotización cargado")
except Exception as e:
    print(f"⚠️ Error cargando modelo de co-cotización: {e}")
    coquote_model = None

try:
    hybrid_model = joblib.load(os.path.join(MODELOS_DIR, 'hybrid_model.pkl'))
    print("✓ Modelo híbrido cargado")
except Exception as e:
    print(f"⚠️ Error cargando modelo híbrido: {e}")
    hybrid_model = None

print("Todos los modelos han sido cargados.\n")

# ================================================================
# FUNCIONES DE RECOMENDACIÓN PARA USAR LOS MODELOS CARGADOS
# ================================================================

def get_content_recommendations(input_product, N=10):
    """
    Genera recomendaciones basadas en contenido usando el modelo cargado.
    
    Args:
        input_product (str): ID del producto
        N (int): Número de recomendaciones
    
    Returns:
        pandas.DataFrame: Recomendaciones con columnas ['producto', 'similarity_score']
    """
    if content_model is None:
        print("Error: Modelo de contenido no disponible")
        return pd.DataFrame()
    
    similarity_matrix = content_model['similarity_matrix']
    product_to_idx = content_model['product_to_idx']
    idx_to_product = content_model['idx_to_product']
    
    if input_product not in product_to_idx:
        print(f"Error: Producto '{input_product}' no encontrado")
        return pd.DataFrame()
    
    idx = product_to_idx[input_product]
    sim_scores = list(enumerate(similarity_matrix[idx]))
    sim_scores = sorted(sim_scores, key=lambda x: x[1], reverse=True)
    
    recommendations = []
    for i, score in sim_scores:
        if i == idx:
            continue
        product_name = idx_to_product.get(i)
        if product_name and len(recommendations) < N:
            recommendations.append({'producto': product_name, 'similarity_score': score})
        elif len(recommendations) >= N:
            break
    
    return pd.DataFrame(recommendations)

def get_copurchase_recommendations(input_product, N=10):
    """
    Genera recomendaciones basadas en co-compra usando el modelo cargado.
    
    Args:
        input_product (str): ID del producto
        N (int): Número de recomendaciones
    
    Returns:
        pandas.DataFrame: Recomendaciones con columnas ['producto', 'co_purchase_count']
    """
    if copurchase_model is None:
        #print("Error: Modelo de co-compra no disponible")
        return pd.DataFrame()
    
    co_occurrence_matrix = copurchase_model['co_occurrence_matrix']
    product_to_idx = copurchase_model['product_to_idx']
    idx_to_product = copurchase_model['idx_to_product']
    
    if input_product not in product_to_idx:
        print(f"Error: Producto '{input_product}' no encontrado")
        return pd.DataFrame()
    
    idx = product_to_idx[input_product]
    co_buys = co_occurrence_matrix[idx, :]
    co_buy_indices = co_buys.indices
    co_buy_values = co_buys.data
    
    if len(co_buy_indices) == 0:
        #print(f"Producto '{input_product}' no tiene co-compras registradas")
        return pd.DataFrame()
    
    recommendations = []
    cobuy_pairs = sorted(zip(co_buy_indices, co_buy_values), key=lambda x: x[1], reverse=True)
    
    for i, count in cobuy_pairs:
        if i == idx:
            continue
        product_name = idx_to_product.get(i)
        if product_name and len(recommendations) < N:
            recommendations.append({'producto': product_name, 'co_purchase_count': count})
        elif len(recommendations) >= N:
            break
    
    return pd.DataFrame(recommendations)

def get_coquotation_recommendations(input_product, N=10):
    """
    Genera recomendaciones basadas en co-cotización usando el modelo cargado.
    
    Args:
        input_product (str): ID del producto
        N (int): Número de recomendaciones
    
    Returns:
        pandas.DataFrame: Recomendaciones con columnas ['producto', 'co_quotation_count']
    """
    if coquote_model is None:
        #print("Error: Modelo de co-cotización no disponible")
        return pd.DataFrame()
    
    co_quotation_matrix = coquote_model['co_quotation_matrix']
    product_to_idx = coquote_model['product_to_idx']
    idx_to_product = coquote_model['idx_to_product']
    
    if input_product not in product_to_idx:
        print(f"Error: Producto '{input_product}' no encontrado")
        return pd.DataFrame()
    
    idx = product_to_idx[input_product]
    co_quotes = co_quotation_matrix[idx, :]
    co_quote_indices = co_quotes.indices
    co_quote_values = co_quotes.data
    
    if len(co_quote_indices) == 0:
        None
        #print(f"Producto '{input_product}' no tiene co-cotizaciones registradas")
        return pd.DataFrame()
    
    recommendations = []
    coquote_pairs = sorted(zip(co_quote_indices, co_quote_values), key=lambda x: x[1], reverse=True)
    
    for i, count in coquote_pairs:
        if i == idx:
            continue
        product_name = idx_to_product.get(i)
        if product_name and len(recommendations) < N:
            recommendations.append({'producto': product_name, 'co_quotation_count': count})
        elif len(recommendations) >= N:
            break
    
    return pd.DataFrame(recommendations)

def get_hybrid_recommendations(input_product, N=10, k=2, content_weight = 0, cf_buy_weight = 1, cf_quote_weight = 0):
    """
    Genera recomendaciones híbridas usando re-ranking.
    
    Args:
        input_product (str): ID del producto
        N (int): Número de recomendaciones finales
        content_weight (float): Peso para contenido
        cf_buy_weight (float): Peso para co-compra
        cf_quote_weight (float): Peso para co-cotización
        k (int): Constante de suavizado
    
    Returns:
        pandas.DataFrame: Recomendaciones con columnas ['producto', 'hybrid_score']
    """
    if hybrid_model is None:
        print("Error: Modelo híbrido no disponible")
        return pd.DataFrame()
    
    # Obtener candidatos de cada método
    content_recs = get_content_recommendations(input_product, N=50)
    copurchase_recs = get_copurchase_recommendations(input_product, N=50)
    coquote_recs = get_coquotation_recommendations(input_product, N=50)
    
    
    if copurchase_recs.empty:
        content_weight = 0
        cf_buy_weight = 0
        cf_quote_weight = 1
    
    if copurchase_recs.empty and coquote_recs.empty:
        content_weight = 1
        cf_buy_weight = 0
        cf_quote_weight = 0
        
    # Calcular scores híbridos
    hybrid_scores = defaultdict(float)
    
    # Contribución del modelo de contenido
    if not content_recs.empty:
        for rank, row in enumerate(content_recs.itertuples(), 1):
            score_contribution = content_weight * (1.0 / (rank + k))
            hybrid_scores[row.producto] += score_contribution
    
    # Contribución del modelo de co-compra
    if not copurchase_recs.empty:
        for rank, row in enumerate(copurchase_recs.itertuples(), 1):
            score_contribution = cf_buy_weight * (1.0 / (rank + k))
            hybrid_scores[row.producto] += score_contribution
    
    # Contribución del modelo de co-cotización
    if not coquote_recs.empty:
        for rank, row in enumerate(coquote_recs.itertuples(), 1):
            score_contribution = cf_quote_weight * (1.0 / (rank + k))
            hybrid_scores[row.producto] += score_contribution
    
    if not hybrid_scores:
        print(f"No se encontraron candidatos para '{input_product}'")
        return pd.DataFrame()
    
    # Crear DataFrame final
    final_recs = pd.DataFrame(hybrid_scores.items(), columns=['producto', 'hybrid_score'])
    final_recs = final_recs[final_recs['producto'] != input_product]
    final_recs = final_recs.sort_values('hybrid_score', ascending=False).head(N)
    
    return final_recs

# ================================================================
# FUNCIÓN DE PRUEBA PARA TODOS LOS MODELOS
# ================================================================




Cargando modelos entrenados...
✓ Modelo de contenido cargado
✓ Modelo de co-compra cargado
✓ Modelo de co-cotización cargado
✓ Modelo híbrido cargado
Todos los modelos han sido cargados.



## Funcion para probar todos los modelos

In [121]:
def test_all_models(test_product, N=5):
    """
    Prueba todos los modelos con un producto de ejemplo y devuelve los resultados.
    
    Args:
        test_product (str): Producto para probar
        N (int): Número de recomendaciones por modelo
    
    Returns:
        dict: Diccionario con las recomendaciones de los 4 modelos:
              {
                'content': DataFrame,
                'co_purchase': DataFrame, 
                'co_quotation': DataFrame,
                'hybrid': DataFrame,
                'input_product': str
              }
    """

    
    # Inicializar diccionario de resultados
    results = {
        'input_product': test_product,
        'content': pd.DataFrame(),
        'co_purchase': pd.DataFrame(),
        'co_quotation': pd.DataFrame(),
        'hybrid': pd.DataFrame()
    }
    
    # Probar modelo de contenido
    content_recs = get_content_recommendations(test_product, N=N)
    results['content'] = content_recs
    if not content_recs.empty:
        #print(content_recs)
        None
    else:
        None
        #print("No se encontraron recomendaciones de contenido")
    
    # Probar modelo de co-compra
    copurchase_recs = get_copurchase_recommendations(test_product, N=N)
    results['co_purchase'] = copurchase_recs
    if not copurchase_recs.empty:
        #print(copurchase_recs)
        None
    else:
        None
        #print("No se encontraron recomendaciones de co-compra")
    
    # Probar modelo de co-cotización
    coquote_recs = get_coquotation_recommendations(test_product, N=N)
    results['co_quotation'] = coquote_recs
    if not coquote_recs.empty:
        #print(coquote_recs)
        None
    else:
        None
        #print("No se encontraron recomendaciones de co-cotización")
    
    # Probar modelo híbrido
    hybrid_recs = get_hybrid_recommendations(test_product, N=N)
    results['hybrid'] = hybrid_recs
    if not hybrid_recs.empty:
        #print(hybrid_recs)
        None
    else:
        None
        #print("No se encontraron recomendaciones híbridas")
    

    
    # Resumen de productos únicos encontrados
    all_products = set()
    for model_name, df in results.items():
        if model_name != 'input_product' and not df.empty:
            all_products.update(df['producto'].tolist())

    return results

# Exportar todo
__all__ = [
    'content_model', 
    'copurchase_model', 
    'coquote_model', 
    'hybrid_model',
    'get_content_recommendations',
    'get_copurchase_recommendations',
    'get_coquotation_recommendations',
    'get_hybrid_recommendations',
    'test_all_models'
]
# Para usar la función, ejecuta: test_all_models("producto_ejemplo")


## Ejemplo de uso

In [122]:
producto = "producto_2"
recomendaciones = test_all_models(producto, N=5)
recomendaciones

{'input_product': 'producto_2',
 'content':         producto  similarity_score
 0  producto_1232          0.999869
 1  producto_1120          0.999325
 2  producto_1110          0.999110
 3  producto_3115          0.998920
 4   producto_837          0.998911,
 'co_purchase':         producto  co_purchase_count
 0  producto_3126                 17
 1   producto_413                 17
 2  producto_1120                 16
 3   producto_119                 16
 4   producto_110                 15,
 'co_quotation':         producto  co_quotation_count
 0  producto_3126                  13
 1  producto_1315                   6
 2   producto_208                   6
 3   producto_632                   6
 4   producto_642                   6,
 'hybrid':          producto  hybrid_score
 50  producto_3126      0.333333
 51   producto_413      0.250000
 1   producto_1120      0.200000
 52   producto_119      0.166667
 53   producto_110      0.142857}

## Preparar Datos de validación


In [98]:
# Crear diccionario de compras reales en período de validación
compras_reales = defaultdict(set)
for _, row in test_data.iterrows():
    compras_reales[row['id']].add(row['producto'])

print(f"Clientes únicos en validación: {len(compras_reales)}")

# ================================================================
# PREPARAR DATOS DE INGRESOS PARA ANÁLISIS ECONÓMICO - MODELO HÍBRIDO
# ================================================================

print("PREPARANDO DATOS DE INGRESOS PARA MODELO HÍBRIDO")
print("="*50)

# Crear diccionarios de ingresos para evaluación por transacción/pedido
ingresos_por_pedido_producto = defaultdict(dict)
ingresos_totales_por_pedido = defaultdict(float)

# Crear diccionarios de ingresos por cliente
ingresos_por_cliente_producto = defaultdict(dict)
ingresos_totales_por_cliente = defaultdict(float)

for _, row in test_data.iterrows():
    pedido_id = row['pedido']
    cliente_id = row['id']
    producto = row['producto']
    precio = row['precio']
    cantidad = row['cantidad']
    ingreso_transaccion = precio * cantidad
    
    # INGRESOS POR PEDIDO (para evaluación de ventas cruzadas por transacción)
    if producto in ingresos_por_pedido_producto[pedido_id]:
        ingresos_por_pedido_producto[pedido_id][producto] += ingreso_transaccion
    else:
        ingresos_por_pedido_producto[pedido_id][producto] = ingreso_transaccion
    
    ingresos_totales_por_pedido[pedido_id] += ingreso_transaccion
    
    # INGRESOS POR CLIENTE (para evaluación personalizada)
    if producto in ingresos_por_cliente_producto[cliente_id]:
        ingresos_por_cliente_producto[cliente_id][producto] += ingreso_transaccion
    else:
        ingresos_por_cliente_producto[cliente_id][producto] = ingreso_transaccion
    
    ingresos_totales_por_cliente[cliente_id] += ingreso_transaccion

# Crear diccionario de precios promedio por producto
precios_promedio_productos = defaultdict(list)
for _, row in test_data.iterrows():
    precios_promedio_productos[row['producto']].append(row['precio'])

precio_promedio_por_producto = {}
for producto, precios in precios_promedio_productos.items():
    precio_promedio_por_producto[producto] = np.mean(precios)

# Estadísticas generales
ingresos_pedidos = list(ingresos_totales_por_pedido.values())
ingresos_clientes = list(ingresos_totales_por_cliente.values())

print(f"ESTADÍSTICAS DE INGRESOS:")
print(f"   📋 Por Pedido:")
print(f"      - Total pedidos únicos: {len(ingresos_totales_por_pedido):,}")
print(f"      - Ingreso promedio por pedido: ${np.mean(ingresos_pedidos):.2f}")
print(f"      - Ingreso mediano por pedido: ${np.median(ingresos_pedidos):.2f}")
print(f"      - Ingreso máximo por pedido: ${max(ingresos_pedidos):,.2f}")
print(f"   👤 Por Cliente:")
print(f"      - Total clientes únicos: {len(ingresos_totales_por_cliente):,}")
print(f"      - Ingreso promedio por cliente: ${np.mean(ingresos_clientes):.2f}")
print(f"      - Ingreso mediano por cliente: ${np.median(ingresos_clientes):.2f}")
print(f"   📊 General:")
print(f"      - Productos únicos con precios: {len(precio_promedio_por_producto):,}")
print(f"      - Ingreso total período validación: ${sum(ingresos_clientes):,.2f}")

Clientes únicos en validación: 25950
PREPARANDO DATOS DE INGRESOS PARA MODELO HÍBRIDO
ESTADÍSTICAS DE INGRESOS:
   📋 Por Pedido:
      - Total pedidos únicos: 37,306
      - Ingreso promedio por pedido: $79.48
      - Ingreso mediano por pedido: $23.83
      - Ingreso máximo por pedido: $38,013.84
   👤 Por Cliente:
      - Total clientes únicos: 25,950
      - Ingreso promedio por cliente: $114.26
      - Ingreso mediano por cliente: $35.46
   📊 General:
      - Productos únicos con precios: 3,184
      - Ingreso total período validación: $2,965,130.49


## Función para calcular métricas

In [99]:
def calcular_metricas_con_ingresos(recomendaciones_dict, compras_reales_cliente, cliente_id, k=5):
    """
    Calcula métricas para un cliente específico INCLUYENDO análisis de ingresos
    """
    metricas = {}
    
    for modelo, recs_df in recomendaciones_dict.items():
        if modelo == 'input_product' or recs_df.empty:
            continue
            
        # Obtener top K recomendaciones
        productos_recomendados = set(recs_df.head(k)['producto'].tolist())
        productos_comprados = compras_reales_cliente
        
        # Calcular intersección (aciertos)
        hits_productos = productos_recomendados.intersection(productos_comprados)
        hits = len(hits_productos)
        
        # MÉTRICAS TRADICIONALES
        hit_rate = 1 if hits > 0 else 0
        
        if len(productos_recomendados) > len(productos_comprados):
            precision = hits / len(productos_comprados) 
        else:
            precision = hits / len(productos_recomendados) 
            
        recall = hits / len(productos_comprados) if productos_comprados else 0
        f1 = 2 * (precision * recall) / (precision + recall) if (precision + recall) > 0 else 0
        
        # NUEVAS: MÉTRICAS DE INGRESOS
        
        # Ingresos de productos acertados (lo que realmente ganamos por las recomendaciones)
        ingreso_acertado = 0
        for producto in hits_productos:
            if producto in ingresos_por_cliente_producto[cliente_id]:
                ingreso_acertado += ingresos_por_cliente_producto[cliente_id][producto]
        
        # Ingreso total del cliente en validación
        ingreso_total_cliente = ingresos_totales_por_cliente[cliente_id]
        
        # Ingreso potencial si acepta todas las recomendaciones (estimación)
        ingreso_potencial_recomendaciones = 0
        for producto in productos_recomendados:
            if producto in precio_promedio_por_producto:
                ingreso_potencial_recomendaciones += precio_promedio_por_producto[producto]
        
        # Tasa de captura de ingresos (qué % del gasto del cliente capturamos con recomendaciones)
        tasa_captura = (ingreso_acertado / ingreso_total_cliente) * 100 if ingreso_total_cliente > 0 else 0
        
        metricas[modelo] = {
            # Métricas tradicionales
            'hits': hits,
            'hit_rate': hit_rate,
            'precision': precision,
            'recall': recall,
            'f1_score': f1,
            'productos_recomendados': len(productos_recomendados),
            'productos_comprados': len(productos_comprados),
            
            # NUEVAS: Métricas de ingresos
            'ingreso_acertado': ingreso_acertado,
            'ingreso_total_cliente': ingreso_total_cliente,
            'ingreso_potencial_recomendaciones': ingreso_potencial_recomendaciones,
            'tasa_captura_ingresos': tasa_captura
        }
    
    return metricas

## Función principal de evaluación

In [128]:
def evaluar_algoritmo_con_ingresos(productos_test, n_productos_evaluar=100, k=10):
    """
    Evalúa el algoritmo con una muestra de productos INCLUYENDO análisis de ingresos
    """
    print(f"Evaluando {n_productos_evaluar} productos con top-{k} recomendaciones...")
    print("INCLUYENDO análisis de ingresos por cliente...")
    
    # Tomar muestra de productos para evaluar
    productos_evaluar = list(productos_test)[:n_productos_evaluar]
    
    # Diccionarios para acumular métricas tradicionales
    metricas_totales = defaultdict(list)
    
    # NUEVOS: Diccionarios para acumular métricas de ingresos
    metricas_ingresos = defaultdict(list)
    
    productos_evaluados = 0
    productos_sin_clientes = 0
    errores = 0
    
    for i, producto in enumerate(productos_evaluar):
        # Mostrar progreso cada 10%
        if i % max(1, len(productos_evaluar) // 10) == 0:
            print(f"Progreso: {i+1}/{len(productos_evaluar)} ({(i+1)/len(productos_evaluar)*100:.1f}%)")
        
        try:
            # Generar recomendaciones para este producto
            recomendaciones = test_all_models(producto, N=k)
            
            # Buscar clientes que compraron este producto en validación
            clientes_que_compraron = []
            for cliente, productos_comprados in compras_reales.items():
                if producto in productos_comprados:
                    clientes_que_compraron.append(cliente)
            
            if not clientes_que_compraron:
                productos_sin_clientes += 1
                continue
                
            # Evaluar para cada cliente que compró este producto
            for cliente in clientes_que_compraron:
                compras_cliente = compras_reales[cliente]
                
                # Calcular métricas tradicionales + ingresos
                metricas_cliente = calcular_metricas_con_ingresos(recomendaciones, compras_cliente, cliente, k)
                
                # Acumular métricas tradicionales
                for modelo, metricas in metricas_cliente.items():
                    for metrica, valor in metricas.items():
                        metricas_totales[f"{modelo}_{metrica}"].append(valor)
            
            productos_evaluados += 1
            
        except Exception as e:
            errores += 1
            if errores <= 5:
                print(f"Error evaluando producto {producto}: {e}")
            continue
    
    print(f"\nESTADÍSTICAS FINALES:")
    print(f"  Productos evaluados: {productos_evaluados}")
    print(f"  Sin clientes en validación: {productos_sin_clientes}")
    print(f"  Errores: {errores}")
    
    return metricas_totales, productos_evaluados

def calcular_metricas_promedio_con_ingresos(resultados):
    """
    Calcula métricas promedio por modelo INCLUYENDO análisis de ingresos
    """
    modelos = ['content', 'co_purchase', 'co_quotation', 'hybrid']
    metricas_finales = {}
    
    for modelo in modelos:
        if f"{modelo}_hit_rate" in resultados:
            # Métricas tradicionales
            metricas_tradicionales = {
                'hit_rate': np.mean(resultados[f"{modelo}_hit_rate"]),
                'precision': np.mean(resultados[f"{modelo}_precision"]),
                'recall': np.mean(resultados[f"{modelo}_recall"]),
                'f1_score': np.mean(resultados[f"{modelo}_f1_score"]),
                'n_evaluaciones': len(resultados[f"{modelo}_hit_rate"])
            }
            
            # NUEVAS: Métricas de ingresos (si existen)
            metricas_ingresos = {}
            if f"{modelo}_ingreso_acertado" in resultados:
                ingresos_acertados = resultados[f"{modelo}_ingreso_acertado"]
                ingresos_totales = resultados[f"{modelo}_ingreso_total_cliente"]
                ingresos_potenciales = resultados[f"{modelo}_ingreso_potencial_recomendaciones"]
                tasa_captura = resultados[f"{modelo}_tasa_captura_ingresos"]
                
                metricas_ingresos = {
                    'ingreso_promedio_acertado': np.mean(ingresos_acertados),
                    'ingreso_promedio_total': np.mean(ingresos_totales),
                    'ingreso_promedio_potencial': np.mean(ingresos_potenciales),
                    'tasa_captura_promedio': np.mean(tasa_captura),
                    'ingreso_total_acertado': sum(ingresos_acertados),
                    'ingreso_total_evaluado': sum(ingresos_totales),
                    'uplift_monetario_pct': (sum(ingresos_acertados) / sum(ingresos_totales)) * 100 if sum(ingresos_totales) > 0 else 0
                }
            
            # Combinar métricas
            metricas_finales[modelo] = {**metricas_tradicionales, **metricas_ingresos}
    
    return metricas_finales


## Ejecutar evaluación

In [None]:
# Ejecutar evaluación con ingresos
productos_test = set(test_data['producto'].unique())
productos_train = set(train_data['producto'].unique())
productos_comunes = productos_test.intersection(productos_train)

resultados_con_ingresos, n_evaluados = evaluar_algoritmo_con_ingresos(
    productos_comunes, 
    n_productos_evaluar=len(productos_comunes), 
    k=5
)

print(f"\nProductos evaluados exitosamente: {n_evaluados} / {len(productos_comunes)}")
print(f"Evaluaciones totales realizadas: {len(resultados_con_ingresos.get('content_hit_rate', []))}")

# Calcular métricas promedio con ingresos
metricas_finales_con_ingresos = calcular_metricas_promedio_con_ingresos(resultados_con_ingresos)

Evaluando 10 productos con top-5 recomendaciones...
INCLUYENDO análisis de ingresos por cliente...
Progreso: 1/10 (10.0%)
Progreso: 2/10 (20.0%)
Progreso: 3/10 (30.0%)
Progreso: 4/10 (40.0%)
Progreso: 5/10 (50.0%)
Progreso: 6/10 (60.0%)
Progreso: 7/10 (70.0%)
Progreso: 8/10 (80.0%)
Progreso: 9/10 (90.0%)
Progreso: 10/10 (100.0%)

ESTADÍSTICAS FINALES:
  Productos evaluados: 10
  Sin clientes en validación: 0
  Errores: 0

Productos evaluados exitosamente: 10 / 3085
Evaluaciones totales realizadas: 344


In [127]:

# Convertir a DataFrame para visualización
df_metricas_con_ingresos = pd.DataFrame(metricas_finales_con_ingresos).T

# Redondear valores numéricos para mejor visualización
df_metricas_con_ingresos = df_metricas_con_ingresos.round(4)

df_metricas_con_ingresos

Unnamed: 0,hit_rate,precision,recall,f1_score,n_evaluaciones,ingreso_promedio_acertado,ingreso_promedio_total,ingreso_promedio_potencial,tasa_captura_promedio,ingreso_total_acertado,ingreso_total_evaluado,uplift_monetario_pct
content,0.0436,0.0109,0.0066,0.0075,344.0,1.183,240.328,26.4103,0.5787,406.9489,82672.8299,0.4922
co_purchase,0.4884,0.1651,0.115,0.13,344.0,15.5839,240.328,10.9707,6.2202,5360.8549,82672.8299,6.4844
co_quotation,0.5,0.1667,0.0954,0.1027,22.0,15.8645,296.9227,77.8486,11.1359,349.02,6532.3001,5.343
hybrid,0.4884,0.1651,0.115,0.13,344.0,15.5839,240.328,10.9707,6.2202,5360.8549,82672.8299,6.4844


##  Evaluación por transacción multi-producto

In [130]:
def evaluar_ventas_cruzadas_por_transaccion(n_transacciones_evaluar=500, k=10):
    """
    Evalúa si el algoritmo puede predecir productos adicionales en transacciones multi-producto.
    Dado el primer producto de una transacción, ¿recomienda los otros productos comprados?
    INCLUYE ANÁLISIS DE INGRESOS POR TRANSACCIÓN
    """

    # 1. Encontrar transacciones multi-producto en datos de validación
    print("\n📊 Analizando transacciones multi-producto en período de validación...")
    
    # Agrupar por cliente y fecha para identificar transacciones
    test_data['fecha'] = pd.to_datetime(test_data['fecha'])
    transacciones_grupo = test_data.groupby(['id', 'fecha'])
    
    # Filtrar solo transacciones con más de 1 producto
    transacciones_multi = []
    for (cliente, fecha), grupo in transacciones_grupo:
        productos = grupo['producto'].unique()
        if len(productos) >= 2:  # Transacciones con 2+ productos
            transacciones_multi.append({
                'cliente': cliente,
                'fecha': fecha,
                'productos': list(productos),
                'n_productos': len(productos),
                'pedidos': grupo['pedido'].unique().tolist()  # Para análisis de ingresos
            })
    
    print(f"📈 Transacciones multi-producto encontradas: {len(transacciones_multi)}")
    
    if len(transacciones_multi) == 0:
        print("❌ No se encontraron transacciones multi-producto")
        return {}
    
    # Estadísticas de transacciones multi-producto
    tamaños = [t['n_productos'] for t in transacciones_multi]
    print(f"📊 Estadísticas de tamaño de transacciones:")
    print(f"   - Promedio productos por pedido: {np.mean(tamaños):.2f}")
    print(f"   - Mediana: {np.median(tamaños):.0f}")
    print(f"   - Máximo: {max(tamaños)}")
    print(f"   - Mínimo: {min(tamaños)}")
    
    # Distribución de tamaños
    from collections import Counter
    distribucion = Counter(tamaños)
    print(f"📋 Distribución de tamaños de pedido:")
    for tam in sorted(distribucion.keys())[:10]:  # Mostrar primeros 10
        print(f"   - {tam} productos: {distribucion[tam]} pedidos")
    if len(distribucion) > 10:
        print(f"   - ... y {len(distribucion) - 10} tamaños más")
    
    # 2. Tomar muestra de transacciones para evaluar
    n_evaluar = min(n_transacciones_evaluar, len(transacciones_multi))
    transacciones_evaluar = transacciones_multi[:n_evaluar]
    
    print(f"\n🎯 Evaluando {n_evaluar} transacciones...")
    print("Metodología: Dado el primer producto del pedido → ¿Se recomiendan los otros productos del mismo pedido?")
    print("💰 INCLUYENDO análisis de ingresos por transacción...")
    
    # 3. Evaluar cada transacción
    metricas_transacciones = defaultdict(list)
    metricas_ingresos_transacciones = defaultdict(list)  # NUEVO: para métricas de ingresos
    transacciones_evaluadas = 0
    errores = 0
    
    # Para debug: mostrar detalles de las primeras 3 transacciones
    mostrar_debug = True
    
    for i, transaccion in enumerate(transacciones_evaluar):
        # Mostrar progreso cada 10%
        if i % max(1, len(transacciones_evaluar) // 10) == 0:
            print(f"Progreso: {i+1}/{len(transacciones_evaluar)} ({(i+1)/len(transacciones_evaluar)*100:.1f}%)")
        
        try:
            productos = transaccion['productos']
            producto_input = productos[0]  # Primer producto como input
            productos_target = set(productos[1:])  # Resto como target
            pedidos_transaccion = transaccion['pedidos']
            
            # DEBUG: Mostrar detalles de las primeras 3 transacciones
            if mostrar_debug and transacciones_evaluadas < 3:
                print(f"\n" + "="*60)
                print(f"🔍 DEBUG TRANSACCIÓN {transacciones_evaluadas + 1}")
                print(f"📅 Cliente: {transaccion['cliente']}, Fecha: {transaccion['fecha'].strftime('%Y-%m-%d')}")
                print(f"🛒 Productos en transacción: {productos}")
                print(f"🎯 Input: '{producto_input}' → Target: {sorted(list(productos_target))}")
            
            # Generar recomendaciones para el primer producto
            recomendaciones = test_all_models(producto_input, N=k)
            
            if mostrar_debug and transacciones_evaluadas < 3:
                print(f"\n📋 Recomendaciones generadas para '{producto_input}':")
                for modelo, recs_df in recomendaciones.items():
                    if modelo != 'input_product' and not recs_df.empty:
                        productos_rec = recs_df['producto'].tolist()
                        print(f"  {modelo}: {productos_rec}")
                    elif modelo != 'input_product':
                        print(f"  {modelo}: Sin recomendaciones")
            
            # NUEVO: Calcular ingresos de la transacción
            ingreso_total_transaccion = 0
            ingresos_por_producto_transaccion = {}
            
            for pedido_id in pedidos_transaccion:
                if pedido_id in ingresos_totales_por_pedido:
                    ingreso_total_transaccion += ingresos_totales_por_pedido[pedido_id]
                    
                if pedido_id in ingresos_por_pedido_producto:
                    for prod, ingreso in ingresos_por_pedido_producto[pedido_id].items():
                        if prod in ingresos_por_producto_transaccion:
                            ingresos_por_producto_transaccion[prod] += ingreso
                        else:
                            ingresos_por_producto_transaccion[prod] = ingreso
            
            # Evaluar cada modelo
            for modelo, recs_df in recomendaciones.items():
                if modelo == 'input_product' or recs_df.empty:
                    continue
                
                # Productos recomendados (top-K)
                productos_recomendados = set(recs_df.head(k)['producto'].tolist())
                
                # Calcular intersección
                productos_acertados = productos_recomendados.intersection(productos_target)
                
                # MÉTRICAS TRADICIONALES
                hit_rate = 1 if len(productos_acertados) > 0 else 0
                precision = len(productos_acertados) / len(productos_recomendados) if productos_recomendados else 0
                recall = len(productos_acertados) / len(productos_target) if productos_target else 0
                f1_score = 2 * (precision * recall) / (precision + recall) if (precision + recall) > 0 else 0
                
                # NUEVAS: MÉTRICAS DE INGRESOS
                # Ingresos de productos acertados en esta transacción
                ingreso_acertado_transaccion = 0
                for producto in productos_acertados:
                    if producto in ingresos_por_producto_transaccion:
                        ingreso_acertado_transaccion += ingresos_por_producto_transaccion[producto]
                
                # Ingreso potencial si acepta todas las recomendaciones
                ingreso_potencial_recomendaciones = 0
                for producto in productos_recomendados:
                    if producto in precio_promedio_por_producto:
                        ingreso_potencial_recomendaciones += precio_promedio_por_producto[producto]
                
                # Tasa de captura de ingresos para esta transacción
                tasa_captura_transaccion = (ingreso_acertado_transaccion / ingreso_total_transaccion) * 100 if ingreso_total_transaccion > 0 else 0
                
                # Guardar métricas tradicionales
                metricas_transacciones[f"{modelo}_hit_rate"].append(hit_rate)
                metricas_transacciones[f"{modelo}_precision"].append(precision)
                metricas_transacciones[f"{modelo}_recall"].append(recall)
                metricas_transacciones[f"{modelo}_f1_score"].append(f1_score)
                metricas_transacciones[f"{modelo}_productos_acertados"].append(len(productos_acertados))
                metricas_transacciones[f"{modelo}_productos_target"].append(len(productos_target))
                
                # NUEVO: Guardar métricas de ingresos
                metricas_ingresos_transacciones[f"{modelo}_ingreso_acertado"].append(ingreso_acertado_transaccion)
                metricas_ingresos_transacciones[f"{modelo}_ingreso_total_transaccion"].append(ingreso_total_transaccion)
                metricas_ingresos_transacciones[f"{modelo}_ingreso_potencial_recomendaciones"].append(ingreso_potencial_recomendaciones)
                metricas_ingresos_transacciones[f"{modelo}_tasa_captura_transaccion"].append(tasa_captura_transaccion)
                
                # DEBUG: Mostrar métricas detalladas
                if mostrar_debug and transacciones_evaluadas < 3:
                    print(f"\n  🔹 {modelo.upper()}:")
                    print(f"    Recomendados: {sorted(list(productos_recomendados))}")
                    print(f"    Target:       {sorted(list(productos_target))}")
                    print(f"    ✅ Acertados: {sorted(list(productos_acertados))}")
                    print(f"    Hit Rate:  {hit_rate}")
                    print(f"    Precision: {precision:.3f}")
                    print(f"    Recall:    {recall:.3f}")
                    print(f"    F1-Score:  {f1_score:.3f}")
                    print(f"    💰 Ingreso total transacción: ${ingreso_total_transaccion:.2f}")
                    print(f"    💰 Ingreso acertado: ${ingreso_acertado_transaccion:.2f}")
                    print(f"    💰 Tasa captura: {tasa_captura_transaccion:.2f}%")
            
            if mostrar_debug and transacciones_evaluadas < 3:
                print("="*60)
            
            transacciones_evaluadas += 1
            
        except Exception as e:
            errores += 1
            if errores <= 5:
                print(f"Error evaluando transacción {i}: {e}")
            continue
    
    print(f"\n📈 ESTADÍSTICAS FINALES:")
    print(f"  ✅ Transacciones evaluadas: {transacciones_evaluadas}")
    print(f"  ❌ Errores: {errores}")
    
    # 4. Calcular métricas promedio (tradicionales + ingresos)
    print(f"\n📊 RESULTADOS DE VENTAS CRUZADAS POR TRANSACCIÓN:")
    print("="*60)
    
    modelos = ['content', 'co_purchase', 'co_quotation', 'hybrid']
    metricas_finales = {}
    
    for modelo in modelos:
        if f"{modelo}_hit_rate" in metricas_transacciones:
            # Métricas tradicionales
            hit_rate_avg = np.mean(metricas_transacciones[f"{modelo}_hit_rate"])
            precision_avg = np.mean(metricas_transacciones[f"{modelo}_precision"])
            recall_avg = np.mean(metricas_transacciones[f"{modelo}_recall"])
            f1_avg = np.mean(metricas_transacciones[f"{modelo}_f1_score"])
            
            # NUEVAS: Métricas de ingresos
            ingresos_acertados = metricas_ingresos_transacciones[f"{modelo}_ingreso_acertado"]
            ingresos_totales = metricas_ingresos_transacciones[f"{modelo}_ingreso_total_transaccion"]
            ingresos_potenciales = metricas_ingresos_transacciones[f"{modelo}_ingreso_potencial_recomendaciones"]
            tasa_captura = metricas_ingresos_transacciones[f"{modelo}_tasa_captura_transaccion"]
            
            metricas_finales[modelo] = {
                # Métricas tradicionales
                'hit_rate': hit_rate_avg,
                'precision': precision_avg,
                'recall': recall_avg,
                'f1_score': f1_avg,
                'n_transacciones': len(metricas_transacciones[f"{modelo}_hit_rate"]),
                
                # NUEVAS: Métricas de ingresos
                'ingreso_promedio_acertado': np.mean(ingresos_acertados),
                'ingreso_promedio_total': np.mean(ingresos_totales),
                'ingreso_promedio_potencial': np.mean(ingresos_potenciales),
                'tasa_captura_promedio': np.mean(tasa_captura),
                'ingreso_total_acertado': sum(ingresos_acertados),
                'ingreso_total_evaluado': sum(ingresos_totales),
                'uplift_monetario_pct': (sum(ingresos_acertados) / sum(ingresos_totales)) * 100 if sum(ingresos_totales) > 0 else 0
            }
            
            print(f"\n🔹 {modelo.upper()}:")
            print(f"  Hit Rate@{k}:     {hit_rate_avg:.3f} ({hit_rate_avg*100:.1f}% de pedidos con al menos 1 acierto)")
            print(f"  Precision@{k}:    {precision_avg:.3f}")
            print(f"  Recall@{k}:       {recall_avg:.3f}")
            print(f"  F1-Score:         {f1_avg:.3f}")
            print(f"  Pedidos evaluados: {len(metricas_transacciones[f'{modelo}_hit_rate'])}")
            print(f"  💰 Ingreso promedio acertado: ${np.mean(ingresos_acertados):.2f}")
            print(f"  💰 Uplift monetario: {(sum(ingresos_acertados) / sum(ingresos_totales)) * 100 if sum(ingresos_totales) > 0 else 0:.2f}%")
    
    return metricas_finales, metricas_transacciones, metricas_ingresos_transacciones

In [131]:
# EJECUTAR EVALUACIÓN DE VENTAS CRUZADAS CON INGRESOS

resultados_ventas_cruzadas, metricas_detalladas, metricas_ingresos_detalladas = evaluar_ventas_cruzadas_por_transaccion(
    n_transacciones_evaluar=9999999, 
    k=10
)



📊 Analizando transacciones multi-producto en período de validación...
📈 Transacciones multi-producto encontradas: 16872
📊 Estadísticas de tamaño de transacciones:
   - Promedio productos por pedido: 3.89
   - Mediana: 3
   - Máximo: 34
   - Mínimo: 2
📋 Distribución de tamaños de pedido:
   - 2 productos: 6382 pedidos
   - 3 productos: 4207 pedidos
   - 4 productos: 2067 pedidos
   - 5 productos: 1248 pedidos
   - 6 productos: 849 pedidos
   - 7 productos: 549 pedidos
   - 8 productos: 401 pedidos
   - 9 productos: 321 pedidos
   - 10 productos: 229 pedidos
   - 11 productos: 173 pedidos
   - ... y 21 tamaños más

🎯 Evaluando 16872 transacciones...
Metodología: Dado el primer producto del pedido → ¿Se recomiendan los otros productos del mismo pedido?
💰 INCLUYENDO análisis de ingresos por transacción...
Progreso: 1/16872 (0.0%)

🔍 DEBUG TRANSACCIÓN 1
📅 Cliente: 198, Fecha: 1973-01-16
🛒 Productos en transacción: ['producto_3780', 'producto_162']
🎯 Input: 'producto_3780' → Target: ['produ

In [132]:
# Mostrar resultados en un DataFrame de forma legible
if resultados_ventas_cruzadas:
    resultados_df = pd.DataFrame(resultados_ventas_cruzadas).T
    print("\n📊 Resultados de métricas de ventas cruzadas CON INGRESOS:")
    display(resultados_df)


📊 Resultados de métricas de ventas cruzadas CON INGRESOS:


Unnamed: 0,hit_rate,precision,recall,f1_score,n_transacciones,ingreso_promedio_acertado,ingreso_promedio_total,ingreso_promedio_potencial,tasa_captura_promedio,ingreso_total_acertado,ingreso_total_evaluado,uplift_monetario_pct
content,0.07954,0.008831,0.040641,0.013189,16872.0,2.26168,142.914713,82.075808,1.905017,38159.0673,2411257.0,1.582538
co_purchase,0.51708,0.076751,0.287257,0.110137,16862.0,16.940738,142.963421,48.052885,14.135843,285654.7176,2410649.0,11.849701
co_quotation,0.389329,0.057204,0.198451,0.07988,6054.0,6.39348,136.434226,78.962896,8.74891,38706.13,825972.8,4.686126
hybrid,0.516892,0.075178,0.287205,0.108795,16872.0,16.932042,142.914713,48.323435,14.133487,285677.4176,2411257.0,11.847655


In [133]:
def evaluar_ventas_cruzadas_por_transaccion_multiproducto(n_transacciones_evaluar=500, k=5):
    """
    Evalúa si el algoritmo puede predecir productos adicionales en transacciones multi-producto.
    Dado el primer producto de una transacción, ¿recomienda los otros productos comprados?
    INCLUYE ANÁLISIS DE INGRESOS POR PEDIDO
    """

    # 1. Encontrar transacciones multi-producto usando la columna 'pedido'
    print("\n📊 Analizando transacciones multi-producto en período de validación...")
    
    # Agrupar por pedido para identificar transacciones
    transacciones_grupo = test_data.groupby('pedido')
    
    # Filtrar solo transacciones con más de 1 producto
    transacciones_multi = []
    for pedido_id, grupo in transacciones_grupo:
        productos = grupo['producto'].unique()
        if len(productos) >= 2:  # Transacciones con 2+ productos
            transacciones_multi.append({
                'pedido_id': pedido_id,
                'cliente': grupo['id'].iloc[0],  # Cliente del pedido
                'fecha': grupo['fecha'].iloc[0] if 'fecha' in grupo.columns else 'N/A',
                'productos': list(productos),
                'n_productos': len(productos)
            })
    
    print(f"📈 Transacciones multi-producto encontradas: {len(transacciones_multi)}")
    
    if len(transacciones_multi) == 0:
        print("❌ No se encontraron transacciones multi-producto")
        return {}
    
    # Estadísticas de transacciones multi-producto
    tamaños = [t['n_productos'] for t in transacciones_multi]
    print(f"📊 Estadísticas de tamaño de transacciones:")
    print(f"   - Promedio productos por pedido: {np.mean(tamaños):.2f}")
    print(f"   - Mediana: {np.median(tamaños):.0f}")
    print(f"   - Máximo: {max(tamaños)}")
    print(f"   - Mínimo: {min(tamaños)}")
    
    # Distribución de tamaños
    from collections import Counter
    distribucion = Counter(tamaños)
    print(f"📋 Distribución de tamaños de pedido:")
    for tam in sorted(distribucion.keys())[:10]:  # Mostrar primeros 10
        print(f"   - {tam} productos: {distribucion[tam]} pedidos")
    if len(distribucion) > 10:
        print(f"   - ... y {len(distribucion) - 10} tamaños más")
    
    # 2. Tomar muestra de transacciones para evaluar
    n_evaluar = min(n_transacciones_evaluar, len(transacciones_multi))
    transacciones_evaluar = transacciones_multi[:n_evaluar]
    
    print(f"\n🎯 Evaluando {n_evaluar} transacciones...")
    print("Metodología: Dado el primer producto del pedido → ¿Se recomiendan los otros productos del mismo pedido?")
    print("💰 INCLUYENDO análisis de ingresos por pedido...")
    
    # 3. Evaluar cada transacción
    metricas_transacciones = defaultdict(list)
    metricas_ingresos_pedidos = defaultdict(list)  # NUEVO: para métricas de ingresos
    transacciones_evaluadas = 0
    errores = 0
    
    # Para debug: mostrar detalles de las primeras 3 transacciones
    mostrar_debug = True
    
    for i, transaccion in enumerate(transacciones_evaluar):
        # Mostrar progreso cada 10%
        if i % max(1, len(transacciones_evaluar) // 10) == 0:
            print(f"Progreso: {i+1}/{len(transacciones_evaluar)} ({(i+1)/len(transacciones_evaluar)*100:.1f}%)")
        
        try:
            productos = transaccion['productos']
            producto_input = productos[0]  # Primer producto como input
            productos_target = set(productos[1:])  # Resto como target
            pedido_id = transaccion['pedido_id']
            
            # DEBUG: Mostrar detalles de las primeras 3 transacciones
            if mostrar_debug and transacciones_evaluadas < 3:
                print(f"\n" + "="*60)
                print(f"🔍 DEBUG TRANSACCIÓN {transacciones_evaluadas + 1}")
                print(f"🆔 Pedido: {transaccion['pedido_id']}")
                print(f"👤 Cliente: {transaccion['cliente']}")
                print(f"📅 Fecha: {transaccion['fecha']}")
                print(f"🛒 Productos en pedido: {productos}")
                print(f"🎯 Input: '{producto_input}' → Target: {sorted(list(productos_target))}")
            
            # Generar recomendaciones para el primer producto
            recomendaciones = test_all_models(producto_input, N=k)
            
            if mostrar_debug and transacciones_evaluadas < 3:
                print(f"\n📋 Recomendaciones generadas para '{producto_input}':")
                for modelo, recs_df in recomendaciones.items():
                    if modelo != 'input_product' and not recs_df.empty:
                        productos_rec = recs_df['producto'].tolist()
                        print(f"  {modelo}: {productos_rec}")
                    elif modelo != 'input_product':
                        print(f"  {modelo}: Sin recomendaciones")
            
            # NUEVO: Calcular ingresos del pedido
            ingreso_total_pedido = ingresos_totales_por_pedido.get(pedido_id, 0)
            ingresos_por_producto_pedido = ingresos_por_pedido_producto.get(pedido_id, {})
            
            # Evaluar cada modelo
            for modelo, recs_df in recomendaciones.items():
                if modelo == 'input_product' or recs_df.empty:
                    continue
                
                # Productos recomendados (top-K)
                productos_recomendados = set(recs_df.head(k)['producto'].tolist())
                
                # Calcular intersección
                productos_acertados = productos_recomendados.intersection(productos_target)
                
                # MÉTRICAS TRADICIONALES
                hit_rate = 1 if len(productos_acertados) > 0 else 0
                precision = len(productos_acertados) / len(productos_recomendados) if productos_recomendados else 0
                recall = len(productos_acertados) / len(productos_target) if productos_target else 0
                f1_score = 2 * (precision * recall) / (precision + recall) if (precision + recall) > 0 else 0
                
                # NUEVAS: MÉTRICAS DE INGRESOS
                # Ingresos de productos acertados en este pedido
                ingreso_acertado_pedido = 0
                for producto in productos_acertados:
                    if producto in ingresos_por_producto_pedido:
                        ingreso_acertado_pedido += ingresos_por_producto_pedido[producto]
                
                # Ingreso potencial si acepta todas las recomendaciones
                ingreso_potencial_recomendaciones = 0
                for producto in productos_recomendados:
                    if producto in precio_promedio_por_producto:
                        ingreso_potencial_recomendaciones += precio_promedio_por_producto[producto]
                
                # Tasa de captura de ingresos para este pedido
                tasa_captura_pedido = (ingreso_acertado_pedido / ingreso_total_pedido) * 100 if ingreso_total_pedido > 0 else 0
                
                # Guardar métricas tradicionales
                metricas_transacciones[f"{modelo}_hit_rate"].append(hit_rate)
                metricas_transacciones[f"{modelo}_precision"].append(precision)
                metricas_transacciones[f"{modelo}_recall"].append(recall)
                metricas_transacciones[f"{modelo}_f1_score"].append(f1_score)
                metricas_transacciones[f"{modelo}_productos_acertados"].append(len(productos_acertados))
                metricas_transacciones[f"{modelo}_productos_target"].append(len(productos_target))
                
                # NUEVO: Guardar métricas de ingresos
                metricas_ingresos_pedidos[f"{modelo}_ingreso_acertado"].append(ingreso_acertado_pedido)
                metricas_ingresos_pedidos[f"{modelo}_ingreso_total_pedido"].append(ingreso_total_pedido)
                metricas_ingresos_pedidos[f"{modelo}_ingreso_potencial_recomendaciones"].append(ingreso_potencial_recomendaciones)
                metricas_ingresos_pedidos[f"{modelo}_tasa_captura_pedido"].append(tasa_captura_pedido)
                
                # DEBUG: Mostrar métricas detalladas
                if mostrar_debug and transacciones_evaluadas < 3:
                    print(f"\n  🔹 {modelo.upper()}:")
                    print(f"    Recomendados: {sorted(list(productos_recomendados))}")
                    print(f"    Target:       {sorted(list(productos_target))}")
                    print(f"    ✅ Acertados: {sorted(list(productos_acertados))}")
                    print(f"    Hit Rate:  {hit_rate}")
                    print(f"    Precision: {precision:.3f}")
                    print(f"    Recall:    {recall:.3f}")
                    print(f"    F1-Score:  {f1_score:.3f}")
                    print(f"    💰 Ingreso total pedido: ${ingreso_total_pedido:.2f}")
                    print(f"    💰 Ingreso acertado: ${ingreso_acertado_pedido:.2f}")
                    print(f"    💰 Tasa captura: {tasa_captura_pedido:.2f}%")
            
            if mostrar_debug and transacciones_evaluadas < 3:
                print("="*60)
            
            transacciones_evaluadas += 1
            
        except Exception as e:
            errores += 1
            if errores <= 5:
                print(f"Error evaluando transacción {i}: {e}")
            continue
    
    print(f"\n📈 ESTADÍSTICAS FINALES:")
    print(f"  ✅ Transacciones evaluadas: {transacciones_evaluadas}")
    print(f"  ❌ Errores: {errores}")
    
    # 4. Calcular métricas promedio (tradicionales + ingresos)
    print(f"\n📊 RESULTADOS DE VENTAS CRUZADAS POR TRANSACCIÓN:")
    print("="*60)
    
    modelos = ['content', 'co_purchase', 'co_quotation', 'hybrid']
    metricas_finales = {}
    
    for modelo in modelos:
        if f"{modelo}_hit_rate" in metricas_transacciones:
            # Métricas tradicionales
            hit_rate_avg = np.mean(metricas_transacciones[f"{modelo}_hit_rate"])
            precision_avg = np.mean(metricas_transacciones[f"{modelo}_precision"])
            recall_avg = np.mean(metricas_transacciones[f"{modelo}_recall"])
            f1_avg = np.mean(metricas_transacciones[f"{modelo}_f1_score"])
            
            # NUEVAS: Métricas de ingresos
            ingresos_acertados = metricas_ingresos_pedidos[f"{modelo}_ingreso_acertado"]
            ingresos_totales = metricas_ingresos_pedidos[f"{modelo}_ingreso_total_pedido"]
            ingresos_potenciales = metricas_ingresos_pedidos[f"{modelo}_ingreso_potencial_recomendaciones"]
            tasa_captura = metricas_ingresos_pedidos[f"{modelo}_tasa_captura_pedido"]
            
            metricas_finales[modelo] = {
                # Métricas tradicionales
                'hit_rate': hit_rate_avg,
                'precision': precision_avg,
                'recall': recall_avg,
                'f1_score': f1_avg,
                'n_transacciones': len(metricas_transacciones[f"{modelo}_hit_rate"]),
                
                # NUEVAS: Métricas de ingresos
                'ingreso_promedio_acertado': np.mean(ingresos_acertados),
                'ingreso_promedio_total': np.mean(ingresos_totales),
                'ingreso_promedio_potencial': np.mean(ingresos_potenciales),
                'tasa_captura_promedio': np.mean(tasa_captura),
                'ingreso_total_acertado': sum(ingresos_acertados),
                'ingreso_total_evaluado': sum(ingresos_totales),
                'uplift_monetario_pct': (sum(ingresos_acertados) / sum(ingresos_totales)) * 100 if sum(ingresos_totales) > 0 else 0
            }
            
            print(f"\n🔹 {modelo.upper()}:")
            print(f"  Hit Rate@{k}:     {hit_rate_avg:.3f} ({hit_rate_avg*100:.1f}% de pedidos con al menos 1 acierto)")
            print(f"  Precision@{k}:    {precision_avg:.3f}")
            print(f"  Recall@{k}:       {recall_avg:.3f}")
            print(f"  F1-Score:         {f1_avg:.3f}")
            print(f"  Pedidos evaluados: {len(metricas_transacciones[f'{modelo}_hit_rate'])}")
            print(f"  💰 Ingreso promedio acertado: ${np.mean(ingresos_acertados):.2f}")
            print(f"  💰 Uplift monetario: {(sum(ingresos_acertados) / sum(ingresos_totales)) * 100 if sum(ingresos_totales) > 0 else 0:.2f}%")
    
    return metricas_finales, metricas_transacciones, metricas_ingresos_pedidos

In [134]:
# CONTAR TODAS LAS TRANSACCIONES MULTI-PRODUCTO
print("📊 Contando todas las transacciones multi-producto en datos de test...")

transacciones_grupo = test_data.groupby('pedido')
transacciones_multi_total = 0

for pedido_id, grupo in transacciones_grupo:
    productos = grupo['producto'].unique()
    if len(productos) >= 2:
        transacciones_multi_total += 1

print(f"📈 Total de pedidos multi-producto a evaluar: {transacciones_multi_total}")

# EJECUTAR CON TODOS LOS DATOS CON INGRESOS
print("\n🚀 INICIANDO EVALUACIÓN DE VENTAS CRUZADAS CON TODOS LOS PEDIDOS MULTI-PRODUCTO...")
print("💰 INCLUYENDO análisis de ingresos por pedido...")
print("⚠️  Esto puede tomar mucho tiempo dependiendo del número de pedidos...")

resultados_ventas_cruzadas_completo, metricas_detalladas_completo, metricas_ingresos_completo = evaluar_ventas_cruzadas_por_transaccion_multiproducto(
    n_transacciones_evaluar=transacciones_multi_total,  # TODOS los pedidos multi-producto
    k=10
)


📊 Contando todas las transacciones multi-producto en datos de test...
📈 Total de pedidos multi-producto a evaluar: 16803

🚀 INICIANDO EVALUACIÓN DE VENTAS CRUZADAS CON TODOS LOS PEDIDOS MULTI-PRODUCTO...
💰 INCLUYENDO análisis de ingresos por pedido...
⚠️  Esto puede tomar mucho tiempo dependiendo del número de pedidos...

📊 Analizando transacciones multi-producto en período de validación...
📈 Transacciones multi-producto encontradas: 16803
📊 Estadísticas de tamaño de transacciones:
   - Promedio productos por pedido: 3.74
   - Mediana: 3
   - Máximo: 34
   - Mínimo: 2
📋 Distribución de tamaños de pedido:
   - 2 productos: 6681 pedidos
   - 3 productos: 4275 pedidos
   - 4 productos: 1976 pedidos
   - 5 productos: 1189 pedidos
   - 6 productos: 785 pedidos
   - 7 productos: 513 pedidos
   - 8 productos: 384 pedidos
   - 9 productos: 282 pedidos
   - 10 productos: 215 pedidos
   - 11 productos: 146 pedidos
   - ... y 19 tamaños más

🎯 Evaluando 16803 transacciones...
Metodología: Dado el

In [135]:
# Mostrar resultados completos CON INGRESOS
if resultados_ventas_cruzadas_completo:
    resultados_df_completo = pd.DataFrame(resultados_ventas_cruzadas_completo).T
    print("\n📊 Resultados completos de ventas cruzadas CON MÉTRICAS DE INGRESOS:")
    display(resultados_df_completo)
    
    # Guardar resultados completos con ingresos
    output_dir = '../Datos/validacion_historica'
    os.makedirs(output_dir, exist_ok=True)
    resultados_df_completo.to_csv(f'{output_dir}/metricas_ventas_cruzadas_pedidos_con_ingresos.csv')
    print(f"\n💾 Resultados completos con ingresos guardados en: {output_dir}/metricas_ventas_cruzadas_pedidos_con_ingresos.csv")
    
    # Mostrar resumen de mejores métricas de ingresos
    print(f"\n💰 RESUMEN DE MÉTRICAS DE INGRESOS:")
    print("="*50)
    for modelo in ['content', 'co_purchase', 'co_quotation', 'hybrid']:
        if modelo in resultados_df_completo.index:
            uplift = resultados_df_completo.loc[modelo, 'uplift_monetario_pct']
            ingreso_acertado = resultados_df_completo.loc[modelo, 'ingreso_total_acertado']
            print(f"🔹 {modelo.upper()}: Uplift {uplift:.2f}% | Ingreso capturado: ${ingreso_acertado:,.2f}")


📊 Resultados completos de ventas cruzadas CON MÉTRICAS DE INGRESOS:


Unnamed: 0,hit_rate,precision,recall,f1_score,n_transacciones,ingreso_promedio_acertado,ingreso_promedio_total,ingreso_promedio_potencial,tasa_captura_promedio,ingreso_total_acertado,ingreso_total_evaluado,uplift_monetario_pct
content,0.079272,0.008808,0.043207,0.013414,16803.0,2.258413,132.898684,82.22299,2.029813,37948.1186,2233097.0,1.69935
co_purchase,0.518181,0.07665,0.297912,0.111337,16803.0,17.207164,132.898684,49.685226,15.060112,289131.9718,2233097.0,12.94758
co_quotation,0.391779,0.056561,0.212084,0.080958,6228.0,6.366981,123.861723,78.294775,9.53272,39653.56,771410.8,5.140395
hybrid,0.518181,0.074909,0.297912,0.109828,16803.0,17.207164,132.898684,49.930427,15.060112,289131.9718,2233097.0,12.94758



💾 Resultados completos con ingresos guardados en: ../Datos/validacion_historica/metricas_ventas_cruzadas_pedidos_con_ingresos.csv

💰 RESUMEN DE MÉTRICAS DE INGRESOS:
🔹 CONTENT: Uplift 1.70% | Ingreso capturado: $37,948.12
🔹 CO_PURCHASE: Uplift 12.95% | Ingreso capturado: $289,131.97
🔹 CO_QUOTATION: Uplift 5.14% | Ingreso capturado: $39,653.56
🔹 HYBRID: Uplift 12.95% | Ingreso capturado: $289,131.97
