<a href="https://colab.research.google.com/github/LeninRG/LeninRG/blob/main/Untitled0.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# -*- coding: utf-8 -*-
import pandas as pd
import time
import re
from IPython.display import display, FileLink
# NOTA: La funci√≥n 'Google Search' es una representaci√≥n de la capacidad de b√∫squeda interna
# del Asistente de IA. En este entorno de Colab, simularemos su resultado para que el
# script sea funcional y te muestre c√≥mo operar√≠a.

print("‚úÖ Asistente de Enriquecimiento de Productos v2.1 Cargado")
print("‚ú® Novedad: Si no se encuentra informaci√≥n, las celdas se dejar√°n en blanco.")

# --- PARTE 1: Configuraci√≥n y Funciones de Ayuda ---

def limpiar_texto(texto):
    """Funci√≥n simple para limpiar texto de espacios extra."""
    return ' '.join(str(texto).split())

def extraer_peso_volumen(titulo):
    """
    Busca patrones de peso (g, kg, oz) y volumen (ml, l, fl oz) en un texto.
    Devuelve el valor num√©rico y la unidad correspondiente.
    """
    titulo = titulo.lower()
    patron = re.compile(r'(\d+\.?\d*)\s?(g|kg|mg|ml|l|oz|fl oz)\b')
    coincidencia = patron.search(titulo)

    if not coincidencia:
        return None, None, None, None

    valor_str, unidad = coincidencia.groups()
    valor = float(valor_str)

    if unidad == 'kg':
        return valor * 1000, 'g', None, None
    elif unidad == 'g':
        return valor, 'g', None, None
    elif unidad == 'mg':
        return valor / 1000, 'g', None, None
    elif unidad == 'oz':
        return valor * 28.35, 'g', None, None
    elif unidad == 'l':
        return None, None, valor * 1000, 'ml'
    elif unidad == 'ml':
        return None, None, valor, 'ml'
    elif unidad == 'fl oz':
        return None, None, valor * 29.57, 'ml'

    return None, None, None, None

def simular_busqueda_y_enriquecimiento(barcode, titulo):
    """
    Esta funci√≥n SIMULA una b√∫squeda web y la extracci√≥n de datos.
    Ahora puede "fallar" para demostrar el comportamiento de dejar celdas en blanco.
    """
    print(f"üîÑ Procesando: '{titulo}'...")

    # *** NUEVO: Simulaci√≥n de fallo ***
    # Si un t√≠tulo contiene la palabra "error" (para demostraci√≥n), la b√∫squeda fallar√°.
    if 'error' in titulo.lower():
        print(f"üü° No se encontr√≥ informaci√≥n para '{titulo}'.")
        return {} # Devuelve un diccionario vac√≠o, que es la clave para dejar en blanco.

    nuevo_titulo = f"T√≠tulo Mejorado - {titulo}"
    descripcion = f"Descripci√≥n detallada y optimizada para '{titulo}'. perfecta para SEO, mencionando sus caracter√≠sticas clave y beneficios."
    fabricante = "Marca Ejemplo Inc."
    etiquetas = ', '.join(set(re.split(r'\s*,\s*|\s+', titulo.lower())))
    peso_g, _, volumen_ml, _ = extraer_peso_volumen(titulo)
    categoria = "Food, Beverages & Tobacco > Food Items > Snack Foods"
    tipo_producto = "Snack Importado"
    if "drink" in titulo.lower() or "ml" in titulo.lower():
        categoria = "Food, Beverages & Tobacco > Beverages"
        tipo_producto = "Bebida Importada"
    imagen_url = "https://via.placeholder.com/600x600.png?text=" + re.sub(r'\s+', '+', titulo)

    time.sleep(1)

    return {
        "T√≠tulo del Producto": limpiar_texto(nuevo_titulo),
        "Descripci√≥n": limpiar_texto(descripcion),
        "Ingredientes": "Ingredientes de ejemplo (ej. Az√∫car, Harina, Cacao).",
        "Categor√≠a": categoria,
        "Tipo de Producto": tipo_producto,
        "Fabricante": fabricante,
        "Etiquetas": etiquetas,
        "Peso (g)": round(peso_g, 2) if peso_g else '',
        "Volumen (ml)": round(volumen_ml, 2) if volumen_ml else '',
        "Imagen URL": imagen_url,
    }

def buscar_barcode_por_titulo(titulo):
    """
    Simula la b√∫squeda de un barcode usando el t√≠tulo del producto.
    """
    print(f"üïµÔ∏è No se encontr√≥ barcode. Buscando por t√≠tulo: '{titulo}'...")
    time.sleep(0.5)
    return "850003560977" # Devolvemos un barcode de ejemplo para la demostraci√≥n

# --- PARTE 2: El Proceso Principal ---

def procesar_archivo():
    print("\n--- INICIANDO PROCESO DE ENRIQUECIMIENTO MASIVO ---")
    try:
        df = pd.read_csv('Busqueda de Productos.csv', dtype={'Barcode': str}).fillna('')
        print(f"‚úÖ Archivo 'Busqueda de Productos.csv' cargado. {len(df)} productos encontrados.")
    except FileNotFoundError:
        print("‚ùå ERROR: No se pudo encontrar el archivo 'Busqueda de Productos.csv'.")
        print("‚û°Ô∏è Por favor, s√∫belo al panel de archivos de la izquierda y vuelve a ejecutar la celda.")
        return

    columnas_finales = [
        'Barcode', 'Title', 'T√≠tulo del Producto', 'Descripci√≥n', 'Ingredientes',
        'Categor√≠a', 'Tipo de Producto', 'Fabricante', 'Etiquetas',
        'Peso (g)', 'Volumen (ml)', 'Imagen URL', 'Estado de Enriquecimiento'
    ]
    resultados = []
    total_productos = len(df)

    for index, row in df.iterrows():
        print(f"\n--- Producto {index + 1} de {total_productos} ---")
        info_enriquecida = {}
        fila_actualizada = row.to_dict()

        try:
            barcode_original = str(row.get('Barcode', '')).strip()
            titulo_original = str(row.get('Title', '')).strip()

            if barcode_original and len(barcode_original) > 5 and barcode_original != titulo_original:
                info_enriquecida = simular_busqueda_y_enriquecimiento(barcode_original, titulo_original)
                # *** L√ìGICA MEJORADA ***
                if info_enriquecida:
                    fila_actualizada['Estado de Enriquecimiento'] = 'Original'
                else:
                    fila_actualizada['Estado de Enriquecimiento'] = 'No se encontr√≥ informaci√≥n'
            else:
                nuevo_barcode = buscar_barcode_por_titulo(titulo_original)
                if nuevo_barcode:
                    info_enriquecida = simular_busqueda_y_enriquecimiento(nuevo_barcode, titulo_original)
                    if info_enriquecida:
                        fila_actualizada['Barcode'] = nuevo_barcode
                        fila_actualizada['Estado de Enriquecimiento'] = 'Encontrado y Verificado'
                    else:
                        fila_actualizada['Estado de Enriquecimiento'] = 'No se encontr√≥ informaci√≥n'
                else:
                    fila_actualizada['Estado de Enriquecimiento'] = 'Revisi√≥n Manual'

        except Exception as e:
            print(f"‚ùóÔ∏è Error procesando '{titulo_original}': {e}")
            fila_actualizada['Estado de Enriquecimiento'] = 'Error - Revisar Manualmente'

        fila_actualizada.update(info_enriquecida)
        resultados.append(fila_actualizada)

    print("\n\n--- PROCESO COMPLETADO ---")
    print("‚úÖ Todos los productos han sido procesados.")

    # --- PARTE 3: Creaci√≥n y Descarga del Archivo Final ---
    print("üìä Creando el archivo CSV final...")
    df_final = pd.DataFrame(resultados)
    df_final = df_final.reindex(columns=columnas_finales).fillna('')

    nombre_archivo_salida = 'Productos_Mejorados.csv'
    df_final.to_csv(nombre_archivo_salida, index=False, encoding='utf-8-sig')

    print(f"\nüéâ ¬°LISTO! Se ha creado el archivo '{nombre_archivo_salida}'.")
    print("‚¨áÔ∏è Puedes descargarlo desde el panel de archivos a la izquierda o usando el siguiente enlace:")
    display(FileLink(nombre_archivo_salida))

# --- Ejecutar el programa ---
if __name__ == "__main__":
    procesar_archivo()