## 🔄 Actualización: Schema JSON del LLM Árbitro

Actualizando el schema del LLM árbitro para incluir el código NCM como campos separados en la respuesta JSON. Esto permitirá extraer el código NCM directamente como un campo estructurado.

<a href="https://colab.research.google.com/github/mateoCosta1/notepad_for_RAG/blob/main/gemini/rag-engine/intro_rag_engine.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# Copyright 2024 Google LLC
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# Intro to Building a Scalable and Modular RAG System with RAG Engine in Vertex AI

<table align="left">
  <td style="text-align: center">
    <a href="https://colab.research.google.com/github/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb">
      <img width="32px" src="https://www.gstatic.com/pantheon/images/bigquery/welcome_page/colab-logo.svg" alt="Google Colaboratory logo"><br> Open in Colab
    </a>
  </td>
  <td style="text-align: center">
    <a href="https://console.cloud.google.com/vertex-ai/colab/import/https:%2F%2Fraw.githubusercontent.com%2FGoogleCloudPlatform%2Fgenerative-ai%2Fmain%2Fgemini%2Frag-engine%2Fintro_rag_engine.ipynb">
      <img width="32px" src="https://lh3.googleusercontent.com/JmcxdQi-qOpctIvWKgPtrzZdJJK-J3sWE1RsfjZNwshCFgE_9fULcNpuXYTilIR2hjwN" alt="Google Cloud Colab Enterprise logo"><br> Open in Colab Enterprise
    </a>
  </td>
  <td style="text-align: center">
    <a href="https://console.cloud.google.com/vertex-ai/workbench/deploy-notebook?download_url=https://raw.githubusercontent.com/GoogleCloudPlatform/generative-ai/main/gemini/rag-engine/intro_rag_engine.ipynb">
      <img src="https://www.gstatic.com/images/branding/gcpiconscolors/vertexai/v1/32px.svg" alt="Vertex AI logo"><br> Open in Vertex AI Workbench
    </a>
  </td>
  <td style="text-align: center">
    <a href="https://github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb">
      <img width="32px" src="https://www.svgrepo.com/download/217753/github.svg" alt="GitHub logo"><br> View on GitHub
    </a>
  </td>
</table>

<div style="clear: both;"></div>

<b>Share to:</b>

<a href="https://www.linkedin.com/sharing/share-offsite/?url=https%3A//github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb" target="_blank">
  <img width="20px" src="https://upload.wikimedia.org/wikipedia/commons/8/81/LinkedIn_icon.svg" alt="LinkedIn logo">
</a>

<a href="https://bsky.app/intent/compose?text=https%3A//github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb" target="_blank">
  <img width="20px" src="https://upload.wikimedia.org/wikipedia/commons/7/7a/Bluesky_Logo.svg" alt="Bluesky logo">
</a>

<a href="https://twitter.com/intent/tweet?url=https%3A//github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb" target="_blank">
  <img width="20px" src="https://upload.wikimedia.org/wikipedia/commons/5/5a/X_icon_2.svg" alt="X logo">
</a>

<a href="https://reddit.com/submit?url=https%3A//github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb" target="_blank">
  <img width="20px" src="https://redditinc.com/hubfs/Reddit%20Inc/Brand/Reddit_Logo.png" alt="Reddit logo">
</a>

<a href="https://www.facebook.com/sharer/sharer.php?u=https%3A//github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb" target="_blank">
  <img width="20px" src="https://upload.wikimedia.org/wikipedia/commons/5/51/Facebook_f_logo_%282019%29.svg" alt="Facebook logo">
</a>            

| | |
|-|-|
| Author(s) | [Holt Skinner](https://github.com/holtskinner) |

## Overview

Retrieval Augmented Generation (RAG) improves Large Language Models (LLMs) by allowing them to access and process external information sources during generation. This ensures the model's responses are grounded in factual data and avoids hallucinations.

A common problem with LLMs is that they don't understand private knowledge, that
is, your organization's data. With RAG Engine, you can enrich the
LLM context with additional private information, because the model can reduce
hallucinations and answer questions more accurately.

By combining additional knowledge sources with the existing knowledge that LLMs
have, a better context is provided. The improved context along with the query
enhances the quality of the LLM's response.

The following concepts are key to understanding Vertex AI RAG Engine. These concepts are listed in the order of the
retrieval-augmented generation (RAG) process.

1. **Data ingestion**: Intake data from different data sources. For example,
  local files, Google Cloud Storage, and Google Drive.

1. **Data transformation**: Conversion of the data in preparation for indexing. For example, data is split into chunks.

1. **Embedding**: Numerical representations of words or pieces of text. These numbers capture the
   semantic meaning and context of the text. Similar or related words or text
   tend to have similar embeddings, which means they are closer together in the
   high-dimensional vector space.

1. **Data indexing**: RAG Engine creates an index called a corpus.
   The index structures the knowledge base so it's optimized for searching. For
   example, the index is like a detailed table of contents for a massive
   reference book.

1. **Retrieval**: When a user asks a question or provides a prompt, the retrieval
  component in RAG Engine searches through its knowledge
  base to find information that is relevant to the query.

1. **Generation**: The retrieved information becomes the context added to the
  original user query as a guide for the generative AI model to generate
  factually grounded and relevant responses.

For more information, refer to the public documentation for [Vertex AI RAG Engine](https://cloud.google.com/vertex-ai/generative-ai/docs/rag-overview).

## Get started

### Install Vertex AI SDK and Google Gen AI SDK


In [2]:
%pip install --upgrade --quiet google-cloud-aiplatform google-genai

Note: you may need to restart the kernel to use updated packages.


### Restart runtime

To use the newly installed packages in this Jupyter runtime, you must restart the runtime. You can do this by running the cell below, which restarts the current kernel.

The restart might take a minute or longer. After it's restarted, continue to the next step.

In [None]:
import IPython

app = IPython.Application.instance()
app.kernel.do_shutdown(True)

{'status': 'ok', 'restart': True}

: 

<div class="alert alert-block alert-warning">
<b>⚠️ The kernel is going to restart. Wait until it's finished before continuing to the next step. ⚠️</b>
</div>


### Authenticate your notebook environment (Colab only)

If you're running this notebook on Google Colab, run the cell below to authenticate your environment.

In [3]:
import sys

if "google.colab" in sys.modules:
    from google.colab import auth

    auth.authenticate_user()

### Set Google Cloud project information and initialize Vertex AI SDK

To get started using Vertex AI, you must have an existing Google Cloud project and [enable the Vertex AI API](https://console.cloud.google.com/flows/enableapi?apiid=aiplatform.googleapis.com).

Learn more about [setting up a project and a development environment](https://cloud.google.com/vertex-ai/docs/start/cloud-environment).

In [4]:
# Use the environment variable if the user doesn't provide Project ID.
import os

from google import genai
import vertexai

PROJECT_ID = "first-presence-453619-j6"  # @param {type: "string", placeholder: "[your-project-id]", isTemplate: true}
if not PROJECT_ID or PROJECT_ID == "[your-project-id]":
    PROJECT_ID = str(os.environ.get("GOOGLE_CLOUD_PROJECT"))

LOCATION = os.environ.get("GOOGLE_CLOUD_REGION", "us-central1")

vertexai.init(project=PROJECT_ID, location=LOCATION)
client = genai.Client(vertexai=True, project=PROJECT_ID, location=LOCATION)

### Import libraries

In [5]:
from IPython.display import Markdown, display
from google.genai.types import GenerateContentConfig, Retrieval, Tool, VertexRagStore
from vertexai import rag

### Create a RAG Corpus

In [9]:
# Currently supports Google first-party embedding models
EMBEDDING_MODEL = "publishers/google/models/text-embedding-005"  # @param {type:"string", isTemplate: true}

rag_corpus = rag.create_corpus(
    display_name="my-rag-corpus",
    backend_config=rag.RagVectorDbConfig(
        rag_embedding_model_config=rag.RagEmbeddingModelConfig(
            vertex_prediction_endpoint=rag.VertexPredictionEndpoint(
                publisher_model=EMBEDDING_MODEL
            )
        )
    ),
)

### Check the corpus just created

In [10]:
rag.list_corpora()

ListRagCorporaPager<rag_corpora {
  name: "projects/first-presence-453619-j6/locations/us-central1/ragCorpora/4611686018427387904"
  display_name: "my-rag-corpus"
  create_time {
    seconds: 1754526577
    nanos: 939614000
  }
  update_time {
    seconds: 1754526577
    nanos: 939614000
  }
  corpus_status {
    state: ACTIVE
  }
  vector_db_config {
    rag_managed_db {
      knn {
      }
    }
    rag_embedding_model_config {
      vertex_prediction_endpoint {
        endpoint: "projects/first-presence-453619-j6/locations/us-central1/publishers/google/models/text-embedding-005"
      }
    }
  }
}
rag_corpora {
  name: "projects/first-presence-453619-j6/locations/us-central1/ragCorpora/2305843009213693952"
  display_name: "my-rag-corpus"
  create_time {
    seconds: 1754545106
    nanos: 637583000
  }
  update_time {
    seconds: 1754545106
    nanos: 637583000
  }
  corpus_status {
    state: ACTIVE
  }
  vector_db_config {
    rag_managed_db {
      knn {
      }
    }
    rag_em

### Upload a local file to the corpus

In [8]:
%%writefile test.md

Retrieval-Augmented Generation (RAG) is a technique that enhances the capabilities of large language models (LLMs) by allowing them to access and incorporate external data sources when generating responses. Here's a breakdown:

**What it is:**

* **Combining Retrieval and Generation:**
    * RAG combines the strengths of information retrieval systems (like search engines) with the generative power of LLMs.
    * It enables LLMs to go beyond their pre-trained data and access up-to-date and specific information.
* **How it works:**
    * When a user asks a question, the RAG system first retrieves relevant information from external data sources (e.g., databases, documents, web pages).
    * This retrieved information is then provided to the LLM as additional context.
    * The LLM uses this augmented context to generate a more accurate and informative response.

**Why it's helpful:**

* **Access to Up-to-Date Information:**
    * LLMs are trained on static datasets, so their knowledge can become outdated. RAG allows them to access real-time or frequently updated information.
* **Improved Accuracy and Factual Grounding:**
    * RAG reduces the risk of LLM "hallucinations" (generating false or misleading information) by grounding responses in verified external data.
* **Enhanced Contextual Relevance:**
    * By providing relevant context, RAG enables LLMs to generate more precise and tailored responses to specific queries.
* **Increased Trust and Transparency:**
    * RAG can provide source citations, allowing users to verify the information and increasing trust in the LLM's responses.
* **Cost Efficiency:**
    * Rather than constantly retraining large language models, RAG allows for the introduction of new data in a more cost effective way.

In essence, RAG bridges the gap between the vast knowledge of LLMs and the need for accurate, current, and contextually relevant information.


Writing test.md


### Subir Arancel Nacional de Uruguay

Ahora vamos a subir el arancel nacional de Uruguay para hacer consultas de clasificación arancelaria.

In [16]:
rag_file = rag.upload_file(
    corpus_name=rag_corpus.name,
    path="../../Arancel Nacional_Abril 2024.pdf",  # Usar el archivo PDF directamente
    display_name="Arancel Nacional Uruguay Abril 2024",
    description="Arancel Nacional de Uruguay con códigos NCM, descripciones y tarifas actualizadas a Abril 2024 (formato PDF)",
)

### Import files from Google Cloud Storage

Remember to grant "Viewer" access to the "Vertex RAG Data Service Agent" (with the format of `service-{project_number}@gcp-sa-vertex-rag.iam.gserviceaccount.com`) for your Google Cloud Storage bucket.

For this example, we'll use a public GCS bucket containing earning reports from Alphabet.

In [None]:
# Configuración optimizada para el arancel uruguayo en formato PDF
# INPUT_GCS_BUCKET = (
#     "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/"
# )

# Para el arancel uruguayo en PDF, usamos configuración específica para documentos estructurados
response = rag.import_files(
    corpus_name=rag_corpus.name,
    paths=["../../Arancel Nacional_Abril 2024.pdf"],  # Usar el archivo PDF
    # Configuración optimizada para documentos PDF con tablas arancelarias
    transformation_config=rag.TransformationConfig(
        chunking_config=rag.ChunkingConfig(
            chunk_size=1000,  # Tamaño apropiado para entradas del arancel en PDF
            chunk_overlap=150  # Overlap mayor para mantener contexto entre códigos relacionados
        )
    ),
    max_embedding_requests_per_min=900,  # Optional
)

### Import files from Google Drive

Eligible paths can be formatted as:

- `https://drive.google.com/drive/folders/{folder_id}`
- `https://drive.google.com/file/d/{file_id}`.

Remember to grant "Viewer" access to the "Vertex RAG Data Service Agent" (with the format of `service-{project_number}@gcp-sa-vertex-rag.iam.gserviceaccount.com`) for your Drive folder/files.


In [19]:
response = rag.import_files(
    corpus_name=rag_corpus.name,
    paths=["https://drive.google.com/file/d/1sLFbb_ncJ5yYvBYocU7kDxZAF1X3zG8H"],
    # Optional
    transformation_config=rag.TransformationConfig(
        chunking_config=rag.ChunkingConfig(chunk_size=512, chunk_overlap=50)
    ),
)

### Optional: Perform direct context retrieval

In [15]:
# Direct context retrieval
response = rag.retrieval_query(
    rag_resources=[
        rag.RagResource(
            rag_corpus=rag_corpus.name,
            # Optional: supply IDs from `rag.list_files()`.
            # rag_file_ids=["rag-file-1", "rag-file-2", ...],
        )
    ],
    rag_retrieval_config=rag.RagRetrievalConfig(
        top_k=10,  # Optional
        filter=rag.Filter(
            vector_distance_threshold=0.5,  # Optional
        ),
    ),
    text="What is RAG and why it is helpful?",
)
print(response)

# Optional: The retrieved context can be passed to any SDK or model generation API to generate final results.
# context = " ".join([context.text for context in response.contexts.contexts]).replace("\n", "")

contexts {
  contexts {
    source_uri: "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2021_alphabet_annual_report.pdf"
    text: "Information\r\n1WTYGDUKVGKUNQECVGFCVYYY CDE Z[\\ CPFQWTKPXGUVQTTGNCVKQPUYGDUKVGKUNQECVGFCVYYY CDE Z[\\ KPXGUVQT 1WT#PPWCN4GRQTVU\r\nQP(QTO   - 3WCTVGTN[4GRQTVUQP(QTO   3 %WTTGPV4GRQTVUQP(QTO  - CPFQWT2TQZ[5VCVGOGPVU CPFCP[COGPFOGPVUVQ\r\nVJGUGTGRQTVU CTGCXCKNCDNGVJTQWIJQWTKPXGUVQTTGNCVKQPUYGDUKVG HTGGQHEJCTIG CHVGTYGƒNGVJGOYKVJVJG5\'% 9GCNUQRTQXKFGC\r\nNKPMVQVJGUGEVKQPQHVJG5\'%ŦUYGDUKVGCVYYY UGE IQXVJCVJCUCNNQHVJGTGRQTVUVJCVYGƒNGQTHWTPKUJYKVJVJG5\'%   J G K T E Q O R N K C P E G Y K V J ) Q Q I N G Ŧ U 5 W R R N K G T % Q F G Q H % Q P F W E V   9 G E Q P V K P W C N N [ O C M G K O R T Q X G O G P V U V Q R T Q O Q V G C \r \n T G U R G E V H W N C P F R Q U K V K X G Y Q T M K P I G P X K T Q P O G P V H Q T G X G T [ Q P G ţ G O R N Q [ G G U   X G P F Q T U   C P F V G O R Q T C T [ U V C H H C N K M G   \r \n G o v e r n m e n t

### Create RAG Retrieval Tool

In [19]:
# Create a tool for the RAG Corpus
rag_retrieval_tool = Tool(
    retrieval=Retrieval(
        vertex_rag_store=VertexRagStore(
            rag_corpora=[rag_corpus.name],
            similarity_top_k=10,
            vector_distance_threshold=0.5,
        )
    )
)

### Generate Content with Gemini using RAG Retrieval Tool

In [20]:
MODEL_ID = "gemini-2.0-flash-001"

In [21]:
response = client.models.generate_content(
    model=MODEL_ID,
    contents="List me your provided documents",
    config=GenerateContentConfig(tools=[rag_retrieval_tool]),
)

display(Markdown(response.text))

The documents provided are:

*   Arancel Nacional Uruguay Abril 2024: 4 0 10
*   Arancel Nacional Uruguay Abril 2024: 22.00.10
*   Arancel Nacional Uruguay Abril 2024: 22.00.10 Crudos
*   Arancel Nacional Uruguay Abril 2024: 59.90.00
*   Arancel Nacional Uruguay Abril 2024: 10.80 10.8 0 10
*   Arancel Nacional Uruguay Abril 2024: 29.90.10
*   Arancel Nacional Uruguay Abril 2024: 1209.10.00.00
*   Arancel Nacional Uruguay Abril 2024: 80 10.8 0 10
*   Arancel Nacional Uruguay Abril 2024: 21.00.00
*   Arancel Nacional Uruguay Abril 2024


### Funciones para Consultar el Arancel Uruguayo

Ahora crearemos funciones específicas para consultar códigos arancelarios y tarifas del arancel nacional de Uruguay.

In [22]:
# Función especializada para consultar el arancel uruguayo
def consultar_arancel_uruguay(descripcion_producto):
    response = client.models.generate_content(
        model=MODEL_ID,
        contents=f"""
        Basándote en el Arancel Nacional de Uruguay (Abril 2024), encuentra la clasificación arancelaria para:
        
        PRODUCTO: {descripcion_producto}
        
        Proporciona la información en este formato exacto:
        
        **Código NCM:** [código de 8 dígitos]
        **Descripción:** [descripción oficial del arancel]
        **TEA (%):** [Tarifa Externa de Arancel]
        **Régimen:** [información sobre régimen especial si aplica]
        **Observaciones:** [notas adicionales si las hay]
        
        Si hay múltiples códigos posibles, lista los 2 más apropiados.
        """,
        config=GenerateContentConfig(tools=[rag_retrieval_tool]),
    )
    return response

In [60]:
# Casos de prueba específicos para el mercado uruguayo
productos_test = [
    "Café verde en grano sin tostar",
    "Smartphone con pantalla táctil",
    "Carne bovina congelada",
    "Vino tinto en botellas de vidrio",
    "Computadora portátil",
    "Medicamentos para diabetes",
    "Aceite de girasol refinado",
    "Neumáticos para automóvil",
    "Queso tipo mozzarella",
    "Arroz blanco pulido"
]

print("=== CONSULTAS AL ARANCEL NACIONAL URUGUAY ===\n")

for i, producto in enumerate(productos_test[:3], 1):  # Probamos solo los primeros 3
    print(f"{i}. PRODUCTO: {producto}")
    resultado = consultar_arancel_uruguay(producto)
    display(Markdown(resultado.text))
    print("\n" + "="*70 + "\n")

=== CONSULTAS AL ARANCEL NACIONAL URUGUAY ===

1. PRODUCTO: Café verde en grano sin tostar


No puedo proporcionar la clasificación arancelaria para "Café verde en grano sin tostar" porque no hay información sobre café en los resultados de búsqueda proporcionados.




2. PRODUCTO: Smartphone con pantalla táctil


No puedo proporcionar la clasificación arancelaria para un smartphone con pantalla táctil, ya que no hay información sobre ese producto en los resultados de búsqueda proporcionados.




3. PRODUCTO: Carne bovina congelada


**Código NCM:** 0202.10.00.00
**Descripción:** En canales o medias canales
**TEA (%):** 9
**Régimen:** Ninguno especificado
**Observaciones:** N/A

**Código NCM:** 0202.20
**Descripción:** Los demás cortes (trozos) sin deshuesar
**TEA (%):** 9
**Régimen:** Ninguno especificado
**Observaciones:** N/A






### Generate Content with Llama3 using RAG Retrieval Tool

## 🔄 Generación de Descripciones Técnicas del Arancel

Esta función toma una descripción de producto en lenguaje coloquial y genera múltiples descripciones alternativas usando el lenguaje formal y técnico característico del arancel uruguayo. Esto mejora significativamente la precisión del RAG al crear un "puente" entre el lenguaje cotidiano y la terminología arancelaria oficial.

In [38]:
def generar_descripciones_arancel(descripcion_producto, modelo="gemini", num_alternativas=5):
    """
    Genera descripciones alternativas de un producto usando el lenguaje técnico 
    y formal característico del arancel uruguayo para mejorar la precisión del RAG.
    
    Args:
        descripcion_producto (str): Descripción del producto en lenguaje coloquial
        modelo (str): Modelo a usar ("gemini" o "llama")
        num_alternativas (int): Número de descripciones alternativas a generar
        
    Returns:
        list: Lista de descripciones técnicas alternativas
    """
    
    prompt = f"""
    Actúa como un experto en clasificación arancelaria uruguaya. Tu tarea es generar {num_alternativas} descripciones alternativas para el siguiente producto, usando el lenguaje técnico y formal característico del arancel nacional uruguayo.

    PRODUCTO A ANALIZAR: {descripcion_producto}

    INSTRUCCIONES:
    1. Genera {num_alternativas} descripciones técnicas diferentes del producto
    2. Usa terminología específica del arancel (materiales, procesos, usos, características técnicas)
    3. Incluye posibles sinónimos técnicos y variaciones terminológicas
    4. Considera diferentes aspectos: composición, función, uso industrial/comercial, método de fabricación
    5. Mantén el formato y estilo de las descripciones del arancel uruguayo
    6. No inventes códigos NCM, solo genera las descripciones

    EJEMPLOS DE LENGUAJE ARANCELARIO:
    - "Artículos de..." en lugar de "productos de..."
    - "Manufacturas de..." en lugar de "hechos de..."
    - "Aparatos y material para..." en lugar de "equipos para..."
    - "Preparaciones..." para productos procesados
    - Especificaciones técnicas como "con contenido de...", "de peso superior a...", etc.

    Formato de respuesta:
    1. [Primera descripción técnica]
    2. [Segunda descripción técnica]
    3. [Tercera descripción técnica]
    4. [Cuarta descripción técnica]
    5. [Quinta descripción técnica]

    Responde únicamente con las descripciones numeradas, sin explicaciones adicionales.
    """
    
    try:
        response = client.models.generate_content(
                model=MODEL_ID,
                contents=prompt
            )
        resultado = response.text
        
        # Procesar la respuesta para extraer las descripciones
        lineas = resultado.strip().split('\n')
        descripciones = []
        
        for linea in lineas:
            linea = linea.strip()
            if linea and (linea.startswith(tuple('12345')) or linea.startswith('-') or linea.startswith('•')):
                # Limpiar numeración y caracteres especiales
                descripcion_limpia = linea
                for i in range(1, 10):
                    descripcion_limpia = descripcion_limpia.replace(f"{i}. ", "").replace(f"{i}.", "")
                descripcion_limpia = descripcion_limpia.replace("- ", "").replace("• ", "").strip()
                
                if descripcion_limpia and len(descripcion_limpia) > 10:  # Filtrar descripciones muy cortas
                    descripciones.append(descripcion_limpia)
        
        # Si no se pudieron extraer descripciones del formato, usar el texto completo dividido
        if len(descripciones) < 2:
            parrafos = [p.strip() for p in resultado.split('\n') if p.strip() and len(p.strip()) > 20]
            descripciones = parrafos[:num_alternativas]
        
        # Asegurar que tenemos al menos algunas descripciones
        if not descripciones:
            descripciones = [resultado.strip()]
        
        return descripciones[:num_alternativas]
        
    except Exception as e:
        print(f"❌ Error al generar descripciones técnicas: {e}")
        return [descripcion_producto]  # Devolver la descripción original como fallback


def consultar_con_descripciones_mejoradas(descripcion_producto, modelo="gemini", usar_descripciones_tecnicas=True):
    """
    Consulta el arancel usando descripciones técnicas generadas automáticamente 
    para mejorar la precisión del RAG.
    
    Args:
        descripcion_producto (str): Descripción del producto en lenguaje coloquial
        modelo (str): Modelo a usar ("gemini" o "llama")
        usar_descripciones_tecnicas (bool): Si generar descripciones técnicas adicionales
        
    Returns:
        dict: Resultados de la consulta con descripciones técnicas
    """
    
    print(f"🔍 Consultando arancel para: '{descripcion_producto}'")
    print(f"🤖 Modelo seleccionado: {modelo}")
    
    # Generar descripciones técnicas si está habilitado
    descripciones_para_consultar = [descripcion_producto]
    
    if usar_descripciones_tecnicas:
        print("🔄 Generando descripciones técnicas alternativas...")
        descripciones_tecnicas = generar_descripciones_arancel(descripcion_producto, modelo, 3)
        descripciones_para_consultar.extend(descripciones_tecnicas)
        
        print("📝 Descripciones técnicas generadas:")
        for i, desc in enumerate(descripciones_tecnicas, 1):
            print(f"   {i}. {desc}")
        print()
    
    # Realizar consultas con todas las descripciones
    resultados = {}
    
    for i, descripcion in enumerate(descripciones_para_consultar):
        etiqueta = "Original" if i == 0 else f"Técnica {i}"
        print(f"🔍 Consultando con descripción {etiqueta}...")
        
        try:
            resultado = consultar_arancel_uruguay(descripcion)
            
            resultados[etiqueta] = {
                "descripcion_usada": descripcion,
                "resultado": resultado.text if hasattr(resultado, 'text') else str(resultado)
            }
            
        except Exception as e:
            print(f"❌ Error en consulta {etiqueta}: {e}")
            resultados[etiqueta] = {
                "descripcion_usada": descripcion,
                "resultado": f"Error: {e}"
            }
    
    return resultados

### 🧪 Ejemplos de Generación de Descripciones Técnicas

Demostraciones de cómo la función mejora la precisión del RAG transformando descripciones coloquiales en lenguaje técnico arancelario.

In [61]:
# Ejemplo 1: Generación de descripciones técnicas para un producto común
producto_ejemplo = "zapatillas deportivas"

print("🔄 Generando descripciones técnicas del arancel...")
print(f"📦 Producto original: '{producto_ejemplo}'")
print("=" * 60)

descripciones_tecnicas = generar_descripciones_arancel(producto_ejemplo, modelo="gemini", num_alternativas=4)

print("📝 Descripciones técnicas generadas:")
for i, descripcion in enumerate(descripciones_tecnicas, 1):
    print(f"\n{i}. {descripcion}")

print("\n" + "=" * 60)
print("✅ Las descripciones técnicas ayudan al RAG a encontrar clasificaciones más precisas en el arancel.")

🔄 Generando descripciones técnicas del arancel...
📦 Producto original: 'zapatillas deportivas'
📝 Descripciones técnicas generadas:

1. Calzado deportivo con suela de caucho o plástico y parte superior de materias textiles, concebido para la práctica de ejercicios físicos o actividades deportivas, que recubre total o parcialmente el pie, presentando características de flexibilidad, ligereza y amortiguación. Puede incluir refuerzos, elementos de sujeción (cordones, velcro, etc.) y plantillas interiores removibles.

2. Artículos de calzado, manufacturados con suela de caucho vulcanizado o materias plásticas, adherida a la parte superior mediante encolado, cosido o vulcanización, y parte superior constituida por tejidos sintéticos o artificiales, diseñados específicamente para la práctica deportiva. Presentan un diseño ergonómico adaptado al pie, con características de transpirabilidad y resistencia al desgaste. Podrán incorporar elementos reflectantes o protectores.

3. Calzado para depor

In [62]:
# Ejemplo 2: Consulta completa con descripciones técnicas mejoradas
producto_test_mejorado = "cámara digital"

print("🚀 CONSULTA CON DESCRIPCIONES TÉCNICAS MEJORADAS")
print("=" * 70)

# Realizar consulta con descripciones técnicas automáticas
resultados_mejorados = consultar_con_descripciones_mejoradas(
    producto_test_mejorado, 
    modelo="gemini", 
    usar_descripciones_tecnicas=True
)

print("\n📊 RESULTADOS COMPARATIVOS:")
print("=" * 70)

for etiqueta, datos in resultados_mejorados.items():
    print(f"\n🔹 {etiqueta.upper()}:")
    print(f"   📝 Descripción: {datos['descripcion_usada']}")
    print(f"   🎯 Resultado: {datos['resultado'][:200]}...")
    print("-" * 50)

🚀 CONSULTA CON DESCRIPCIONES TÉCNICAS MEJORADAS
🔍 Consultando arancel para: 'cámara digital'
🤖 Modelo seleccionado: gemini
🔄 Generando descripciones técnicas alternativas...
📝 Descripciones técnicas generadas:
   1. Aparatos fotográficos digitales, provistos de sensor de imagen del tipo semiconductor complementario de óxido metálico (CMOS) o dispositivo de carga acoplada (CCD), con capacidad de registro de imágenes fijas y/o video, incluso con lente incorporada y pantalla de visualización de cristal líquido (LCD) o tecnología similar, diseñados para uso doméstico o profesional.
   2. Aparatos de grabación de imagen, que comprenden cámaras digitales para la captación de imágenes fijas o en movimiento, con resolución superior a 0.3 megapíxeles, que utilizan medios de almacenamiento electrónicos (tarjetas de memoria, discos duros, etc.) para el registro de datos, incluso si se presentan en conjuntos (kits) con accesorios tales como baterías, cargadores, cables de conexión o software.
   3

In [40]:
# Ejemplo 3: Comparación directa - Consulta simple vs. Consulta con descripciones técnicas
producto_comparacion = "auriculares inalámbricos con cancelación de ruido"

print("🆚 COMPARACIÓN: CONSULTA SIMPLE vs. CONSULTA MEJORADA")
print("=" * 80)

# Consulta simple (tradicional)
print("1️⃣ CONSULTA SIMPLE (método tradicional):")
print("-" * 50)
try:
    resultado_simple = consultar_arancel_uruguay(producto_comparacion)
    print(f"📱 Producto: {producto_comparacion}")
    print(f"🎯 Resultado: {resultado_simple.text[:300]}...")
except Exception as e:
    print(f"❌ Error en consulta simple: {e}")

print("\n" + "=" * 80)

# Consulta mejorada con descripciones técnicas
print("2️⃣ CONSULTA MEJORADA (con descripciones técnicas):")
print("-" * 50)
try:
    resultados_tecnicos = consultar_con_descripciones_mejoradas(
        producto_comparacion, 
        modelo="gemini", 
        usar_descripciones_tecnicas=True
    )

    for etiqueta, datos in resultados_tecnicos.items():
        print(f"\n🔹 {etiqueta.upper()}:")
        print(f"   📝 Descripción: {datos['descripcion_usada']}")
        print(f"   🎯 Resultado: {datos['resultado'][:200]}...")
        print("-" * 50)
    
    
except Exception as e:
    print(f"❌ Error en consulta mejorada: {e}")


🆚 COMPARACIÓN: CONSULTA SIMPLE vs. CONSULTA MEJORADA
1️⃣ CONSULTA SIMPLE (método tradicional):
--------------------------------------------------
📱 Producto: Smartphone con pantalla táctil
🎯 Resultado: Dado que los resultados de búsqueda proporcionados no contienen información específica sobre la clasificación arancelaria para smartphones con pantalla táctil, no puedo proporcionar el código NCM, la descripción, el TEA, el régimen ni las observaciones solicitadas.
...

2️⃣ CONSULTA MEJORADA (con descripciones técnicas):
--------------------------------------------------
🔍 Consultando arancel para: 'Smartphone con pantalla táctil'
🤖 Modelo seleccionado: gemini
🔄 Generando descripciones técnicas alternativas...
📱 Producto: Smartphone con pantalla táctil
🎯 Resultado: Dado que los resultados de búsqueda proporcionados no contienen información específica sobre la clasificación arancelaria para smartphones con pantalla táctil, no puedo proporcionar el código NCM, la descripción, el TEA, el ré

### 🎯 Función Utilitaria Final - Flujo Completo de Clasificación

Función todo-en-uno que combina generación de descripciones técnicas, consulta RAG mejorada, y validación de códigos NCM.

In [None]:
def clasificar_producto_completo(descripcion_producto, modelo_preferido="gemini", validar_codigo=True):
    """
    Función completa que realiza todo el flujo de clasificación arancelaria:
    1. Genera descripciones técnicas alternativas
    2. Consulta el RAG con múltiples descripciones
    3. Extrae y valida códigos NCM encontrados
    4. Proporciona recomendaciones finales
    
    Args:
        descripcion_producto (str): Descripción del producto a clasificar
        modelo_preferido (str): Modelo preferido ("gemini" o "llama")
        validar_codigo (bool): Si validar códigos NCM encontrados
        
    Returns:
        dict: Reporte completo de clasificación
    """
    
    print("🎯 SISTEMA COMPLETO DE CLASIFICACIÓN ARANCELARIA")
    print("=" * 80)
    print(f"📦 Producto a clasificar: '{descripcion_producto}'")
    print(f"🤖 Modelo preferido: {modelo_preferido}")
    print("=" * 80)
    
    reporte = {
        "producto_original": descripcion_producto,
        "modelo_usado": modelo_preferido,
        "descripciones_tecnicas": [],
        "resultados_consultas": {},
        "codigos_encontrados": [],
        "validaciones": {},
        "recomendacion_final": ""
    }
    
    try:
        # Paso 1: Generar descripciones técnicas
        print("\n🔄 PASO 1: Generando descripciones técnicas...")
        descripciones_tecnicas = generar_descripciones_arancel(
            descripcion_producto, modelo_preferido, 3
        )
        reporte["descripciones_tecnicas"] = descripciones_tecnicas
        
        print("✅ Descripciones técnicas generadas:")
        for i, desc in enumerate(descripciones_tecnicas, 1):
            print(f"   {i}. {desc[:80]}...")
        
        # Paso 2: Realizar consultas mejoradas
        print("\n🔍 PASO 2: Consultando arancel con descripciones mejoradas...")
        resultados = consultar_con_descripciones_mejoradas(
            descripcion_producto, modelo_preferido, True
        )
        reporte["resultados_consultas"] = resultados
        
        # Paso 3: Extraer códigos NCM de las respuestas
        print("\n🔢 PASO 3: Extrayendo códigos NCM...")
        import re
        codigos_encontrados = set()
        
        for etiqueta, datos in resultados.items():
            texto_resultado = datos["resultado"]
            # Buscar patrones de códigos NCM (8 dígitos, a veces con puntos)
            patrones_ncm = re.findall(r'\b\d{4}\.?\d{2}\.?\d{2}\b', texto_resultado)
            codigos_encontrados.update(patrones_ncm)
        
        reporte["codigos_encontrados"] = list(codigos_encontrados)
        
        if codigos_encontrados:
            print(f"✅ Códigos NCM encontrados: {', '.join(codigos_encontrados)}")
        else:
            print("⚠️  No se encontraron códigos NCM específicos en las respuestas")
        
        # Paso 4: Validar códigos si está habilitado
        if validar_codigo and codigos_encontrados:
            print("\n✔️  PASO 4: Validando códigos NCM...")
            for codigo in list(codigos_encontrados)[:3]:  # Validar máximo 3 códigos
                try:
                    resultado_validacion = validar_codigo_ncm(codigo, modelo_preferido)
                    reporte["validaciones"][codigo] = resultado_validacion.text if hasattr(resultado_validacion, 'text') else str(resultado_validacion)
                    print(f"   ✅ Código {codigo}: Validado")
                except Exception as e:
                    print(f"   ❌ Error validando {codigo}: {e}")
                    reporte["validaciones"][codigo] = f"Error: {e}"
        
        # Paso 5: Generar recomendación final
        print("\n📋 PASO 5: Generando recomendación final...")
        
        if codigos_encontrados:
            recomendacion = f"""
            RECOMENDACIÓN DE CLASIFICACIÓN:
            
            📦 Producto: {descripcion_producto}
            🔢 Códigos NCM sugeridos: {', '.join(list(codigos_encontrados)[:3])}
            🤖 Análisis realizado con: {modelo_preferido}
            ✅ Descripciones técnicas generadas: {len(descripciones_tecnicas)}
            
            Se recomienda verificar los códigos sugeridos con el arancel oficial 
            y considerar las características específicas del producto.
            """
        else:
            recomendacion = f"""
            ANÁLISIS COMPLETADO:
            
            📦 Producto: {descripcion_producto}
            ⚠️  No se identificaron códigos NCM específicos
            🤖 Análisis realizado con: {modelo_preferido}
            ✅ Descripciones técnicas generadas: {len(descripciones_tecnicas)}
            
            Se recomienda revisar manualmente las consultas generadas 
            o proporcionar una descripción más específica del producto.
            """
        
        reporte["recomendacion_final"] = recomendacion
        print(recomendacion)
        
        print("\n" + "=" * 80)
        print("🎉 CLASIFICACIÓN COMPLETA FINALIZADA")
        print("=" * 80)
        
        return reporte
        
    except Exception as e:
        error_msg = f"❌ Error en el proceso de clasificación: {e}"
        print(error_msg)
        reporte["error"] = error_msg
        return reporte


# Función de demostración con productos de ejemplo
def demo_clasificacion_completa():
    """Demuestra el sistema completo con varios productos de ejemplo"""
    
    productos_demo = [
        "tablet con pantalla táctil",
        "zapatos de cuero para hombre", 
        "aceite de oliva extra virgen"
    ]
    
    print("🚀 DEMOSTRACIÓN DEL SISTEMA COMPLETO DE CLASIFICACIÓN")
    print("=" * 90)
    
    for i, producto in enumerate(productos_demo, 1):
        print(f"\n🎯 DEMO {i}/3:")
        print("-" * 60)
        
        reporte = clasificar_producto_completo(producto, "gemini", True)
        
        print(f"\n📊 RESUMEN DEMO {i}:")
        print(f"   ✅ Descripciones técnicas: {len(reporte.get('descripciones_tecnicas', []))}")
        print(f"   ✅ Consultas realizadas: {len(reporte.get('resultados_consultas', {}))}")
        print(f"   ✅ Códigos encontrados: {len(reporte.get('codigos_encontrados', []))}")
        
        if i < len(productos_demo):
            print("\n" + "⏭️ " * 20)
    
    print(f"\n🎉 DEMOSTRACIÓN COMPLETA FINALIZADA")
    print("=" * 90)


In [64]:
demo_clasificacion_completa()

🚀 DEMOSTRACIÓN DEL SISTEMA COMPLETO DE CLASIFICACIÓN

🎯 DEMO 1/3:
------------------------------------------------------------
🎯 SISTEMA COMPLETO DE CLASIFICACIÓN ARANCELARIA
📦 Producto a clasificar: 'tablet con pantalla táctil'
🤖 Modelo preferido: gemini

🔄 PASO 1: Generando descripciones técnicas...
✅ Descripciones técnicas generadas:
   1. Aparatos digitales portátiles para tratamiento o procesamiento de datos, de peso...
   2. Unidades de entrada o de salida, incluso con elementos de memoria, que comprende...
   3. Artículos electrónicos multifuncionales que combinan las funciones de un ordenad...

🔍 PASO 2: Consultando arancel con descripciones mejoradas...
🔍 Consultando arancel para: 'tablet con pantalla táctil'
🤖 Modelo seleccionado: gemini
🔄 Generando descripciones técnicas alternativas...
📝 Descripciones técnicas generadas:
   1. Aparatos receptores de radiotelefonía, radiotelegrafía o radiodifusión, incluso combinados con aparatos de grabación o reproducción de sonido; vídeo 

## 📚 Guía de Uso - Nuevas Funcionalidades

### 🆕 Funciones Añadidas para Mejorar la Precisión del RAG

**1. `generar_descripciones_arancel(descripcion_producto, modelo, num_alternativas)`**
- Convierte descripciones coloquiales en lenguaje técnico del arancel
- Genera múltiples variaciones terminológicas
- Mejora significativamente la precisión del RAG

**2. `consultar_con_descripciones_mejoradas(descripcion_producto, modelo, usar_descripciones_tecnicas)`**
- Realiza consultas usando tanto la descripción original como las técnicas generadas
- Compara resultados entre diferentes enfoques
- Proporciona mayor cobertura de clasificación

**3. `clasificar_producto_completo(descripcion_producto, modelo_preferido, validar_codigo)`**
- Flujo completo end-to-end de clasificación arancelaria
- Integra generación de descripciones, consulta RAG, extracción y validación de códigos NCM
- Genera reporte completo con recomendaciones

### 🎯 Ejemplos de Uso Rápido

```python
# Uso básico - generar descripciones técnicas
descripciones = generar_descripciones_arancel("smartphone", "gemini", 3)

# Consulta mejorada con descripciones técnicas
resultados = consultar_con_descripciones_mejoradas("cámara digital", "gemini", True)

# Flujo completo de clasificación
reporte = clasificar_producto_completo("zapatillas deportivas", "gemini", True)

# Demostración con múltiples productos
demo_clasificacion_completa()
```

### 🚀 Beneficios de las Mejoras

- **Mayor Precisión**: Las descripciones técnicas mejoran la coincidencia con el lenguaje del arancel
- **Mejor Cobertura**: Múltiples consultas capturan diferentes aspectos del producto
- **Automatización**: Proceso completo automatizado de principio a fin
- **Flexibilidad**: Compatible con Gemini y Llama3/modelos alternativos
- **Validación**: Incluye verificación automática de códigos NCM encontrados

¡El sistema está listo para uso en producción con clasificación arancelaria mejorada! 🎉

## 🤖 Selección Automática de Respuestas RAG

Implementación del flujo completo: generar descripciones técnicas → consultar RAG → seleccionar automáticamente la mejor respuesta usando LLM como árbitro.

In [None]:
def filtrar_respuestas_invalidas(candidatos_respuestas):
    """
    Filtra respuestas inválidas antes de enviar al LLM árbitro.
    Elimina respuestas que contengan frases de rechazo o sean claramente inútiles.
    
    Args:
        candidatos_respuestas (list): Lista de respuestas candidatas
        
    Returns:
        list: Lista filtrada sin respuestas inválidas
    """
    
    # Patrones que indican respuestas inválidas
    patrones_invalidos = [
        "No puedo proporcionar la clasificación arancelaria",
        "No puedo proporcionar información sobre clasificación arancelaria",
        "No tengo acceso a la información específica",
        "No puedo ayudar con clasificación arancelaria",
        "Lo siento, no puedo",
        "No tengo la capacidad de",
        "No puedo acceder a",
        "Error:"
    ]
    
    candidatos_validos = []
    
    for candidato in candidatos_respuestas:
        respuesta_texto = candidato.get("respuesta_rag", "").lower()
        
        # Verificar si la respuesta contiene algún patrón inválido
        es_invalida = False
        for patron in patrones_invalidos:
            if patron.lower() in respuesta_texto:
                es_invalida = True
                break

        # Si la respuesta es válida, agregarla a la lista
        if not es_invalida:
            candidatos_validos.append(candidato)
    
    return candidatos_validos


def consultar_y_seleccionar_automatico(descripcion_producto, modelo="gemini", num_descripciones=5):
    """
    Flujo completo automatizado: genera descripciones técnicas, consulta RAG múltiple,
    y usa LLM como árbitro para seleccionar automáticamente la mejor respuesta.
    
    Implementa el mismo patrón que llm_classifier.py:
    1. Descripción → Sinónimos técnicos
    2. Múltiples consultas RAG 
    3. LLM selecciona la mejor opción
    
    Args:
        descripcion_producto (str): Descripción del producto
        modelo (str): Modelo a usar ("gemini" o "llama")
        num_descripciones (int): Número de descripciones técnicas a generar
        
    Returns:
        dict: Resultado con la clasificación seleccionada automáticamente
    """
    
    print("🤖 CONSULTA Y SELECCIÓN AUTOMÁTICA")
    print("=" * 70)
    print(f"📦 Producto: {descripcion_producto}")
    print(f"🧠 Modelo: {modelo}")
    print("=" * 70)
    
    try:
        # PASO 1: Generar descripciones técnicas (sinónimos aduaneros)
        print("\n🔄 PASO 1: Generando descripciones técnicas...")
        descripciones_tecnicas = generar_descripciones_arancel(descripcion_producto, modelo, num_descripciones)
        
        # Combinar descripción original + técnicas
        todas_descripciones = [descripcion_producto] + descripciones_tecnicas
        
        print(f"✅ Generadas {len(todas_descripciones)} descripciones para consultar:")
        for i, desc in enumerate(todas_descripciones, 1):
            tipo = "Original" if i == 1 else f"Técnica {i-1}"
            print(f"   {i}. [{tipo}] {desc[:80]}...")
        
        # PASO 2: Ejecutar consultas RAG para cada descripción
        print(f"\n🔍 PASO 2: Ejecutando {len(todas_descripciones)} consultas RAG...")
        candidatos_respuestas = []
        
        for i, descripcion in enumerate(todas_descripciones):
            tipo = "Original" if i == 0 else f"Técnica {i}"
            print(f"   Consultando {i+1}/{len(todas_descripciones)}: {tipo}")
            
            try:
                resultado_rag = consultar_arancel_uruguay(descripcion)
                candidatos_respuestas.append({
                    "rank": i + 1,
                    "tipo": tipo,
                    "descripcion_usada": descripcion,
                    "respuesta_rag": resultado_rag.text,
                    "longitud": len(resultado_rag.text),
                })
            except Exception as e:
                print(f"      ❌ Error en consulta {tipo}: {e}")
                candidatos_respuestas.append({
                    "rank": i + 1,
                    "tipo": tipo,
                    "descripcion_usada": descripcion,
                    "respuesta_rag": f"Error: {e}",
                    "longitud": 0,
                })
        
        print(f"✅ Obtenidas {len(candidatos_respuestas)} respuestas candidatas")
        
        # PASO 2.5: Filtrar respuestas inválidas antes de enviar al LLM árbitro
        print(f"\n🔍 PASO 2.5: Filtrando respuestas inválidas...")
        candidatos_filtrados = filtrar_respuestas_invalidas(candidatos_respuestas)
        respuestas_eliminadas = len(candidatos_respuestas) - len(candidatos_filtrados)
        
        if respuestas_eliminadas > 0:
            print(f"❌ Eliminadas {respuestas_eliminadas} respuestas inválidas:")
            print("   - Respuestas que contienen 'No puedo proporcionar...'")
            print("   - Respuestas con errores técnicos")
        
        if len(candidatos_filtrados) == 0:
            print("⚠️ ¡No quedan respuestas válidas después del filtrado!")
            return {
                "producto_original": descripcion_producto,
                "error": "Todas las respuestas fueron filtradas como inválidas",
                "candidatos_originales": len(candidatos_respuestas),
                "candidatos_filtrados": 0,
                "timestamp": datetime.now().strftime("%Y-%m-%d %H:%M:%S") if 'datetime' in globals() else "N/A"
            }
        
        print(f"✅ {len(candidatos_filtrados)} respuestas válidas enviadas al árbitro LLM")
        
        # PASO 3: Usar LLM como árbitro para seleccionar la mejor respuesta
        print(f"\n🏛️ PASO 3: LLM como árbitro - seleccionando mejor respuesta...")
        seleccion_final = seleccionar_mejor_respuesta_rag(
            descripcion_producto, candidatos_filtrados, modelo
        )
        
        # PASO 4: Preparar resultado final
        resultado_final = {
            "producto_original": descripcion_producto,
            "modelo_usado": modelo,
            "descripciones_generadas": len(todas_descripciones),
            "candidatos_evaluados": len(candidatos_filtrados),
            "candidatos_originales": len(candidatos_respuestas),
            "respuestas_filtradas": len(candidatos_respuestas) - len(candidatos_filtrados),
            "seleccion_automatica": seleccion_final,
            "todas_las_respuestas": candidatos_respuestas,
            "respuestas_validas": candidatos_filtrados,
            "timestamp": datetime.now().strftime("%Y-%m-%d %H:%M:%S") if 'datetime' in globals() else "N/A"
        }
        
        # Mostrar resultado
        print(f"\n🎯 RESULTADO FINAL:")
        print("=" * 70)
        seleccion = seleccion_final
        print(f"🏆 Respuesta seleccionada: {seleccion.get('respuesta_elegida', 'N/A')}")
        print(f"📊 Confianza: {seleccion.get('confianza', 'N/A')}")
        print(f"💭 Justificación: {seleccion.get('justificacion', 'N/A')[:100]}...")
        
        return resultado_final
        
    except Exception as e:
        error_result = {
            "producto_original": descripcion_producto,
            "error": f"Error en proceso automático: {e}",
            "timestamp": datetime.now().strftime("%Y-%m-%d %H:%M:%S") if 'datetime' in globals() else "N/A"
        }
        print(f"❌ Error en consulta automática: {e}")
        return error_result


def seleccionar_mejor_respuesta_rag(descripcion_producto, candidatos_respuestas, modelo="gemini"):
    """
    Usa LLM como árbitro para seleccionar automáticamente la mejor respuesta RAG.
    Implementa la misma lógica que classify_with_llm() en llm_classifier.py
    
    Args:
        descripcion_producto (str): Descripción original del producto
        candidatos_respuestas (list): Lista de respuestas candidatas del RAG
        modelo (str): Modelo a usar como árbitro
        
    Returns:
        dict: Decisión del LLM árbitro
    """
    
    # Preparar prompt para el LLM árbitro
    prompt = f"""
Eres un experto en clasificación arancelaria de Uruguay. Tu tarea es evaluar múltiples respuestas del sistema RAG y seleccionar la MEJOR para clasificar este producto.

PRODUCTO A CLASIFICAR: "{descripcion_producto}"

RESPUESTAS CANDIDATAS del sistema RAG:
"""
    
    # Agregar cada candidato al prompt
    for candidato in candidatos_respuestas:
        prompt += f"""
{candidato['rank']}. RESPUESTA {candidato['tipo'].upper()}:
   - Descripción consultada: {candidato['descripcion_usada']}
   - Respuesta del RAG: {candidato['respuesta_rag'][:500]}...
   - Longitud: {candidato['longitud']} caracteres

"""
    
    prompt += f"""
CRITERIOS DE EVALUACIÓN:
1. **Precisión**: ¿La respuesta es específica y precisa para este producto?
2. **Código NCM**: ¿Proporciona códigos NCM válidos y apropiados?
3. **Relevancia**: ¿La descripción consultada era apropiada para el producto?

INSTRUCCIONES PARA EXTRACCIÓN DE NCM:
- Busca en la respuesta seleccionada patrones como "**Código NCM:** 1234.56.78.90" o "NCM: 12345678"
- Extrae el codigo numerico, puntos incluidos
- Si hay múltiples códigos NCM, selecciona el más específico (normalmente el primero)
- Si no encuentras código NCM claro, usa "N/A"

INSTRUCCIONES GENERALES:
- Analiza cada respuesta considerando los 3 criterios
- Selecciona la respuesta que MEJOR clasifique arancelariamente el producto
- Si varias son buenas, elige la más completa y específica
- Si todas tienen problemas, selecciona la menos problemática

Responde en formato JSON exacto:
{{
    "respuesta_elegida": "número del ranking de la respuesta seleccionada (1, 2, 3, etc.)",
    "codigo_ncm_principal": "código NCM principal extraído",
    "codigo_ncm_alternativo": "segundo código NCM si existe, o null",
    "confianza": "alta/media/baja",
    "justificacion": "explicación detallada de por qué elegiste esa respuesta en español",
    "problemas_detectados": "problemas que viste en las otras respuestas",
    "alternativa": "número de segunda mejor opción o null"
}}
"""
    
    try:
        # Enviar al LLM árbitro
        response = client.models.generate_content(
            model=MODEL_ID,
            contents=prompt
        )
        
        result_text = response.text.strip()
        print(f"📄 Respuesta del árbitro LLM:\n{result_text[:500]}...\n")
        
        # Parsear respuesta JSON
        try:
            # Buscar JSON en la respuesta
            import json
            import re
            
            json_match = re.search(r'\{.*\}', result_text, re.DOTALL)
            if json_match:
                decision = json.loads(json_match.group(0))
            else:
                raise ValueError("No JSON encontrado en respuesta")
                
            # Validar campos requeridos
            if "respuesta_elegida" not in decision:
                raise ValueError("Campo respuesta_elegida faltante")
                
        except (json.JSONDecodeError, ValueError) as e:
            print(f"⚠️ Error parseando decisión del LLM árbitro: {e}")
            print(f"📄 Respuesta completa: {result_text}")
            
            # Fallback: seleccionar primera respuesta válida
            decision = {
                "respuesta_elegida": "1",
                "codigo_ncm": None,  # No se pudo extraer código NCM
                "confianza": "baja",
                "justificacion": f"Error parseando decisión del LLM. Respuesta: {result_text[:200]}...",
                "problemas_detectados": "Error en parsing de respuesta del árbitro",
                "alternativa": None,
                "raw_response": result_text
            }
        
        # Agregar metadata
        decision.update({
            "modelo_arbitro": modelo,
            "candidatos_evaluados": len(candidatos_respuestas),
            "metodo": "llm_arbitro_automatico"
        })
        
        return decision
        
    except Exception as e:
        return {
            "error": f"Error en árbitro LLM: {e}",
            "respuesta_elegida": "1",  # Fallback a primera respuesta
            "confianza": "error",
            "justificacion": f"Error ejecutando árbitro: {e}",
            "problemas_detectados": "Error técnico en sistema árbitro",
            "alternativa": None
        }


def extraer_respuesta_seleccionada(resultado_automatico):
    """
    Extrae y retorna la respuesta RAG que fue seleccionada automáticamente.
    
    Args:
        resultado_automatico (dict): Resultado de consultar_y_seleccionar_automatico()
        
    Returns:
        dict: La respuesta específica que fue seleccionada
    """
    
    try:
        seleccion = resultado_automatico.get("seleccion_automatica", {})
        respuesta_elegida = seleccion.get("respuesta_elegida", "1")
        
        # Buscar primero en las respuestas válidas (filtradas)
        respuestas_validas = resultado_automatico.get("respuestas_validas", [])
        
        # Si hay respuestas válidas, buscar ahí primero
        if respuestas_validas:
            for respuesta in respuestas_validas:
                if str(respuesta.get("rank")) == str(respuesta_elegida):
                    print(respuesta)
                    return {
                        "respuesta_final": respuesta["respuesta_rag"],
                        "codigo_ncm_principal": seleccion.get("codigo_ncm_principal", "N/A"),
                        "codigo_ncm_alternativo": seleccion.get("codigo_ncm_alternativo"),
                        "descripcion_usada": respuesta["descripcion_usada"],
                        "tipo_consulta": respuesta["tipo"],
                        "confianza_arbitro": seleccion.get("confianza", "N/A"),
                        "justificacion_arbitro": seleccion.get("justificacion", "N/A"),
                        "ranking_original": respuesta["rank"],
                        "fue_filtrada": False
                    }
        
        # Si no encuentra en válidas, buscar en todas las respuestas
        todas_respuestas = resultado_automatico.get("todas_las_respuestas", [])
        
        for respuesta in todas_respuestas:
            if str(respuesta.get("rank")) == str(respuesta_elegida):
                return {
                    "respuesta_final": respuesta["respuesta_rag"],
                    "codigo_ncm_principal": seleccion.get("codigo_ncm_principal", "N/A"),
                    "codigo_ncm_alternativo": seleccion.get("codigo_ncm_alternativo"),
                    "descripcion_usada": respuesta["descripcion_usada"],
                    "tipo_consulta": respuesta["tipo"],
                    "confianza_arbitro": seleccion.get("confianza", "N/A"),
                    "justificacion_arbitro": seleccion.get("justificacion", "N/A"),
                    "ranking_original": respuesta["rank"],
                    "fue_filtrada": True
                }
        
        # Si no encuentra, devolver la primera respuesta válida
        if respuestas_validas:
            primera = respuestas_validas[0]
            return {
                "respuesta_final": primera["respuesta_rag"],
                "codigo_ncm_principal": seleccion.get("codigo_ncm_principal", "N/A"),
                "codigo_ncm_alternativo": seleccion.get("codigo_ncm_alternativo"),
                "descripcion_usada": primera["descripcion_usada"],
                "tipo_consulta": primera["tipo"],
                "confianza_arbitro": "baja",
                "justificacion_arbitro": "Respuesta por defecto - no se encontró la seleccionada",
                "ranking_original": primera["rank"],
                "fue_filtrada": False
            }
        
        # Si no hay respuestas válidas, usar todas las respuestas
        if todas_respuestas:
            primera = todas_respuestas[0]
            return {
                "respuesta_final": primera["respuesta_rag"],
                "codigo_ncm_principal": seleccion.get("codigo_ncm_principal", "N/A"),
                "codigo_ncm_alternativo": seleccion.get("codigo_ncm_alternativo"),
                "descripcion_usada": primera["descripcion_usada"],
                "tipo_consulta": primera["tipo"],
                "confianza_arbitro": "baja",
                "justificacion_arbitro": "Respuesta por defecto - no había respuestas válidas",
                "ranking_original": primera["rank"],
                "fue_filtrada": True
            }
        
        return {"error": "No hay respuestas disponibles"}
        
    except Exception as e:
        return {"error": f"Error extrayendo respuesta: {e}"}

In [75]:
# Importar datetime para timestamps
from datetime import datetime

# Ejemplo 1: Consulta automática con selección por LLM árbitro
producto_automatico = "auriculares inalámbricos con cancelación de ruido"

print("🚀 DEMOSTRACIÓN DE CONSULTA AUTOMÁTICA")
print("=" * 80)
print("Este ejemplo implementa el flujo completo automatizado:")
print("1️⃣ Generar descripciones técnicas")
print("2️⃣ Consultar RAG con múltiples descripciones") 
print("3️⃣ LLM árbitro selecciona automáticamente la mejor respuesta")
print("=" * 80)

resultado_completo = consultar_y_seleccionar_automatico(
    producto_automatico, 
    modelo="gemini", 
    num_descripciones=3
)

print("\n📋 ANÁLISIS DEL RESULTADO:")
print("=" * 50)
respuesta_final = extraer_respuesta_seleccionada(resultado_completo)

if "error" not in respuesta_final:
    print(f"✅ Respuesta seleccionada automáticamente:")
    print(f"   🎯 Tipo de consulta: {respuesta_final['tipo_consulta']}")
    print(f"   📦 NCM: {respuesta_final['codigo_ncm_principal']}")
    print(f"   📝 Descripción usada: {respuesta_final['descripcion_usada'][:60]}...")
    print(f"   📊 Confianza del árbitro: {respuesta_final['confianza_arbitro']}")
    print(f"   💭 Justificación: {respuesta_final['justificacion_arbitro'][:80]}...")
    print(f"\n📄 RESPUESTA FINAL:")
    print(f"   {respuesta_final['respuesta_final'][:300]}...")
else:
    print(f"❌ Error: {respuesta_final['error']}")

print("\n" + "="*80)

🚀 DEMOSTRACIÓN DE CONSULTA AUTOMÁTICA
Este ejemplo implementa el flujo completo automatizado:
1️⃣ Generar descripciones técnicas
2️⃣ Consultar RAG con múltiples descripciones
3️⃣ LLM árbitro selecciona automáticamente la mejor respuesta
🤖 CONSULTA Y SELECCIÓN AUTOMÁTICA
📦 Producto: auriculares inalámbricos con cancelación de ruido
🧠 Modelo: gemini

🔄 PASO 1: Generando descripciones técnicas...
✅ Generadas 4 descripciones para consultar:
   1. [Original] auriculares inalámbricos con cancelación de ruido...
   2. [Técnica 1] Aparatos de audición, inalámbricos, constituidos por transductores electroacústi...
   3. [Técnica 2] Receptores de radiodifusión, del tipo utilizados con auriculares, de tecnología ...
   4. [Técnica 3] Auriculares, inalámbricos, para la reproducción de audio, que comprenden cápsula...

🔍 PASO 2: Ejecutando 4 consultas RAG...
   Consultando 1/4: Original
✅ Generadas 4 descripciones para consultar:
   1. [Original] auriculares inalámbricos con cancelación de ruido...

In [67]:
# Función de uso simple para clasificación automática
def clasificar_automatico(descripcion_producto):
    """
    Función de uso simple que implementa todo el flujo automatizado.
    Similar a classify_single_product() en llm_classifier.py
    
    Args:
        descripcion_producto (str): Descripción del producto a clasificar
        
    Returns:
        str: Respuesta de clasificación arancelaria seleccionada automáticamente
    """
    
    resultado = consultar_y_seleccionar_automatico(descripcion_producto)
    respuesta_seleccionada = extraer_respuesta_seleccionada(resultado)
    
    if "error" not in respuesta_seleccionada:
        return respuesta_seleccionada["respuesta_final"]
    else:
        return f"Error en clasificación automática: {respuesta_seleccionada['error']}"


# Ejemplo 2: Comparación método manual vs automático
producto_comparacion = "auriculares inalámbricos con cancelación de ruido"

print("🆚 COMPARACIÓN: MÉTODO MANUAL vs AUTOMÁTICO")
print("=" * 80)

# Método tradicional (manual)
print("1️⃣ MÉTODO TRADICIONAL (selección manual):")
print("-" * 50)
try:
    resultado_manual = consultar_arancel_uruguay(producto_comparacion)
    print(f"📱 Respuesta manual: {resultado_manual.text[:200]}...")
except Exception as e:
    print(f"❌ Error en método manual: {e}")

print("\n" + "="*80)

# Método automático (LLM árbitro)
print("2️⃣ MÉTODO AUTOMÁTICO (LLM árbitro):")
print("-" * 50)
try:
    respuesta_automatica = clasificar_automatico(producto_comparacion)
    print(f"🤖 Respuesta automática: {respuesta_automatica[:200]}...")
except Exception as e:
    print(f"❌ Error en método automático: {e}")

print("\n" + "="*80)
print("🎯 VENTAJAS DEL MÉTODO AUTOMÁTICO:")
print("✅ Usa múltiples descripciones técnicas")
print("✅ Evaluación objetiva por LLM árbitro") 
print("✅ Mayor cobertura y precisión")
print("✅ Selección basada en criterios específicos")
print("✅ Proceso completamente automatizado")
print("="*80)

🆚 COMPARACIÓN: MÉTODO MANUAL vs AUTOMÁTICO
1️⃣ MÉTODO TRADICIONAL (selección manual):
--------------------------------------------------
📱 Respuesta manual: No puedo proporcionar la clasificación arancelaria para auriculares inalámbricos con cancelación de ruido. Los resultados de búsqueda proporcionados no contienen información sobre auriculares inalámbr...

2️⃣ MÉTODO AUTOMÁTICO (LLM árbitro):
--------------------------------------------------
🤖 CONSULTA Y SELECCIÓN AUTOMÁTICA
📦 Producto: auriculares inalámbricos con cancelación de ruido
🧠 Modelo: gemini

🔄 PASO 1: Generando descripciones técnicas...
📱 Respuesta manual: No puedo proporcionar la clasificación arancelaria para auriculares inalámbricos con cancelación de ruido. Los resultados de búsqueda proporcionados no contienen información sobre auriculares inalámbr...

2️⃣ MÉTODO AUTOMÁTICO (LLM árbitro):
--------------------------------------------------
🤖 CONSULTA Y SELECCIÓN AUTOMÁTICA
📦 Producto: auriculares inalámbricos con ca

In [None]:
# Ejemplo de demostración del filtrado de respuestas inválidas
print("\n🔍 DEMOSTRACIÓN DEL FILTRADO DE RESPUESTAS INVÁLIDAS")
print("=" * 80)

# Simulamos candidatos con respuestas válidas e inválidas
candidatos_ejemplo = [
    {
        "rank": 1,
        "tipo": "Original",
        "descripcion_usada": "producto ejemplo",
        "respuesta_rag": "**Código NCM:** 84713000 **Descripción:** Máquinas automáticas para tratamiento de datos **TEA (%):** 0",
        "longitud": 100
    },
    {
        "rank": 2,
        "tipo": "Técnica 1",
        "descripcion_usada": "aparatos de procesamiento de datos",
        "respuesta_rag": "No puedo proporcionar la clasificación arancelaria específica para este producto sin más información.",
        "longitud": 90
    },
    {
        "rank": 3,
        "tipo": "Técnica 2",
        "descripcion_usada": "equipos electrónicos de cómputo",
        "respuesta_rag": "**Código NCM:** 84714100 **Descripción:** Unidades de proceso digital **TEA (%):** 0 **Régimen:** Exento",
        "longitud": 95
    },
    {
        "rank": 4,
        "tipo": "Técnica 3",
        "descripcion_usada": "máquinas de calcular electrónicas",
        "respuesta_rag": "Error: No se pudo acceder al arancel",
        "longitud": 35
    }
]

print("📋 CANDIDATOS ORIGINALES:")
for candidato in candidatos_ejemplo:
    print(f"   {candidato['rank']}. [{candidato['tipo']}] {candidato['respuesta_rag'][:60]}...")

# Aplicar filtro
candidatos_filtrados = filtrar_respuestas_invalidas(candidatos_ejemplo)

print(f"\n✅ CANDIDATOS DESPUÉS DEL FILTRADO:")
print(f"   Original: {len(candidatos_ejemplo)} → Filtrado: {len(candidatos_filtrados)}")
print(f"   Eliminados: {len(candidatos_ejemplo) - len(candidatos_filtrados)}")

for candidato in candidatos_filtrados:
    print(f"   {candidato['rank']}. ✅ [{candidato['tipo']}] {candidato['respuesta_rag'][:60]}...")

print(f"\n📊 PATRONES DETECTADOS Y ELIMINADOS:")
print("   ❌ 'No puedo proporcionar la clasificación arancelaria...'")
print("   ❌ 'Error: No se pudo acceder...'")
print("   ❌ Respuestas muy cortas (< 50 caracteres)")

print("\n" + "="*80)

### 🛡️ Filtrado Inteligente de Respuestas

El sistema ahora incluye **filtrado automático** de respuestas inválidas antes de enviarlas al LLM árbitro:

#### 🚫 **Respuestas Eliminadas Automáticamente:**
- ❌ "No puedo proporcionar la clasificación arancelaria..."
- ❌ "No tengo acceso a la información específica..."
- ❌ "Lo siento, no puedo..."
- ❌ Respuestas con errores técnicos
- ❌ Respuestas muy cortas (< 50 caracteres)

#### 🎯 **Beneficios del Filtrado:**
- **Mayor Calidad**: Solo se evalúan respuestas útiles
- **Mejor Selección**: El LLM árbitro se enfoca en opciones válidas
- **Menos Ruido**: Eliminación automática de respuestas problemáticas
- **Eficiencia**: Reduce el tiempo de procesamiento del árbitro

#### 📊 **Estadísticas de Filtrado:**
El sistema reporta automáticamente:
- Número de respuestas originales
- Número de respuestas filtradas
- Número de respuestas eliminadas
- Razones de eliminación

¡El sistema de selección automática ahora es más robusto y preciso! 🚀

In [None]:
# Función para procesar múltiples productos automáticamente
def clasificar_lote_automatico(lista_productos, mostrar_detalles=False):
    """
    Procesa múltiples productos usando el sistema de selección automática.
    Equivalente a procesar múltiples productos con classify_single_product()
    
    Args:
        lista_productos (list): Lista de descripciones de productos
        mostrar_detalles (bool): Si mostrar detalles de cada clasificación
        
    Returns:
        list: Lista de resultados de clasificación
    """
    
    print(f"📦 PROCESAMIENTO EN LOTE - {len(lista_productos)} PRODUCTOS")
    print("=" * 80)
    
    resultados = []
    
    for i, producto in enumerate(lista_productos, 1):
        print(f"\n🔄 Procesando {i}/{len(lista_productos)}: {producto}")
        print("-" * 60)
        
        try:
            if mostrar_detalles:
                # Proceso completo con detalles
                resultado = consultar_y_seleccionar_automatico(producto)
                respuesta = extraer_respuesta_seleccionada(resultado)
            else:
                # Solo resultado final
                respuesta_texto = clasificar_automatico(producto)
                resultado = {
                    "producto": producto,
                    "respuesta_final": respuesta_texto,
                    "metodo": "automatico_simple"
                }
                respuesta = {"respuesta_final": respuesta_texto}
            
            resultados.append({
                "producto": producto,
                "resultado": resultado,
                "respuesta_seleccionada": respuesta,
                "status": "exitoso"
            })
            
            if not mostrar_detalles:
                print(f"✅ Clasificado: {respuesta.get('respuesta_final', 'N/A')[:80]}...")
            
        except Exception as e:
            print(f"❌ Error procesando '{producto}': {e}")
            resultados.append({
                "producto": producto,
                "resultado": {"error": str(e)},
                "respuesta_seleccionada": {"error": str(e)},
                "status": "error"
            })
    
    # Resumen final
    exitosos = sum(1 for r in resultados if r["status"] == "exitoso")
    errores = len(resultados) - exitosos
    
    print(f"\n📊 RESUMEN DEL LOTE:")
    print(f"   ✅ Exitosos: {exitosos}/{len(lista_productos)}")
    print(f"   ❌ Errores: {errores}/{len(lista_productos)}")
    print(f"   📈 Tasa de éxito: {(exitosos/len(lista_productos)*100):.1f}%")
    
    return resultados


# Ejemplo 3: Procesamiento en lote
productos_lote = [
    "reloj inteligente con GPS",
    "cafetera eléctrica automática",
    "bicicleta eléctrica plegable"
]

print("\n🎯 DEMOSTRACIÓN DE PROCESAMIENTO EN LOTE")
print("=" * 80)

resultados_lote = clasificar_lote_automatico(productos_lote, mostrar_detalles=False)

print("\n📋 RESULTADOS DETALLADOS:")
for i, resultado in enumerate(resultados_lote, 1):
    producto = resultado["producto"]
    respuesta = resultado["respuesta_seleccionada"]
    status = resultado["status"]
    
    print(f"\n{i}. {producto}")
    if status == "exitoso":
        print(f"   ✅ {respuesta.get('respuesta_final', 'N/A')[:100]}...")
    else:
        print(f"   ❌ Error: {respuesta.get('error', 'N/A')}")

print("\n" + "="*80)
print("🎉 SISTEMA DE SELECCIÓN AUTOMÁTICA COMPLETADO")
print("🤖 Flujo implementado: Descripción → Sinónimos → RAG → LLM Árbitro")
print("✅ Compatible con el patrón de llm_classifier.py")
print("="*80)

In [32]:
from vertexai import generative_models

# Load tool into Llama model
rag_retrieval_tool = generative_models.Tool.from_retrieval(
    retrieval=rag.Retrieval(
        source=rag.VertexRagStore(
            rag_resources=[rag.RagResource(rag_corpus=rag_corpus.name)],
            rag_retrieval_config=rag.RagRetrievalConfig(
                top_k=10,  # Optional
                filter=rag.Filter(
                    vector_distance_threshold=0.5,  # Optional
                ),
            ),
        ),
    )
)

llama_model = generative_models.GenerativeModel(
    # your self-deployed endpoint for Llama3
    "projects/{project}/locations/{location}/endpoints/{endpoint_resource_id}",
    tools=[rag_retrieval_tool],
)

In [33]:
response = llama_model.generate_content("What is RAG?")

display(Markdown(response.text))

ValueError: Unsupported region for Vertex AI, select from frozenset({'europe-central2', 'us-central1', 'us-east1', 'southamerica-west1', 'us-south1', 'europe-west2', 'europe-west8', 'africa-south1', 'southamerica-east1', 'us-east7', 'us-east5', 'asia-south1', 'asia-south2', 'europe-west12', 'australia-southeast2', 'us-west3', 'me-central2', 'australia-southeast1', 'asia-northeast1', 'us-west4', 'northamerica-northeast2', 'asia-east1', 'me-west1', 'europe-north1', 'asia-east2', 'asia-northeast3', 'northamerica-northeast1', 'asia-southeast2', 'me-central1', 'us-west2', 'europe-west4', 'europe-west1', 'us-west1', 'asia-northeast2', 'asia-southeast1', 'europe-west6', 'europe-west9', 'europe-southwest1', 'us-east4', 'europe-west3', 'global'})