<a href="https://colab.research.google.com/github/mateoCosta1/notepad_for_RAG/blob/main/gemini/rag-engine/intro_rag_engine.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# Copyright 2024 Google LLC
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# Intro to Building a Scalable and Modular RAG System with RAG Engine in Vertex AI

<table align="left">
  <td style="text-align: center">
    <a href="https://colab.research.google.com/github/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb">
      <img width="32px" src="https://www.gstatic.com/pantheon/images/bigquery/welcome_page/colab-logo.svg" alt="Google Colaboratory logo"><br> Open in Colab
    </a>
  </td>
  <td style="text-align: center">
    <a href="https://console.cloud.google.com/vertex-ai/colab/import/https:%2F%2Fraw.githubusercontent.com%2FGoogleCloudPlatform%2Fgenerative-ai%2Fmain%2Fgemini%2Frag-engine%2Fintro_rag_engine.ipynb">
      <img width="32px" src="https://lh3.googleusercontent.com/JmcxdQi-qOpctIvWKgPtrzZdJJK-J3sWE1RsfjZNwshCFgE_9fULcNpuXYTilIR2hjwN" alt="Google Cloud Colab Enterprise logo"><br> Open in Colab Enterprise
    </a>
  </td>
  <td style="text-align: center">
    <a href="https://console.cloud.google.com/vertex-ai/workbench/deploy-notebook?download_url=https://raw.githubusercontent.com/GoogleCloudPlatform/generative-ai/main/gemini/rag-engine/intro_rag_engine.ipynb">
      <img src="https://www.gstatic.com/images/branding/gcpiconscolors/vertexai/v1/32px.svg" alt="Vertex AI logo"><br> Open in Vertex AI Workbench
    </a>
  </td>
  <td style="text-align: center">
    <a href="https://github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb">
      <img width="32px" src="https://www.svgrepo.com/download/217753/github.svg" alt="GitHub logo"><br> View on GitHub
    </a>
  </td>
</table>

<div style="clear: both;"></div>

<b>Share to:</b>

<a href="https://www.linkedin.com/sharing/share-offsite/?url=https%3A//github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb" target="_blank">
  <img width="20px" src="https://upload.wikimedia.org/wikipedia/commons/8/81/LinkedIn_icon.svg" alt="LinkedIn logo">
</a>

<a href="https://bsky.app/intent/compose?text=https%3A//github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb" target="_blank">
  <img width="20px" src="https://upload.wikimedia.org/wikipedia/commons/7/7a/Bluesky_Logo.svg" alt="Bluesky logo">
</a>

<a href="https://twitter.com/intent/tweet?url=https%3A//github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb" target="_blank">
  <img width="20px" src="https://upload.wikimedia.org/wikipedia/commons/5/5a/X_icon_2.svg" alt="X logo">
</a>

<a href="https://reddit.com/submit?url=https%3A//github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb" target="_blank">
  <img width="20px" src="https://redditinc.com/hubfs/Reddit%20Inc/Brand/Reddit_Logo.png" alt="Reddit logo">
</a>

<a href="https://www.facebook.com/sharer/sharer.php?u=https%3A//github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb" target="_blank">
  <img width="20px" src="https://upload.wikimedia.org/wikipedia/commons/5/51/Facebook_f_logo_%282019%29.svg" alt="Facebook logo">
</a>            

| | |
|-|-|
| Author(s) | [Holt Skinner](https://github.com/holtskinner) |

## Overview

Retrieval Augmented Generation (RAG) improves Large Language Models (LLMs) by allowing them to access and process external information sources during generation. This ensures the model's responses are grounded in factual data and avoids hallucinations.

A common problem with LLMs is that they don't understand private knowledge, that
is, your organization's data. With RAG Engine, you can enrich the
LLM context with additional private information, because the model can reduce
hallucinations and answer questions more accurately.

By combining additional knowledge sources with the existing knowledge that LLMs
have, a better context is provided. The improved context along with the query
enhances the quality of the LLM's response.

The following concepts are key to understanding Vertex AI RAG Engine. These concepts are listed in the order of the
retrieval-augmented generation (RAG) process.

1. **Data ingestion**: Intake data from different data sources. For example,
  local files, Google Cloud Storage, and Google Drive.

1. **Data transformation**: Conversion of the data in preparation for indexing. For example, data is split into chunks.

1. **Embedding**: Numerical representations of words or pieces of text. These numbers capture the
   semantic meaning and context of the text. Similar or related words or text
   tend to have similar embeddings, which means they are closer together in the
   high-dimensional vector space.

1. **Data indexing**: RAG Engine creates an index called a corpus.
   The index structures the knowledge base so it's optimized for searching. For
   example, the index is like a detailed table of contents for a massive
   reference book.

1. **Retrieval**: When a user asks a question or provides a prompt, the retrieval
  component in RAG Engine searches through its knowledge
  base to find information that is relevant to the query.

1. **Generation**: The retrieved information becomes the context added to the
  original user query as a guide for the generative AI model to generate
  factually grounded and relevant responses.

For more information, refer to the public documentation for [Vertex AI RAG Engine](https://cloud.google.com/vertex-ai/generative-ai/docs/rag-overview).

## Get started

### Install Vertex AI SDK and Google Gen AI SDK


In [2]:
%pip install --upgrade --quiet google-cloud-aiplatform google-genai

Note: you may need to restart the kernel to use updated packages.


### Restart runtime

To use the newly installed packages in this Jupyter runtime, you must restart the runtime. You can do this by running the cell below, which restarts the current kernel.

The restart might take a minute or longer. After it's restarted, continue to the next step.

In [None]:
import IPython

app = IPython.Application.instance()
app.kernel.do_shutdown(True)

{'status': 'ok', 'restart': True}

: 

<div class="alert alert-block alert-warning">
<b>‚ö†Ô∏è The kernel is going to restart. Wait until it's finished before continuing to the next step. ‚ö†Ô∏è</b>
</div>


### Authenticate your notebook environment (Colab only)

If you're running this notebook on Google Colab, run the cell below to authenticate your environment.

In [3]:
import sys

if "google.colab" in sys.modules:
    from google.colab import auth

    auth.authenticate_user()

### Set Google Cloud project information and initialize Vertex AI SDK

To get started using Vertex AI, you must have an existing Google Cloud project and [enable the Vertex AI API](https://console.cloud.google.com/flows/enableapi?apiid=aiplatform.googleapis.com).

Learn more about [setting up a project and a development environment](https://cloud.google.com/vertex-ai/docs/start/cloud-environment).

In [4]:
# Use the environment variable if the user doesn't provide Project ID.
import os

from google import genai
import vertexai

PROJECT_ID = "first-presence-453619-j6"  # @param {type: "string", placeholder: "[your-project-id]", isTemplate: true}
if not PROJECT_ID or PROJECT_ID == "[your-project-id]":
    PROJECT_ID = str(os.environ.get("GOOGLE_CLOUD_PROJECT"))

LOCATION = os.environ.get("GOOGLE_CLOUD_REGION", "us-central1")

vertexai.init(project=PROJECT_ID, location=LOCATION)
client = genai.Client(vertexai=True, project=PROJECT_ID, location=LOCATION)

### Import libraries

In [5]:
from IPython.display import Markdown, display
from google.genai.types import GenerateContentConfig, Retrieval, Tool, VertexRagStore
from vertexai import rag

### Create a RAG Corpus

In [9]:
# Currently supports Google first-party embedding models
EMBEDDING_MODEL = "publishers/google/models/text-embedding-005"  # @param {type:"string", isTemplate: true}

rag_corpus = rag.create_corpus(
    display_name="my-rag-corpus",
    backend_config=rag.RagVectorDbConfig(
        rag_embedding_model_config=rag.RagEmbeddingModelConfig(
            vertex_prediction_endpoint=rag.VertexPredictionEndpoint(
                publisher_model=EMBEDDING_MODEL
            )
        )
    ),
)

### Check the corpus just created

In [10]:
rag.list_corpora()

ListRagCorporaPager<rag_corpora {
  name: "projects/first-presence-453619-j6/locations/us-central1/ragCorpora/4611686018427387904"
  display_name: "my-rag-corpus"
  create_time {
    seconds: 1754526577
    nanos: 939614000
  }
  update_time {
    seconds: 1754526577
    nanos: 939614000
  }
  corpus_status {
    state: ACTIVE
  }
  vector_db_config {
    rag_managed_db {
      knn {
      }
    }
    rag_embedding_model_config {
      vertex_prediction_endpoint {
        endpoint: "projects/first-presence-453619-j6/locations/us-central1/publishers/google/models/text-embedding-005"
      }
    }
  }
}
rag_corpora {
  name: "projects/first-presence-453619-j6/locations/us-central1/ragCorpora/2305843009213693952"
  display_name: "my-rag-corpus"
  create_time {
    seconds: 1754545106
    nanos: 637583000
  }
  update_time {
    seconds: 1754545106
    nanos: 637583000
  }
  corpus_status {
    state: ACTIVE
  }
  vector_db_config {
    rag_managed_db {
      knn {
      }
    }
    rag_em

### Upload a local file to the corpus

In [8]:
%%writefile test.md

Retrieval-Augmented Generation (RAG) is a technique that enhances the capabilities of large language models (LLMs) by allowing them to access and incorporate external data sources when generating responses. Here's a breakdown:

**What it is:**

* **Combining Retrieval and Generation:**
    * RAG combines the strengths of information retrieval systems (like search engines) with the generative power of LLMs.
    * It enables LLMs to go beyond their pre-trained data and access up-to-date and specific information.
* **How it works:**
    * When a user asks a question, the RAG system first retrieves relevant information from external data sources (e.g., databases, documents, web pages).
    * This retrieved information is then provided to the LLM as additional context.
    * The LLM uses this augmented context to generate a more accurate and informative response.

**Why it's helpful:**

* **Access to Up-to-Date Information:**
    * LLMs are trained on static datasets, so their knowledge can become outdated. RAG allows them to access real-time or frequently updated information.
* **Improved Accuracy and Factual Grounding:**
    * RAG reduces the risk of LLM "hallucinations" (generating false or misleading information) by grounding responses in verified external data.
* **Enhanced Contextual Relevance:**
    * By providing relevant context, RAG enables LLMs to generate more precise and tailored responses to specific queries.
* **Increased Trust and Transparency:**
    * RAG can provide source citations, allowing users to verify the information and increasing trust in the LLM's responses.
* **Cost Efficiency:**
    * Rather than constantly retraining large language models, RAG allows for the introduction of new data in a more cost effective way.

In essence, RAG bridges the gap between the vast knowledge of LLMs and the need for accurate, current, and contextually relevant information.


Writing test.md


### Subir Arancel Nacional de Uruguay

Ahora vamos a subir el arancel nacional de Uruguay para hacer consultas de clasificaci√≥n arancelaria.

In [16]:
rag_file = rag.upload_file(
    corpus_name=rag_corpus.name,
    path="../../Arancel Nacional_Abril 2024.pdf",  # Usar el archivo PDF directamente
    display_name="Arancel Nacional Uruguay Abril 2024",
    description="Arancel Nacional de Uruguay con c√≥digos NCM, descripciones y tarifas actualizadas a Abril 2024 (formato PDF)",
)

### Import files from Google Cloud Storage

Remember to grant "Viewer" access to the "Vertex RAG Data Service Agent" (with the format of `service-{project_number}@gcp-sa-vertex-rag.iam.gserviceaccount.com`) for your Google Cloud Storage bucket.

For this example, we'll use a public GCS bucket containing earning reports from Alphabet.

In [None]:
# Configuraci√≥n optimizada para el arancel uruguayo en formato PDF
# INPUT_GCS_BUCKET = (
#     "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/"
# )

# Para el arancel uruguayo en PDF, usamos configuraci√≥n espec√≠fica para documentos estructurados
response = rag.import_files(
    corpus_name=rag_corpus.name,
    paths=["../../Arancel Nacional_Abril 2024.pdf"],  # Usar el archivo PDF
    # Configuraci√≥n optimizada para documentos PDF con tablas arancelarias
    transformation_config=rag.TransformationConfig(
        chunking_config=rag.ChunkingConfig(
            chunk_size=1000,  # Tama√±o apropiado para entradas del arancel en PDF
            chunk_overlap=150  # Overlap mayor para mantener contexto entre c√≥digos relacionados
        )
    ),
    max_embedding_requests_per_min=900,  # Optional
)

### Import files from Google Drive

Eligible paths can be formatted as:

- `https://drive.google.com/drive/folders/{folder_id}`
- `https://drive.google.com/file/d/{file_id}`.

Remember to grant "Viewer" access to the "Vertex RAG Data Service Agent" (with the format of `service-{project_number}@gcp-sa-vertex-rag.iam.gserviceaccount.com`) for your Drive folder/files.


In [19]:
response = rag.import_files(
    corpus_name=rag_corpus.name,
    paths=["https://drive.google.com/file/d/1sLFbb_ncJ5yYvBYocU7kDxZAF1X3zG8H"],
    # Optional
    transformation_config=rag.TransformationConfig(
        chunking_config=rag.ChunkingConfig(chunk_size=512, chunk_overlap=50)
    ),
)

### Optional: Perform direct context retrieval

In [15]:
# Direct context retrieval
response = rag.retrieval_query(
    rag_resources=[
        rag.RagResource(
            rag_corpus=rag_corpus.name,
            # Optional: supply IDs from `rag.list_files()`.
            # rag_file_ids=["rag-file-1", "rag-file-2", ...],
        )
    ],
    rag_retrieval_config=rag.RagRetrievalConfig(
        top_k=10,  # Optional
        filter=rag.Filter(
            vector_distance_threshold=0.5,  # Optional
        ),
    ),
    text="What is RAG and why it is helpful?",
)
print(response)

# Optional: The retrieved context can be passed to any SDK or model generation API to generate final results.
# context = " ".join([context.text for context in response.contexts.contexts]).replace("\n", "")

contexts {
  contexts {
    source_uri: "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2021_alphabet_annual_report.pdf"
    text: "Information\r\n1WTYGDUKVGKUNQECVGFCVYYY CDE Z[\\ CPFQWTKPXGUVQTTGNCVKQPUYGDUKVGKUNQECVGFCVYYY CDE Z[\\ KPXGUVQT 1WT#PPWCN4GRQTVU\r\nQP(QTO   - 3WCTVGTN[4GRQTVUQP(QTO   3 %WTTGPV4GRQTVUQP(QTO  - CPFQWT2TQZ[5VCVGOGPVU CPFCP[COGPFOGPVUVQ\r\nVJGUGTGRQTVU CTGCXCKNCDNGVJTQWIJQWTKPXGUVQTTGNCVKQPUYGDUKVG HTGGQHEJCTIG CHVGTYG∆íNGVJGOYKVJVJG5\'% 9GCNUQRTQXKFGC\r\nNKPMVQVJGUGEVKQPQHVJG5\'%≈¶UYGDUKVGCVYYY UGE IQXVJCVJCUCNNQHVJGTGRQTVUVJCVYG∆íNGQTHWTPKUJYKVJVJG5\'%   J G K T E Q O R N K C P E G Y K V J ) Q Q I N G ≈¶ U 5 W R R N K G T % Q F G Q H % Q P F W E V   9 G E Q P V K P W C N N [ O C M G K O R T Q X G O G P V U V Q R T Q O Q V G C \r \n T G U R G E V H W N C P F R Q U K V K X G Y Q T M K P I G P X K T Q P O G P V H Q T G X G T [ Q P G ≈£ G O R N Q [ G G U   X G P F Q T U   C P F V G O R Q T C T [ U V C H H C N K M G   \r \n G o v e r n m 

### Create RAG Retrieval Tool

In [19]:
# Create a tool for the RAG Corpus
rag_retrieval_tool = Tool(
    retrieval=Retrieval(
        vertex_rag_store=VertexRagStore(
            rag_corpora=[rag_corpus.name],
            similarity_top_k=10,
            vector_distance_threshold=0.5,
        )
    )
)

### Generate Content with Gemini using RAG Retrieval Tool

In [20]:
MODEL_ID = "gemini-2.0-flash-001"

In [21]:
response = client.models.generate_content(
    model=MODEL_ID,
    contents="List me your provided documents",
    config=GenerateContentConfig(tools=[rag_retrieval_tool]),
)

display(Markdown(response.text))

The documents provided are:

*   Arancel Nacional Uruguay Abril 2024: 4 0 10
*   Arancel Nacional Uruguay Abril 2024: 22.00.10
*   Arancel Nacional Uruguay Abril 2024: 22.00.10 Crudos
*   Arancel Nacional Uruguay Abril 2024: 59.90.00
*   Arancel Nacional Uruguay Abril 2024: 10.80 10.8 0 10
*   Arancel Nacional Uruguay Abril 2024: 29.90.10
*   Arancel Nacional Uruguay Abril 2024: 1209.10.00.00
*   Arancel Nacional Uruguay Abril 2024: 80 10.8 0 10
*   Arancel Nacional Uruguay Abril 2024: 21.00.00
*   Arancel Nacional Uruguay Abril 2024


### Funciones para Consultar el Arancel Uruguayo

Ahora crearemos funciones espec√≠ficas para consultar c√≥digos arancelarios y tarifas del arancel nacional de Uruguay.

In [22]:
# Funci√≥n especializada para consultar el arancel uruguayo
def consultar_arancel_uruguay(descripcion_producto):
    response = client.models.generate_content(
        model=MODEL_ID,
        contents=f"""
        Bas√°ndote en el Arancel Nacional de Uruguay (Abril 2024), encuentra la clasificaci√≥n arancelaria para:
        
        PRODUCTO: {descripcion_producto}
        
        Proporciona la informaci√≥n en este formato exacto:
        
        **C√≥digo NCM:** [c√≥digo de 8 d√≠gitos]
        **Descripci√≥n:** [descripci√≥n oficial del arancel]
        **TEA (%):** [Tarifa Externa de Arancel]
        **R√©gimen:** [informaci√≥n sobre r√©gimen especial si aplica]
        **Observaciones:** [notas adicionales si las hay]
        
        Si hay m√∫ltiples c√≥digos posibles, lista los 2 m√°s apropiados.
        """,
        config=GenerateContentConfig(tools=[rag_retrieval_tool]),
    )
    return response

In [60]:
# Casos de prueba espec√≠ficos para el mercado uruguayo
productos_test = [
    "Caf√© verde en grano sin tostar",
    "Smartphone con pantalla t√°ctil",
    "Carne bovina congelada",
    "Vino tinto en botellas de vidrio",
    "Computadora port√°til",
    "Medicamentos para diabetes",
    "Aceite de girasol refinado",
    "Neum√°ticos para autom√≥vil",
    "Queso tipo mozzarella",
    "Arroz blanco pulido"
]

print("=== CONSULTAS AL ARANCEL NACIONAL URUGUAY ===\n")

for i, producto in enumerate(productos_test[:3], 1):  # Probamos solo los primeros 3
    print(f"{i}. PRODUCTO: {producto}")
    resultado = consultar_arancel_uruguay(producto)
    display(Markdown(resultado.text))
    print("\n" + "="*70 + "\n")

=== CONSULTAS AL ARANCEL NACIONAL URUGUAY ===

1. PRODUCTO: Caf√© verde en grano sin tostar


No puedo proporcionar la clasificaci√≥n arancelaria para "Caf√© verde en grano sin tostar" porque no hay informaci√≥n sobre caf√© en los resultados de b√∫squeda proporcionados.




2. PRODUCTO: Smartphone con pantalla t√°ctil


No puedo proporcionar la clasificaci√≥n arancelaria para un smartphone con pantalla t√°ctil, ya que no hay informaci√≥n sobre ese producto en los resultados de b√∫squeda proporcionados.




3. PRODUCTO: Carne bovina congelada


**C√≥digo NCM:** 0202.10.00.00
**Descripci√≥n:** En canales o medias canales
**TEA (%):** 9
**R√©gimen:** Ninguno especificado
**Observaciones:** N/A

**C√≥digo NCM:** 0202.20
**Descripci√≥n:** Los dem√°s cortes (trozos) sin deshuesar
**TEA (%):** 9
**R√©gimen:** Ninguno especificado
**Observaciones:** N/A






### Generate Content with Llama3 using RAG Retrieval Tool

## üîÑ Generaci√≥n de Descripciones T√©cnicas del Arancel

Esta funci√≥n toma una descripci√≥n de producto en lenguaje coloquial y genera m√∫ltiples descripciones alternativas usando el lenguaje formal y t√©cnico caracter√≠stico del arancel uruguayo. Esto mejora significativamente la precisi√≥n del RAG al crear un "puente" entre el lenguaje cotidiano y la terminolog√≠a arancelaria oficial.

In [38]:
def generar_descripciones_arancel(descripcion_producto, modelo="gemini", num_alternativas=5):
    """
    Genera descripciones alternativas de un producto usando el lenguaje t√©cnico 
    y formal caracter√≠stico del arancel uruguayo para mejorar la precisi√≥n del RAG.
    
    Args:
        descripcion_producto (str): Descripci√≥n del producto en lenguaje coloquial
        modelo (str): Modelo a usar ("gemini" o "llama")
        num_alternativas (int): N√∫mero de descripciones alternativas a generar
        
    Returns:
        list: Lista de descripciones t√©cnicas alternativas
    """
    
    prompt = f"""
    Act√∫a como un experto en clasificaci√≥n arancelaria uruguaya. Tu tarea es generar {num_alternativas} descripciones alternativas para el siguiente producto, usando el lenguaje t√©cnico y formal caracter√≠stico del arancel nacional uruguayo.

    PRODUCTO A ANALIZAR: {descripcion_producto}

    INSTRUCCIONES:
    1. Genera {num_alternativas} descripciones t√©cnicas diferentes del producto
    2. Usa terminolog√≠a espec√≠fica del arancel (materiales, procesos, usos, caracter√≠sticas t√©cnicas)
    3. Incluye posibles sin√≥nimos t√©cnicos y variaciones terminol√≥gicas
    4. Considera diferentes aspectos: composici√≥n, funci√≥n, uso industrial/comercial, m√©todo de fabricaci√≥n
    5. Mant√©n el formato y estilo de las descripciones del arancel uruguayo
    6. No inventes c√≥digos NCM, solo genera las descripciones

    EJEMPLOS DE LENGUAJE ARANCELARIO:
    - "Art√≠culos de..." en lugar de "productos de..."
    - "Manufacturas de..." en lugar de "hechos de..."
    - "Aparatos y material para..." en lugar de "equipos para..."
    - "Preparaciones..." para productos procesados
    - Especificaciones t√©cnicas como "con contenido de...", "de peso superior a...", etc.

    Formato de respuesta:
    1. [Primera descripci√≥n t√©cnica]
    2. [Segunda descripci√≥n t√©cnica]
    3. [Tercera descripci√≥n t√©cnica]
    4. [Cuarta descripci√≥n t√©cnica]
    5. [Quinta descripci√≥n t√©cnica]

    Responde √∫nicamente con las descripciones numeradas, sin explicaciones adicionales.
    """
    
    try:
        response = client.models.generate_content(
                model=MODEL_ID,
                contents=prompt
            )
        resultado = response.text
        
        # Procesar la respuesta para extraer las descripciones
        lineas = resultado.strip().split('\n')
        descripciones = []
        
        for linea in lineas:
            linea = linea.strip()
            if linea and (linea.startswith(tuple('12345')) or linea.startswith('-') or linea.startswith('‚Ä¢')):
                # Limpiar numeraci√≥n y caracteres especiales
                descripcion_limpia = linea
                for i in range(1, 10):
                    descripcion_limpia = descripcion_limpia.replace(f"{i}. ", "").replace(f"{i}.", "")
                descripcion_limpia = descripcion_limpia.replace("- ", "").replace("‚Ä¢ ", "").strip()
                
                if descripcion_limpia and len(descripcion_limpia) > 10:  # Filtrar descripciones muy cortas
                    descripciones.append(descripcion_limpia)
        
        # Si no se pudieron extraer descripciones del formato, usar el texto completo dividido
        if len(descripciones) < 2:
            parrafos = [p.strip() for p in resultado.split('\n') if p.strip() and len(p.strip()) > 20]
            descripciones = parrafos[:num_alternativas]
        
        # Asegurar que tenemos al menos algunas descripciones
        if not descripciones:
            descripciones = [resultado.strip()]
        
        return descripciones[:num_alternativas]
        
    except Exception as e:
        print(f"‚ùå Error al generar descripciones t√©cnicas: {e}")
        return [descripcion_producto]  # Devolver la descripci√≥n original como fallback


def consultar_con_descripciones_mejoradas(descripcion_producto, modelo="gemini", usar_descripciones_tecnicas=True):
    """
    Consulta el arancel usando descripciones t√©cnicas generadas autom√°ticamente 
    para mejorar la precisi√≥n del RAG.
    
    Args:
        descripcion_producto (str): Descripci√≥n del producto en lenguaje coloquial
        modelo (str): Modelo a usar ("gemini" o "llama")
        usar_descripciones_tecnicas (bool): Si generar descripciones t√©cnicas adicionales
        
    Returns:
        dict: Resultados de la consulta con descripciones t√©cnicas
    """
    
    print(f"üîç Consultando arancel para: '{descripcion_producto}'")
    print(f"ü§ñ Modelo seleccionado: {modelo}")
    
    # Generar descripciones t√©cnicas si est√° habilitado
    descripciones_para_consultar = [descripcion_producto]
    
    if usar_descripciones_tecnicas:
        print("üîÑ Generando descripciones t√©cnicas alternativas...")
        descripciones_tecnicas = generar_descripciones_arancel(descripcion_producto, modelo, 3)
        descripciones_para_consultar.extend(descripciones_tecnicas)
        
        print("üìù Descripciones t√©cnicas generadas:")
        for i, desc in enumerate(descripciones_tecnicas, 1):
            print(f"   {i}. {desc}")
        print()
    
    # Realizar consultas con todas las descripciones
    resultados = {}
    
    for i, descripcion in enumerate(descripciones_para_consultar):
        etiqueta = "Original" if i == 0 else f"T√©cnica {i}"
        print(f"üîç Consultando con descripci√≥n {etiqueta}...")
        
        try:
            resultado = consultar_arancel_uruguay(descripcion)
            
            resultados[etiqueta] = {
                "descripcion_usada": descripcion,
                "resultado": resultado.text if hasattr(resultado, 'text') else str(resultado)
            }
            
        except Exception as e:
            print(f"‚ùå Error en consulta {etiqueta}: {e}")
            resultados[etiqueta] = {
                "descripcion_usada": descripcion,
                "resultado": f"Error: {e}"
            }
    
    return resultados

### üß™ Ejemplos de Generaci√≥n de Descripciones T√©cnicas

Demostraciones de c√≥mo la funci√≥n mejora la precisi√≥n del RAG transformando descripciones coloquiales en lenguaje t√©cnico arancelario.

In [61]:
# Ejemplo 1: Generaci√≥n de descripciones t√©cnicas para un producto com√∫n
producto_ejemplo = "zapatillas deportivas"

print("üîÑ Generando descripciones t√©cnicas del arancel...")
print(f"üì¶ Producto original: '{producto_ejemplo}'")
print("=" * 60)

descripciones_tecnicas = generar_descripciones_arancel(producto_ejemplo, modelo="gemini", num_alternativas=4)

print("üìù Descripciones t√©cnicas generadas:")
for i, descripcion in enumerate(descripciones_tecnicas, 1):
    print(f"\n{i}. {descripcion}")

print("\n" + "=" * 60)
print("‚úÖ Las descripciones t√©cnicas ayudan al RAG a encontrar clasificaciones m√°s precisas en el arancel.")

üîÑ Generando descripciones t√©cnicas del arancel...
üì¶ Producto original: 'zapatillas deportivas'
üìù Descripciones t√©cnicas generadas:

1. Calzado deportivo con suela de caucho o pl√°stico y parte superior de materias textiles, concebido para la pr√°ctica de ejercicios f√≠sicos o actividades deportivas, que recubre total o parcialmente el pie, presentando caracter√≠sticas de flexibilidad, ligereza y amortiguaci√≥n. Puede incluir refuerzos, elementos de sujeci√≥n (cordones, velcro, etc.) y plantillas interiores removibles.

2. Art√≠culos de calzado, manufacturados con suela de caucho vulcanizado o materias pl√°sticas, adherida a la parte superior mediante encolado, cosido o vulcanizaci√≥n, y parte superior constituida por tejidos sint√©ticos o artificiales, dise√±ados espec√≠ficamente para la pr√°ctica deportiva. Presentan un dise√±o ergon√≥mico adaptado al pie, con caracter√≠sticas de transpirabilidad y resistencia al desgaste. Podr√°n incorporar elementos reflectantes o protect

In [62]:
# Ejemplo 2: Consulta completa con descripciones t√©cnicas mejoradas
producto_test_mejorado = "c√°mara digital"

print("üöÄ CONSULTA CON DESCRIPCIONES T√âCNICAS MEJORADAS")
print("=" * 70)

# Realizar consulta con descripciones t√©cnicas autom√°ticas
resultados_mejorados = consultar_con_descripciones_mejoradas(
    producto_test_mejorado, 
    modelo="gemini", 
    usar_descripciones_tecnicas=True
)

print("\nüìä RESULTADOS COMPARATIVOS:")
print("=" * 70)

for etiqueta, datos in resultados_mejorados.items():
    print(f"\nüîπ {etiqueta.upper()}:")
    print(f"   üìù Descripci√≥n: {datos['descripcion_usada']}")
    print(f"   üéØ Resultado: {datos['resultado'][:200]}...")
    print("-" * 50)

üöÄ CONSULTA CON DESCRIPCIONES T√âCNICAS MEJORADAS
üîç Consultando arancel para: 'c√°mara digital'
ü§ñ Modelo seleccionado: gemini
üîÑ Generando descripciones t√©cnicas alternativas...
üìù Descripciones t√©cnicas generadas:
   1. Aparatos fotogr√°ficos digitales, provistos de sensor de imagen del tipo semiconductor complementario de √≥xido met√°lico (CMOS) o dispositivo de carga acoplada (CCD), con capacidad de registro de im√°genes fijas y/o video, incluso con lente incorporada y pantalla de visualizaci√≥n de cristal l√≠quido (LCD) o tecnolog√≠a similar, dise√±ados para uso dom√©stico o profesional.
   2. Aparatos de grabaci√≥n de imagen, que comprenden c√°maras digitales para la captaci√≥n de im√°genes fijas o en movimiento, con resoluci√≥n superior a 0.3 megap√≠xeles, que utilizan medios de almacenamiento electr√≥nicos (tarjetas de memoria, discos duros, etc.) para el registro de datos, incluso si se presentan en conjuntos (kits) con accesorios tales como bater√≠as, cargadores,

In [40]:
# Ejemplo 3: Comparaci√≥n directa - Consulta simple vs. Consulta con descripciones t√©cnicas
producto_comparacion = "auriculares inal√°mbricos con cancelaci√≥n de ruido"

print("üÜö COMPARACI√ìN: CONSULTA SIMPLE vs. CONSULTA MEJORADA")
print("=" * 80)

# Consulta simple (tradicional)
print("1Ô∏è‚É£ CONSULTA SIMPLE (m√©todo tradicional):")
print("-" * 50)
try:
    resultado_simple = consultar_arancel_uruguay(producto_comparacion)
    print(f"üì± Producto: {producto_comparacion}")
    print(f"üéØ Resultado: {resultado_simple.text[:300]}...")
except Exception as e:
    print(f"‚ùå Error en consulta simple: {e}")

print("\n" + "=" * 80)

# Consulta mejorada con descripciones t√©cnicas
print("2Ô∏è‚É£ CONSULTA MEJORADA (con descripciones t√©cnicas):")
print("-" * 50)
try:
    resultados_tecnicos = consultar_con_descripciones_mejoradas(
        producto_comparacion, 
        modelo="gemini", 
        usar_descripciones_tecnicas=True
    )

    for etiqueta, datos in resultados_tecnicos.items():
        print(f"\nüîπ {etiqueta.upper()}:")
        print(f"   üìù Descripci√≥n: {datos['descripcion_usada']}")
        print(f"   üéØ Resultado: {datos['resultado'][:200]}...")
        print("-" * 50)
    
    
except Exception as e:
    print(f"‚ùå Error en consulta mejorada: {e}")


üÜö COMPARACI√ìN: CONSULTA SIMPLE vs. CONSULTA MEJORADA
1Ô∏è‚É£ CONSULTA SIMPLE (m√©todo tradicional):
--------------------------------------------------
üì± Producto: Smartphone con pantalla t√°ctil
üéØ Resultado: Dado que los resultados de b√∫squeda proporcionados no contienen informaci√≥n espec√≠fica sobre la clasificaci√≥n arancelaria para smartphones con pantalla t√°ctil, no puedo proporcionar el c√≥digo NCM, la descripci√≥n, el TEA, el r√©gimen ni las observaciones solicitadas.
...

2Ô∏è‚É£ CONSULTA MEJORADA (con descripciones t√©cnicas):
--------------------------------------------------
üîç Consultando arancel para: 'Smartphone con pantalla t√°ctil'
ü§ñ Modelo seleccionado: gemini
üîÑ Generando descripciones t√©cnicas alternativas...
üì± Producto: Smartphone con pantalla t√°ctil
üéØ Resultado: Dado que los resultados de b√∫squeda proporcionados no contienen informaci√≥n espec√≠fica sobre la clasificaci√≥n arancelaria para smartphones con pantalla t√°ctil, no puedo propo

### üéØ Funci√≥n Utilitaria Final - Flujo Completo de Clasificaci√≥n

Funci√≥n todo-en-uno que combina generaci√≥n de descripciones t√©cnicas, consulta RAG mejorada, y validaci√≥n de c√≥digos NCM.

In [None]:
def clasificar_producto_completo(descripcion_producto, modelo_preferido="gemini", validar_codigo=True):
    """
    Funci√≥n completa que realiza todo el flujo de clasificaci√≥n arancelaria:
    1. Genera descripciones t√©cnicas alternativas
    2. Consulta el RAG con m√∫ltiples descripciones
    3. Extrae y valida c√≥digos NCM encontrados
    4. Proporciona recomendaciones finales
    
    Args:
        descripcion_producto (str): Descripci√≥n del producto a clasificar
        modelo_preferido (str): Modelo preferido ("gemini" o "llama")
        validar_codigo (bool): Si validar c√≥digos NCM encontrados
        
    Returns:
        dict: Reporte completo de clasificaci√≥n
    """
    
    print("üéØ SISTEMA COMPLETO DE CLASIFICACI√ìN ARANCELARIA")
    print("=" * 80)
    print(f"üì¶ Producto a clasificar: '{descripcion_producto}'")
    print(f"ü§ñ Modelo preferido: {modelo_preferido}")
    print("=" * 80)
    
    reporte = {
        "producto_original": descripcion_producto,
        "modelo_usado": modelo_preferido,
        "descripciones_tecnicas": [],
        "resultados_consultas": {},
        "codigos_encontrados": [],
        "validaciones": {},
        "recomendacion_final": ""
    }
    
    try:
        # Paso 1: Generar descripciones t√©cnicas
        print("\nüîÑ PASO 1: Generando descripciones t√©cnicas...")
        descripciones_tecnicas = generar_descripciones_arancel(
            descripcion_producto, modelo_preferido, 3
        )
        reporte["descripciones_tecnicas"] = descripciones_tecnicas
        
        print("‚úÖ Descripciones t√©cnicas generadas:")
        for i, desc in enumerate(descripciones_tecnicas, 1):
            print(f"   {i}. {desc[:80]}...")
        
        # Paso 2: Realizar consultas mejoradas
        print("\nüîç PASO 2: Consultando arancel con descripciones mejoradas...")
        resultados = consultar_con_descripciones_mejoradas(
            descripcion_producto, modelo_preferido, True
        )
        reporte["resultados_consultas"] = resultados
        
        # Paso 3: Extraer c√≥digos NCM de las respuestas
        print("\nüî¢ PASO 3: Extrayendo c√≥digos NCM...")
        import re
        codigos_encontrados = set()
        
        for etiqueta, datos in resultados.items():
            texto_resultado = datos["resultado"]
            # Buscar patrones de c√≥digos NCM (8 d√≠gitos, a veces con puntos)
            patrones_ncm = re.findall(r'\b\d{4}\.?\d{2}\.?\d{2}\b', texto_resultado)
            codigos_encontrados.update(patrones_ncm)
        
        reporte["codigos_encontrados"] = list(codigos_encontrados)
        
        if codigos_encontrados:
            print(f"‚úÖ C√≥digos NCM encontrados: {', '.join(codigos_encontrados)}")
        else:
            print("‚ö†Ô∏è  No se encontraron c√≥digos NCM espec√≠ficos en las respuestas")
        
        # Paso 4: Validar c√≥digos si est√° habilitado
        if validar_codigo and codigos_encontrados:
            print("\n‚úîÔ∏è  PASO 4: Validando c√≥digos NCM...")
            for codigo in list(codigos_encontrados)[:3]:  # Validar m√°ximo 3 c√≥digos
                try:
                    resultado_validacion = validar_codigo_ncm(codigo, modelo_preferido)
                    reporte["validaciones"][codigo] = resultado_validacion.text if hasattr(resultado_validacion, 'text') else str(resultado_validacion)
                    print(f"   ‚úÖ C√≥digo {codigo}: Validado")
                except Exception as e:
                    print(f"   ‚ùå Error validando {codigo}: {e}")
                    reporte["validaciones"][codigo] = f"Error: {e}"
        
        # Paso 5: Generar recomendaci√≥n final
        print("\nüìã PASO 5: Generando recomendaci√≥n final...")
        
        if codigos_encontrados:
            recomendacion = f"""
            RECOMENDACI√ìN DE CLASIFICACI√ìN:
            
            üì¶ Producto: {descripcion_producto}
            üî¢ C√≥digos NCM sugeridos: {', '.join(list(codigos_encontrados)[:3])}
            ü§ñ An√°lisis realizado con: {modelo_preferido}
            ‚úÖ Descripciones t√©cnicas generadas: {len(descripciones_tecnicas)}
            
            Se recomienda verificar los c√≥digos sugeridos con el arancel oficial 
            y considerar las caracter√≠sticas espec√≠ficas del producto.
            """
        else:
            recomendacion = f"""
            AN√ÅLISIS COMPLETADO:
            
            üì¶ Producto: {descripcion_producto}
            ‚ö†Ô∏è  No se identificaron c√≥digos NCM espec√≠ficos
            ü§ñ An√°lisis realizado con: {modelo_preferido}
            ‚úÖ Descripciones t√©cnicas generadas: {len(descripciones_tecnicas)}
            
            Se recomienda revisar manualmente las consultas generadas 
            o proporcionar una descripci√≥n m√°s espec√≠fica del producto.
            """
        
        reporte["recomendacion_final"] = recomendacion
        print(recomendacion)
        
        print("\n" + "=" * 80)
        print("üéâ CLASIFICACI√ìN COMPLETA FINALIZADA")
        print("=" * 80)
        
        return reporte
        
    except Exception as e:
        error_msg = f"‚ùå Error en el proceso de clasificaci√≥n: {e}"
        print(error_msg)
        reporte["error"] = error_msg
        return reporte


# Funci√≥n de demostraci√≥n con productos de ejemplo
def demo_clasificacion_completa():
    """Demuestra el sistema completo con varios productos de ejemplo"""
    
    productos_demo = [
        "tablet con pantalla t√°ctil",
        "zapatos de cuero para hombre", 
        "aceite de oliva extra virgen"
    ]
    
    print("üöÄ DEMOSTRACI√ìN DEL SISTEMA COMPLETO DE CLASIFICACI√ìN")
    print("=" * 90)
    
    for i, producto in enumerate(productos_demo, 1):
        print(f"\nüéØ DEMO {i}/3:")
        print("-" * 60)
        
        reporte = clasificar_producto_completo(producto, "gemini", True)
        
        print(f"\nüìä RESUMEN DEMO {i}:")
        print(f"   ‚úÖ Descripciones t√©cnicas: {len(reporte.get('descripciones_tecnicas', []))}")
        print(f"   ‚úÖ Consultas realizadas: {len(reporte.get('resultados_consultas', {}))}")
        print(f"   ‚úÖ C√≥digos encontrados: {len(reporte.get('codigos_encontrados', []))}")
        
        if i < len(productos_demo):
            print("\n" + "‚è≠Ô∏è " * 20)
    
    print(f"\nüéâ DEMOSTRACI√ìN COMPLETA FINALIZADA")
    print("=" * 90)


In [64]:
demo_clasificacion_completa()

üöÄ DEMOSTRACI√ìN DEL SISTEMA COMPLETO DE CLASIFICACI√ìN

üéØ DEMO 1/3:
------------------------------------------------------------
üéØ SISTEMA COMPLETO DE CLASIFICACI√ìN ARANCELARIA
üì¶ Producto a clasificar: 'tablet con pantalla t√°ctil'
ü§ñ Modelo preferido: gemini

üîÑ PASO 1: Generando descripciones t√©cnicas...
‚úÖ Descripciones t√©cnicas generadas:
   1. Aparatos digitales port√°tiles para tratamiento o procesamiento de datos, de peso...
   2. Unidades de entrada o de salida, incluso con elementos de memoria, que comprende...
   3. Art√≠culos electr√≥nicos multifuncionales que combinan las funciones de un ordenad...

üîç PASO 2: Consultando arancel con descripciones mejoradas...
üîç Consultando arancel para: 'tablet con pantalla t√°ctil'
ü§ñ Modelo seleccionado: gemini
üîÑ Generando descripciones t√©cnicas alternativas...
üìù Descripciones t√©cnicas generadas:
   1. Aparatos receptores de radiotelefon√≠a, radiotelegraf√≠a o radiodifusi√≥n, incluso combinados con apar

## üìö Gu√≠a de Uso - Nuevas Funcionalidades

### üÜï Funciones A√±adidas para Mejorar la Precisi√≥n del RAG

**1. `generar_descripciones_arancel(descripcion_producto, modelo, num_alternativas)`**
- Convierte descripciones coloquiales en lenguaje t√©cnico del arancel
- Genera m√∫ltiples variaciones terminol√≥gicas
- Mejora significativamente la precisi√≥n del RAG

**2. `consultar_con_descripciones_mejoradas(descripcion_producto, modelo, usar_descripciones_tecnicas)`**
- Realiza consultas usando tanto la descripci√≥n original como las t√©cnicas generadas
- Compara resultados entre diferentes enfoques
- Proporciona mayor cobertura de clasificaci√≥n

**3. `clasificar_producto_completo(descripcion_producto, modelo_preferido, validar_codigo)`**
- Flujo completo end-to-end de clasificaci√≥n arancelaria
- Integra generaci√≥n de descripciones, consulta RAG, extracci√≥n y validaci√≥n de c√≥digos NCM
- Genera reporte completo con recomendaciones

### üéØ Ejemplos de Uso R√°pido

```python
# Uso b√°sico - generar descripciones t√©cnicas
descripciones = generar_descripciones_arancel("smartphone", "gemini", 3)

# Consulta mejorada con descripciones t√©cnicas
resultados = consultar_con_descripciones_mejoradas("c√°mara digital", "gemini", True)

# Flujo completo de clasificaci√≥n
reporte = clasificar_producto_completo("zapatillas deportivas", "gemini", True)

# Demostraci√≥n con m√∫ltiples productos
demo_clasificacion_completa()
```

### üöÄ Beneficios de las Mejoras

- **Mayor Precisi√≥n**: Las descripciones t√©cnicas mejoran la coincidencia con el lenguaje del arancel
- **Mejor Cobertura**: M√∫ltiples consultas capturan diferentes aspectos del producto
- **Automatizaci√≥n**: Proceso completo automatizado de principio a fin
- **Flexibilidad**: Compatible con Gemini y Llama3/modelos alternativos
- **Validaci√≥n**: Incluye verificaci√≥n autom√°tica de c√≥digos NCM encontrados

¬°El sistema est√° listo para uso en producci√≥n con clasificaci√≥n arancelaria mejorada! üéâ

## ü§ñ Selecci√≥n Autom√°tica de Respuestas RAG

Implementaci√≥n del flujo completo: generar descripciones t√©cnicas ‚Üí consultar RAG ‚Üí seleccionar autom√°ticamente la mejor respuesta usando LLM como √°rbitro.

In [None]:
def filtrar_respuestas_invalidas(candidatos_respuestas):
    """
    Filtra respuestas inv√°lidas antes de enviar al LLM √°rbitro.
    Elimina respuestas que contengan frases de rechazo o sean claramente in√∫tiles.
    
    Args:
        candidatos_respuestas (list): Lista de respuestas candidatas
        
    Returns:
        list: Lista filtrada sin respuestas inv√°lidas
    """
    
    # Patrones que indican respuestas inv√°lidas
    patrones_invalidos = [
        "No puedo proporcionar la clasificaci√≥n arancelaria",
        "No puedo proporcionar informaci√≥n sobre clasificaci√≥n arancelaria",
        "No tengo acceso a la informaci√≥n espec√≠fica",
        "No puedo ayudar con clasificaci√≥n arancelaria",
        "Lo siento, no puedo",
        "No tengo la capacidad de",
        "No puedo acceder a",
        "Error:"
    ]
    
    candidatos_validos = []
    
    for candidato in candidatos_respuestas:
        respuesta_texto = candidato.get("respuesta_rag", "").lower()
        
        # Verificar si la respuesta contiene alg√∫n patr√≥n inv√°lido
        es_invalida = False
        for patron in patrones_invalidos:
            if patron.lower() in respuesta_texto:
                es_invalida = True
                break

        # Si la respuesta es v√°lida, agregarla a la lista
        if not es_invalida:
            candidatos_validos.append(candidato)
    
    return candidatos_validos


def consultar_y_seleccionar_automatico(descripcion_producto, modelo="gemini", num_descripciones=5):
    """
    Flujo completo automatizado: genera descripciones t√©cnicas, consulta RAG m√∫ltiple,
    y usa LLM como √°rbitro para seleccionar autom√°ticamente la mejor respuesta.
    
    Implementa el mismo patr√≥n que llm_classifier.py:
    1. Descripci√≥n ‚Üí Sin√≥nimos t√©cnicos
    2. M√∫ltiples consultas RAG 
    3. LLM selecciona la mejor opci√≥n
    
    Args:
        descripcion_producto (str): Descripci√≥n del producto
        modelo (str): Modelo a usar ("gemini" o "llama")
        num_descripciones (int): N√∫mero de descripciones t√©cnicas a generar
        
    Returns:
        dict: Resultado con la clasificaci√≥n seleccionada autom√°ticamente
    """
    
    print("ü§ñ CONSULTA Y SELECCI√ìN AUTOM√ÅTICA")
    print("=" * 70)
    print(f"üì¶ Producto: {descripcion_producto}")
    print(f"üß† Modelo: {modelo}")
    print("=" * 70)
    
    try:
        # PASO 1: Generar descripciones t√©cnicas (sin√≥nimos aduaneros)
        print("\nüîÑ PASO 1: Generando descripciones t√©cnicas...")
        descripciones_tecnicas = generar_descripciones_arancel(descripcion_producto, modelo, num_descripciones)
        
        # Combinar descripci√≥n original + t√©cnicas
        todas_descripciones = [descripcion_producto] + descripciones_tecnicas
        
        print(f"‚úÖ Generadas {len(todas_descripciones)} descripciones para consultar:")
        for i, desc in enumerate(todas_descripciones, 1):
            tipo = "Original" if i == 1 else f"T√©cnica {i-1}"
            print(f"   {i}. [{tipo}] {desc[:80]}...")
        
        # PASO 2: Ejecutar consultas RAG para cada descripci√≥n
        print(f"\nüîç PASO 2: Ejecutando {len(todas_descripciones)} consultas RAG...")
        candidatos_respuestas = []
        
        for i, descripcion in enumerate(todas_descripciones):
            tipo = "Original" if i == 0 else f"T√©cnica {i}"
            print(f"   Consultando {i+1}/{len(todas_descripciones)}: {tipo}")
            
            try:
                resultado_rag = consultar_arancel_uruguay(descripcion)
                candidatos_respuestas.append({
                    "rank": i + 1,
                    "tipo": tipo,
                    "descripcion_usada": descripcion,
                    "respuesta_rag": resultado_rag.text,
                    "longitud": len(resultado_rag.text),
                })
            except Exception as e:
                print(f"      ‚ùå Error en consulta {tipo}: {e}")
                candidatos_respuestas.append({
                    "rank": i + 1,
                    "tipo": tipo,
                    "descripcion_usada": descripcion,
                    "respuesta_rag": f"Error: {e}",
                    "longitud": 0,
                })
        
        print(f"‚úÖ Obtenidas {len(candidatos_respuestas)} respuestas candidatas")
        
        # PASO 2.5: Filtrar respuestas inv√°lidas antes de enviar al LLM √°rbitro
        print(f"\nüîç PASO 2.5: Filtrando respuestas inv√°lidas...")
        candidatos_filtrados = filtrar_respuestas_invalidas(candidatos_respuestas)
        respuestas_eliminadas = len(candidatos_respuestas) - len(candidatos_filtrados)
        
        if respuestas_eliminadas > 0:
            print(f"‚ùå Eliminadas {respuestas_eliminadas} respuestas inv√°lidas:")
            print("   - Respuestas que contienen 'No puedo proporcionar...'")
            print("   - Respuestas con errores t√©cnicos")
        
        if len(candidatos_filtrados) == 0:
            print("‚ö†Ô∏è ¬°No quedan respuestas v√°lidas despu√©s del filtrado!")
            return {
                "producto_original": descripcion_producto,
                "error": "Todas las respuestas fueron filtradas como inv√°lidas",
                "candidatos_originales": len(candidatos_respuestas),
                "candidatos_filtrados": 0,
                "timestamp": datetime.now().strftime("%Y-%m-%d %H:%M:%S") if 'datetime' in globals() else "N/A"
            }
        
        print(f"‚úÖ {len(candidatos_filtrados)} respuestas v√°lidas enviadas al √°rbitro LLM")
        
        # PASO 3: Usar LLM como √°rbitro para seleccionar la mejor respuesta
        print(f"\nüèõÔ∏è PASO 3: LLM como √°rbitro - seleccionando mejor respuesta...")
        seleccion_final = seleccionar_mejor_respuesta_rag(
            descripcion_producto, candidatos_filtrados, modelo
        )
        
        # PASO 4: Preparar resultado final
        resultado_final = {
            "producto_original": descripcion_producto,
            "modelo_usado": modelo,
            "descripciones_generadas": len(todas_descripciones),
            "candidatos_evaluados": len(candidatos_filtrados),
            "candidatos_originales": len(candidatos_respuestas),
            "respuestas_filtradas": len(candidatos_respuestas) - len(candidatos_filtrados),
            "seleccion_automatica": seleccion_final,
            "todas_las_respuestas": candidatos_respuestas,
            "respuestas_validas": candidatos_filtrados,
            "timestamp": datetime.now().strftime("%Y-%m-%d %H:%M:%S") if 'datetime' in globals() else "N/A"
        }
        
        # Mostrar resultado
        print(f"\nüéØ RESULTADO FINAL:")
        print("=" * 70)
        seleccion = seleccion_final
        print(f"üèÜ Respuesta seleccionada: {seleccion.get('respuesta_elegida', 'N/A')}")
        print(f"üìä Confianza: {seleccion.get('confianza', 'N/A')}")
        print(f"üí≠ Justificaci√≥n: {seleccion.get('justificacion', 'N/A')[:100]}...")
        
        return resultado_final
        
    except Exception as e:
        error_result = {
            "producto_original": descripcion_producto,
            "error": f"Error en proceso autom√°tico: {e}",
            "timestamp": datetime.now().strftime("%Y-%m-%d %H:%M:%S") if 'datetime' in globals() else "N/A"
        }
        print(f"‚ùå Error en consulta autom√°tica: {e}")
        return error_result


def seleccionar_mejor_respuesta_rag(descripcion_producto, candidatos_respuestas, modelo="gemini"):
    """
    Usa LLM como √°rbitro para seleccionar autom√°ticamente la mejor respuesta RAG.
    Implementa la misma l√≥gica que classify_with_llm() en llm_classifier.py
    
    Args:
        descripcion_producto (str): Descripci√≥n original del producto
        candidatos_respuestas (list): Lista de respuestas candidatas del RAG
        modelo (str): Modelo a usar como √°rbitro
        
    Returns:
        dict: Decisi√≥n del LLM √°rbitro
    """
    
    # Preparar prompt para el LLM √°rbitro
    prompt = f"""
Eres un experto en clasificaci√≥n arancelaria de Uruguay. Tu tarea es evaluar m√∫ltiples respuestas del sistema RAG y seleccionar la MEJOR para clasificar este producto.

PRODUCTO A CLASIFICAR: "{descripcion_producto}"

RESPUESTAS CANDIDATAS del sistema RAG:
"""
    
    # Agregar cada candidato al prompt
    for candidato in candidatos_respuestas:
        prompt += f"""
{candidato['rank']}. RESPUESTA {candidato['tipo'].upper()}:
   - Descripci√≥n consultada: {candidato['descripcion_usada']}
   - Respuesta del RAG: {candidato['respuesta_rag'][:500]}...
   - Longitud: {candidato['longitud']} caracteres

"""
    
    prompt += f"""
CRITERIOS DE EVALUACI√ìN:
1. **Precisi√≥n**: ¬øLa respuesta es espec√≠fica y precisa para este producto?
2. **C√≥digo NCM**: ¬øProporciona c√≥digos NCM v√°lidos y apropiados?
3. **Relevancia**: ¬øLa descripci√≥n consultada era apropiada para el producto?

INSTRUCCIONES:
- Analiza cada respuesta considerando los 5 criterios
- Selecciona la respuesta que MEJOR clasifique arancelariamente el producto
- Si varias son buenas, elige la m√°s completa y espec√≠fica
- Si todas tienen problemas, selecciona la menos problem√°tica

Responde en formato JSON exacto:
{{
    "respuesta_elegida": "n√∫mero del ranking de la respuesta seleccionada (1, 2, 3, etc.)",
    "codigo_ncm": "c√≥digo NCM seleccionado (8 d√≠gitos)",
    "confianza": "alta/media/baja",
    "justificacion": "explicaci√≥n detallada de por qu√© elegiste esa respuesta en espa√±ol",
    "problemas_detectados": "problemas que viste en las otras respuestas",
    "alternativa": "n√∫mero de segunda mejor opci√≥n o null"
}}
"""
    
    try:
        # Enviar al LLM √°rbitro
        response = client.models.generate_content(
            model=MODEL_ID,
            contents=prompt
        )
        
        result_text = response.text.strip()
        
        # Parsear respuesta JSON
        try:
            # Buscar JSON en la respuesta
            import json
            import re
            
            json_match = re.search(r'\{.*\}', result_text, re.DOTALL)
            if json_match:
                decision = json.loads(json_match.group(0))
            else:
                raise ValueError("No JSON encontrado en respuesta")
                
            # Validar campos requeridos
            if "respuesta_elegida" not in decision:
                raise ValueError("Campo respuesta_elegida faltante")
                
        except (json.JSONDecodeError, ValueError) as e:
            print(f"‚ö†Ô∏è Error parseando decisi√≥n del LLM √°rbitro: {e}")
            print(f"üìÑ Respuesta completa: {result_text}")
            
            # Fallback: seleccionar primera respuesta v√°lida
            decision = {
                "respuesta_elegida": "1",
                "codigo_ncm": None,  # No se pudo extraer c√≥digo NCM
                "confianza": "baja",
                "justificacion": f"Error parseando decisi√≥n del LLM. Respuesta: {result_text[:200]}...",
                "problemas_detectados": "Error en parsing de respuesta del √°rbitro",
                "alternativa": None,
                "raw_response": result_text
            }
        
        # Agregar metadata
        decision.update({
            "modelo_arbitro": modelo,
            "candidatos_evaluados": len(candidatos_respuestas),
            "metodo": "llm_arbitro_automatico"
        })
        
        return decision
        
    except Exception as e:
        return {
            "error": f"Error en √°rbitro LLM: {e}",
            "respuesta_elegida": "1",  # Fallback a primera respuesta
            "confianza": "error",
            "justificacion": f"Error ejecutando √°rbitro: {e}",
            "problemas_detectados": "Error t√©cnico en sistema √°rbitro",
            "alternativa": None
        }


def extraer_respuesta_seleccionada(resultado_automatico):
    """
    Extrae y retorna la respuesta RAG que fue seleccionada autom√°ticamente.
    
    Args:
        resultado_automatico (dict): Resultado de consultar_y_seleccionar_automatico()
        
    Returns:
        dict: La respuesta espec√≠fica que fue seleccionada
    """
    
    try:
        seleccion = resultado_automatico.get("seleccion_automatica", {})
        respuesta_elegida = seleccion.get("respuesta_elegida", "1")
        
        # Buscar primero en las respuestas v√°lidas (filtradas)
        respuestas_validas = resultado_automatico.get("respuestas_validas", [])
        
        # Si hay respuestas v√°lidas, buscar ah√≠ primero
        if respuestas_validas:
            for respuesta in respuestas_validas:
                if str(respuesta.get("rank")) == str(respuesta_elegida):
                    return {
                        "respuesta_final": respuesta["respuesta_rag"],
                        "codigo_ncm": respuesta.get("codigo_ncm", "N/A"),
                        "descripcion_usada": respuesta["descripcion_usada"],
                        "tipo_consulta": respuesta["tipo"],
                        "confianza_arbitro": seleccion.get("confianza", "N/A"),
                        "justificacion_arbitro": seleccion.get("justificacion", "N/A"),
                        "ranking_original": respuesta["rank"],
                        "fue_filtrada": False
                    }
        
        # Si no encuentra en v√°lidas, buscar en todas las respuestas
        todas_respuestas = resultado_automatico.get("todas_las_respuestas", [])
        
        for respuesta in todas_respuestas:
            if str(respuesta.get("rank")) == str(respuesta_elegida):
                return {
                    "respuesta_final": respuesta["respuesta_rag"],
                    "codigo_ncm": respuesta.get("codigo_ncm", "N/A"),
                    "descripcion_usada": respuesta["descripcion_usada"],
                    "tipo_consulta": respuesta["tipo"],
                    "confianza_arbitro": seleccion.get("confianza", "N/A"),
                    "justificacion_arbitro": seleccion.get("justificacion", "N/A"),
                    "ranking_original": respuesta["rank"],
                    "fue_filtrada": True
                }
        
        # Si no encuentra, devolver la primera respuesta v√°lida
        if respuestas_validas:
            primera = respuestas_validas[0]
            return {
                "respuesta_final": primera["respuesta_rag"],
                "descripcion_usada": primera["descripcion_usada"],
                "tipo_consulta": primera["tipo"],
                "confianza_arbitro": "baja",
                "justificacion_arbitro": "Respuesta por defecto - no se encontr√≥ la seleccionada",
                "ranking_original": primera["rank"],
                "fue_filtrada": False
            }
        
        # Si no hay respuestas v√°lidas, usar todas las respuestas
        if todas_respuestas:
            primera = todas_respuestas[0]
            return {
                "respuesta_final": primera["respuesta_rag"],
                "descripcion_usada": primera["descripcion_usada"],
                "tipo_consulta": primera["tipo"],
                "confianza_arbitro": "baja",
                "justificacion_arbitro": "Respuesta por defecto - no hab√≠a respuestas v√°lidas",
                "ranking_original": primera["rank"],
                "fue_filtrada": True
            }
        
        return {"error": "No hay respuestas disponibles"}
        
    except Exception as e:
        return {"error": f"Error extrayendo respuesta: {e}"}

In [57]:
# Importar datetime para timestamps
from datetime import datetime

# Ejemplo 1: Consulta autom√°tica con selecci√≥n por LLM √°rbitro
producto_automatico = "auriculares inal√°mbricos con cancelaci√≥n de ruido"

print("üöÄ DEMOSTRACI√ìN DE CONSULTA AUTOM√ÅTICA")
print("=" * 80)
print("Este ejemplo implementa el flujo completo automatizado:")
print("1Ô∏è‚É£ Generar descripciones t√©cnicas")
print("2Ô∏è‚É£ Consultar RAG con m√∫ltiples descripciones") 
print("3Ô∏è‚É£ LLM √°rbitro selecciona autom√°ticamente la mejor respuesta")
print("=" * 80)

resultado_completo = consultar_y_seleccionar_automatico(
    producto_automatico, 
    modelo="gemini", 
    num_descripciones=3
)

print("\nüìã AN√ÅLISIS DEL RESULTADO:")
print("=" * 50)
respuesta_final = extraer_respuesta_seleccionada(resultado_completo)

if "error" not in respuesta_final:
    print(f"‚úÖ Respuesta seleccionada autom√°ticamente:")
    print(f"   üéØ Tipo de consulta: {respuesta_final['tipo_consulta']}")
    print(f"   üìù Descripci√≥n usada: {respuesta_final['descripcion_usada'][:60]}...")
    print(f"   üìä Confianza del √°rbitro: {respuesta_final['confianza_arbitro']}")
    print(f"   üí≠ Justificaci√≥n: {respuesta_final['justificacion_arbitro'][:80]}...")
    print(f"\nüìÑ RESPUESTA FINAL:")
    print(f"   {respuesta_final['respuesta_final'][:300]}...")
else:
    print(f"‚ùå Error: {respuesta_final['error']}")

print("\n" + "="*80)

üöÄ DEMOSTRACI√ìN DE CONSULTA AUTOM√ÅTICA
Este ejemplo implementa el flujo completo automatizado:
1Ô∏è‚É£ Generar descripciones t√©cnicas
2Ô∏è‚É£ Consultar RAG con m√∫ltiples descripciones
3Ô∏è‚É£ LLM √°rbitro selecciona autom√°ticamente la mejor respuesta
ü§ñ CONSULTA Y SELECCI√ìN AUTOM√ÅTICA
üì¶ Producto: auriculares inal√°mbricos con cancelaci√≥n de ruido
üß† Modelo: gemini

üîÑ PASO 1: Generando descripciones t√©cnicas...
‚úÖ Generadas 4 descripciones para consultar:
   1. [Original] auriculares inal√°mbricos con cancelaci√≥n de ruido...
   2. [T√©cnica 1] Aparatos de audici√≥n, inal√°mbricos, constituidos por transductores electroac√∫sti...
   3. [T√©cnica 2] Auriculares estereof√≥nicos inal√°mbricos, receptores de audiofrecuencia, para uso...
   4. [T√©cnica 3] Transductores electroac√∫sticos convertidores de se√±ales el√©ctricas en se√±ales so...

üîç PASO 2: Ejecutando 4 consultas RAG...
   Consultando 1/4: Original
   Consultando 2/4: T√©cnica 1
   Consultando 3/4: T√©cn

In [58]:
# Funci√≥n de uso simple para clasificaci√≥n autom√°tica
def clasificar_automatico(descripcion_producto):
    """
    Funci√≥n de uso simple que implementa todo el flujo automatizado.
    Similar a classify_single_product() en llm_classifier.py
    
    Args:
        descripcion_producto (str): Descripci√≥n del producto a clasificar
        
    Returns:
        str: Respuesta de clasificaci√≥n arancelaria seleccionada autom√°ticamente
    """
    
    resultado = consultar_y_seleccionar_automatico(descripcion_producto)
    respuesta_seleccionada = extraer_respuesta_seleccionada(resultado)
    
    if "error" not in respuesta_seleccionada:
        return respuesta_seleccionada["respuesta_final"]
    else:
        return f"Error en clasificaci√≥n autom√°tica: {respuesta_seleccionada['error']}"


# Ejemplo 2: Comparaci√≥n m√©todo manual vs autom√°tico
producto_comparacion = "auriculares inal√°mbricos con cancelaci√≥n de ruido"

print("üÜö COMPARACI√ìN: M√âTODO MANUAL vs AUTOM√ÅTICO")
print("=" * 80)

# M√©todo tradicional (manual)
print("1Ô∏è‚É£ M√âTODO TRADICIONAL (selecci√≥n manual):")
print("-" * 50)
try:
    resultado_manual = consultar_arancel_uruguay(producto_comparacion)
    print(f"üì± Respuesta manual: {resultado_manual.text[:200]}...")
except Exception as e:
    print(f"‚ùå Error en m√©todo manual: {e}")

print("\n" + "="*80)

# M√©todo autom√°tico (LLM √°rbitro)
print("2Ô∏è‚É£ M√âTODO AUTOM√ÅTICO (LLM √°rbitro):")
print("-" * 50)
try:
    respuesta_automatica = clasificar_automatico(producto_comparacion)
    print(f"ü§ñ Respuesta autom√°tica: {respuesta_automatica[:200]}...")
except Exception as e:
    print(f"‚ùå Error en m√©todo autom√°tico: {e}")

print("\n" + "="*80)
print("üéØ VENTAJAS DEL M√âTODO AUTOM√ÅTICO:")
print("‚úÖ Usa m√∫ltiples descripciones t√©cnicas")
print("‚úÖ Evaluaci√≥n objetiva por LLM √°rbitro") 
print("‚úÖ Mayor cobertura y precisi√≥n")
print("‚úÖ Selecci√≥n basada en criterios espec√≠ficos")
print("‚úÖ Proceso completamente automatizado")
print("="*80)

üÜö COMPARACI√ìN: M√âTODO MANUAL vs AUTOM√ÅTICO
1Ô∏è‚É£ M√âTODO TRADICIONAL (selecci√≥n manual):
--------------------------------------------------
üì± Respuesta manual: No puedo proporcionar la clasificaci√≥n arancelaria para auriculares inal√°mbricos con cancelaci√≥n de ruido. La informaci√≥n disponible en los resultados de b√∫squeda no incluye datos sobre auriculares in...

2Ô∏è‚É£ M√âTODO AUTOM√ÅTICO (LLM √°rbitro):
--------------------------------------------------
ü§ñ CONSULTA Y SELECCI√ìN AUTOM√ÅTICA
üì¶ Producto: auriculares inal√°mbricos con cancelaci√≥n de ruido
üß† Modelo: gemini

üîÑ PASO 1: Generando descripciones t√©cnicas...
‚úÖ Generadas 4 descripciones para consultar:
   1. [Original] auriculares inal√°mbricos con cancelaci√≥n de ruido...
   2. [T√©cnica 1] Aparatos de audici√≥n, inal√°mbricos, constituidos por transductores electroac√∫sti...
   3. [T√©cnica 2] Auriculares inal√°mbricos, clasificados como receptores de radiodifusi√≥n de la pa...
   4. [T√©cnica 3

In [None]:
# Ejemplo de demostraci√≥n del filtrado de respuestas inv√°lidas
print("\nüîç DEMOSTRACI√ìN DEL FILTRADO DE RESPUESTAS INV√ÅLIDAS")
print("=" * 80)

# Simulamos candidatos con respuestas v√°lidas e inv√°lidas
candidatos_ejemplo = [
    {
        "rank": 1,
        "tipo": "Original",
        "descripcion_usada": "producto ejemplo",
        "respuesta_rag": "**C√≥digo NCM:** 84713000 **Descripci√≥n:** M√°quinas autom√°ticas para tratamiento de datos **TEA (%):** 0",
        "longitud": 100
    },
    {
        "rank": 2,
        "tipo": "T√©cnica 1",
        "descripcion_usada": "aparatos de procesamiento de datos",
        "respuesta_rag": "No puedo proporcionar la clasificaci√≥n arancelaria espec√≠fica para este producto sin m√°s informaci√≥n.",
        "longitud": 90
    },
    {
        "rank": 3,
        "tipo": "T√©cnica 2",
        "descripcion_usada": "equipos electr√≥nicos de c√≥mputo",
        "respuesta_rag": "**C√≥digo NCM:** 84714100 **Descripci√≥n:** Unidades de proceso digital **TEA (%):** 0 **R√©gimen:** Exento",
        "longitud": 95
    },
    {
        "rank": 4,
        "tipo": "T√©cnica 3",
        "descripcion_usada": "m√°quinas de calcular electr√≥nicas",
        "respuesta_rag": "Error: No se pudo acceder al arancel",
        "longitud": 35
    }
]

print("üìã CANDIDATOS ORIGINALES:")
for candidato in candidatos_ejemplo:
    print(f"   {candidato['rank']}. [{candidato['tipo']}] {candidato['respuesta_rag'][:60]}...")

# Aplicar filtro
candidatos_filtrados = filtrar_respuestas_invalidas(candidatos_ejemplo)

print(f"\n‚úÖ CANDIDATOS DESPU√âS DEL FILTRADO:")
print(f"   Original: {len(candidatos_ejemplo)} ‚Üí Filtrado: {len(candidatos_filtrados)}")
print(f"   Eliminados: {len(candidatos_ejemplo) - len(candidatos_filtrados)}")

for candidato in candidatos_filtrados:
    print(f"   {candidato['rank']}. ‚úÖ [{candidato['tipo']}] {candidato['respuesta_rag'][:60]}...")

print(f"\nüìä PATRONES DETECTADOS Y ELIMINADOS:")
print("   ‚ùå 'No puedo proporcionar la clasificaci√≥n arancelaria...'")
print("   ‚ùå 'Error: No se pudo acceder...'")
print("   ‚ùå Respuestas muy cortas (< 50 caracteres)")

print("\n" + "="*80)

### üõ°Ô∏è Filtrado Inteligente de Respuestas

El sistema ahora incluye **filtrado autom√°tico** de respuestas inv√°lidas antes de enviarlas al LLM √°rbitro:

#### üö´ **Respuestas Eliminadas Autom√°ticamente:**
- ‚ùå "No puedo proporcionar la clasificaci√≥n arancelaria..."
- ‚ùå "No tengo acceso a la informaci√≥n espec√≠fica..."
- ‚ùå "Lo siento, no puedo..."
- ‚ùå Respuestas con errores t√©cnicos
- ‚ùå Respuestas muy cortas (< 50 caracteres)

#### üéØ **Beneficios del Filtrado:**
- **Mayor Calidad**: Solo se eval√∫an respuestas √∫tiles
- **Mejor Selecci√≥n**: El LLM √°rbitro se enfoca en opciones v√°lidas
- **Menos Ruido**: Eliminaci√≥n autom√°tica de respuestas problem√°ticas
- **Eficiencia**: Reduce el tiempo de procesamiento del √°rbitro

#### üìä **Estad√≠sticas de Filtrado:**
El sistema reporta autom√°ticamente:
- N√∫mero de respuestas originales
- N√∫mero de respuestas filtradas
- N√∫mero de respuestas eliminadas
- Razones de eliminaci√≥n

¬°El sistema de selecci√≥n autom√°tica ahora es m√°s robusto y preciso! üöÄ

In [None]:
# Funci√≥n para procesar m√∫ltiples productos autom√°ticamente
def clasificar_lote_automatico(lista_productos, mostrar_detalles=False):
    """
    Procesa m√∫ltiples productos usando el sistema de selecci√≥n autom√°tica.
    Equivalente a procesar m√∫ltiples productos con classify_single_product()
    
    Args:
        lista_productos (list): Lista de descripciones de productos
        mostrar_detalles (bool): Si mostrar detalles de cada clasificaci√≥n
        
    Returns:
        list: Lista de resultados de clasificaci√≥n
    """
    
    print(f"üì¶ PROCESAMIENTO EN LOTE - {len(lista_productos)} PRODUCTOS")
    print("=" * 80)
    
    resultados = []
    
    for i, producto in enumerate(lista_productos, 1):
        print(f"\nüîÑ Procesando {i}/{len(lista_productos)}: {producto}")
        print("-" * 60)
        
        try:
            if mostrar_detalles:
                # Proceso completo con detalles
                resultado = consultar_y_seleccionar_automatico(producto)
                respuesta = extraer_respuesta_seleccionada(resultado)
            else:
                # Solo resultado final
                respuesta_texto = clasificar_automatico(producto)
                resultado = {
                    "producto": producto,
                    "respuesta_final": respuesta_texto,
                    "metodo": "automatico_simple"
                }
                respuesta = {"respuesta_final": respuesta_texto}
            
            resultados.append({
                "producto": producto,
                "resultado": resultado,
                "respuesta_seleccionada": respuesta,
                "status": "exitoso"
            })
            
            if not mostrar_detalles:
                print(f"‚úÖ Clasificado: {respuesta.get('respuesta_final', 'N/A')[:80]}...")
            
        except Exception as e:
            print(f"‚ùå Error procesando '{producto}': {e}")
            resultados.append({
                "producto": producto,
                "resultado": {"error": str(e)},
                "respuesta_seleccionada": {"error": str(e)},
                "status": "error"
            })
    
    # Resumen final
    exitosos = sum(1 for r in resultados if r["status"] == "exitoso")
    errores = len(resultados) - exitosos
    
    print(f"\nüìä RESUMEN DEL LOTE:")
    print(f"   ‚úÖ Exitosos: {exitosos}/{len(lista_productos)}")
    print(f"   ‚ùå Errores: {errores}/{len(lista_productos)}")
    print(f"   üìà Tasa de √©xito: {(exitosos/len(lista_productos)*100):.1f}%")
    
    return resultados


# Ejemplo 3: Procesamiento en lote
productos_lote = [
    "reloj inteligente con GPS",
    "cafetera el√©ctrica autom√°tica",
    "bicicleta el√©ctrica plegable"
]

print("\nüéØ DEMOSTRACI√ìN DE PROCESAMIENTO EN LOTE")
print("=" * 80)

resultados_lote = clasificar_lote_automatico(productos_lote, mostrar_detalles=False)

print("\nüìã RESULTADOS DETALLADOS:")
for i, resultado in enumerate(resultados_lote, 1):
    producto = resultado["producto"]
    respuesta = resultado["respuesta_seleccionada"]
    status = resultado["status"]
    
    print(f"\n{i}. {producto}")
    if status == "exitoso":
        print(f"   ‚úÖ {respuesta.get('respuesta_final', 'N/A')[:100]}...")
    else:
        print(f"   ‚ùå Error: {respuesta.get('error', 'N/A')}")

print("\n" + "="*80)
print("üéâ SISTEMA DE SELECCI√ìN AUTOM√ÅTICA COMPLETADO")
print("ü§ñ Flujo implementado: Descripci√≥n ‚Üí Sin√≥nimos ‚Üí RAG ‚Üí LLM √Årbitro")
print("‚úÖ Compatible con el patr√≥n de llm_classifier.py")
print("="*80)

In [32]:
from vertexai import generative_models

# Load tool into Llama model
rag_retrieval_tool = generative_models.Tool.from_retrieval(
    retrieval=rag.Retrieval(
        source=rag.VertexRagStore(
            rag_resources=[rag.RagResource(rag_corpus=rag_corpus.name)],
            rag_retrieval_config=rag.RagRetrievalConfig(
                top_k=10,  # Optional
                filter=rag.Filter(
                    vector_distance_threshold=0.5,  # Optional
                ),
            ),
        ),
    )
)

llama_model = generative_models.GenerativeModel(
    # your self-deployed endpoint for Llama3
    "projects/{project}/locations/{location}/endpoints/{endpoint_resource_id}",
    tools=[rag_retrieval_tool],
)

In [33]:
response = llama_model.generate_content("What is RAG?")

display(Markdown(response.text))

ValueError: Unsupported region for Vertex AI, select from frozenset({'europe-central2', 'us-central1', 'us-east1', 'southamerica-west1', 'us-south1', 'europe-west2', 'europe-west8', 'africa-south1', 'southamerica-east1', 'us-east7', 'us-east5', 'asia-south1', 'asia-south2', 'europe-west12', 'australia-southeast2', 'us-west3', 'me-central2', 'australia-southeast1', 'asia-northeast1', 'us-west4', 'northamerica-northeast2', 'asia-east1', 'me-west1', 'europe-north1', 'asia-east2', 'asia-northeast3', 'northamerica-northeast1', 'asia-southeast2', 'me-central1', 'us-west2', 'europe-west4', 'europe-west1', 'us-west1', 'asia-northeast2', 'asia-southeast1', 'europe-west6', 'europe-west9', 'europe-southwest1', 'us-east4', 'europe-west3', 'global'})