<a href="https://colab.research.google.com/github/mateoCosta1/notepad_for_RAG/blob/main/gemini/rag-engine/intro_rag_engine.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# Copyright 2024 Google LLC
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# Intro to Building a Scalable and Modular RAG System with RAG Engine in Vertex AI

<table align="left">
  <td style="text-align: center">
    <a href="https://colab.research.google.com/github/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb">
      <img width="32px" src="https://www.gstatic.com/pantheon/images/bigquery/welcome_page/colab-logo.svg" alt="Google Colaboratory logo"><br> Open in Colab
    </a>
  </td>
  <td style="text-align: center">
    <a href="https://console.cloud.google.com/vertex-ai/colab/import/https:%2F%2Fraw.githubusercontent.com%2FGoogleCloudPlatform%2Fgenerative-ai%2Fmain%2Fgemini%2Frag-engine%2Fintro_rag_engine.ipynb">
      <img width="32px" src="https://lh3.googleusercontent.com/JmcxdQi-qOpctIvWKgPtrzZdJJK-J3sWE1RsfjZNwshCFgE_9fULcNpuXYTilIR2hjwN" alt="Google Cloud Colab Enterprise logo"><br> Open in Colab Enterprise
    </a>
  </td>
  <td style="text-align: center">
    <a href="https://console.cloud.google.com/vertex-ai/workbench/deploy-notebook?download_url=https://raw.githubusercontent.com/GoogleCloudPlatform/generative-ai/main/gemini/rag-engine/intro_rag_engine.ipynb">
      <img src="https://www.gstatic.com/images/branding/gcpiconscolors/vertexai/v1/32px.svg" alt="Vertex AI logo"><br> Open in Vertex AI Workbench
    </a>
  </td>
  <td style="text-align: center">
    <a href="https://github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb">
      <img width="32px" src="https://www.svgrepo.com/download/217753/github.svg" alt="GitHub logo"><br> View on GitHub
    </a>
  </td>
</table>

<div style="clear: both;"></div>

<b>Share to:</b>

<a href="https://www.linkedin.com/sharing/share-offsite/?url=https%3A//github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb" target="_blank">
  <img width="20px" src="https://upload.wikimedia.org/wikipedia/commons/8/81/LinkedIn_icon.svg" alt="LinkedIn logo">
</a>

<a href="https://bsky.app/intent/compose?text=https%3A//github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb" target="_blank">
  <img width="20px" src="https://upload.wikimedia.org/wikipedia/commons/7/7a/Bluesky_Logo.svg" alt="Bluesky logo">
</a>

<a href="https://twitter.com/intent/tweet?url=https%3A//github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb" target="_blank">
  <img width="20px" src="https://upload.wikimedia.org/wikipedia/commons/5/5a/X_icon_2.svg" alt="X logo">
</a>

<a href="https://reddit.com/submit?url=https%3A//github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb" target="_blank">
  <img width="20px" src="https://redditinc.com/hubfs/Reddit%20Inc/Brand/Reddit_Logo.png" alt="Reddit logo">
</a>

<a href="https://www.facebook.com/sharer/sharer.php?u=https%3A//github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/rag-engine/intro_rag_engine.ipynb" target="_blank">
  <img width="20px" src="https://upload.wikimedia.org/wikipedia/commons/5/51/Facebook_f_logo_%282019%29.svg" alt="Facebook logo">
</a>            

| | |
|-|-|
| Author(s) | [Holt Skinner](https://github.com/holtskinner) |

## Overview

Retrieval Augmented Generation (RAG) improves Large Language Models (LLMs) by allowing them to access and process external information sources during generation. This ensures the model's responses are grounded in factual data and avoids hallucinations.

A common problem with LLMs is that they don't understand private knowledge, that
is, your organization's data. With RAG Engine, you can enrich the
LLM context with additional private information, because the model can reduce
hallucinations and answer questions more accurately.

By combining additional knowledge sources with the existing knowledge that LLMs
have, a better context is provided. The improved context along with the query
enhances the quality of the LLM's response.

The following concepts are key to understanding Vertex AI RAG Engine. These concepts are listed in the order of the
retrieval-augmented generation (RAG) process.

1. **Data ingestion**: Intake data from different data sources. For example,
  local files, Google Cloud Storage, and Google Drive.

1. **Data transformation**: Conversion of the data in preparation for indexing. For example, data is split into chunks.

1. **Embedding**: Numerical representations of words or pieces of text. These numbers capture the
   semantic meaning and context of the text. Similar or related words or text
   tend to have similar embeddings, which means they are closer together in the
   high-dimensional vector space.

1. **Data indexing**: RAG Engine creates an index called a corpus.
   The index structures the knowledge base so it's optimized for searching. For
   example, the index is like a detailed table of contents for a massive
   reference book.

1. **Retrieval**: When a user asks a question or provides a prompt, the retrieval
  component in RAG Engine searches through its knowledge
  base to find information that is relevant to the query.

1. **Generation**: The retrieved information becomes the context added to the
  original user query as a guide for the generative AI model to generate
  factually grounded and relevant responses.

For more information, refer to the public documentation for [Vertex AI RAG Engine](https://cloud.google.com/vertex-ai/generative-ai/docs/rag-overview).

## Get started

### Install Vertex AI SDK and Google Gen AI SDK


In [2]:
%pip install --upgrade --quiet google-cloud-aiplatform google-genai

Note: you may need to restart the kernel to use updated packages.


### Restart runtime

To use the newly installed packages in this Jupyter runtime, you must restart the runtime. You can do this by running the cell below, which restarts the current kernel.

The restart might take a minute or longer. After it's restarted, continue to the next step.

In [None]:
import IPython

app = IPython.Application.instance()
app.kernel.do_shutdown(True)

{'status': 'ok', 'restart': True}

: 

<div class="alert alert-block alert-warning">
<b>⚠️ The kernel is going to restart. Wait until it's finished before continuing to the next step. ⚠️</b>
</div>


### Authenticate your notebook environment (Colab only)

If you're running this notebook on Google Colab, run the cell below to authenticate your environment.

In [3]:
import sys

if "google.colab" in sys.modules:
    from google.colab import auth

    auth.authenticate_user()

### Set Google Cloud project information and initialize Vertex AI SDK

To get started using Vertex AI, you must have an existing Google Cloud project and [enable the Vertex AI API](https://console.cloud.google.com/flows/enableapi?apiid=aiplatform.googleapis.com).

Learn more about [setting up a project and a development environment](https://cloud.google.com/vertex-ai/docs/start/cloud-environment).

In [4]:
# Use the environment variable if the user doesn't provide Project ID.
import os

from google import genai
import vertexai

PROJECT_ID = "first-presence-453619-j6"  # @param {type: "string", placeholder: "[your-project-id]", isTemplate: true}
if not PROJECT_ID or PROJECT_ID == "[your-project-id]":
    PROJECT_ID = str(os.environ.get("GOOGLE_CLOUD_PROJECT"))

LOCATION = os.environ.get("GOOGLE_CLOUD_REGION", "us-central1")

vertexai.init(project=PROJECT_ID, location=LOCATION)
client = genai.Client(vertexai=True, project=PROJECT_ID, location=LOCATION)

### Import libraries

In [5]:
from IPython.display import Markdown, display
from google.genai.types import GenerateContentConfig, Retrieval, Tool, VertexRagStore
from vertexai import rag

### Create a RAG Corpus

In [9]:
# Currently supports Google first-party embedding models
EMBEDDING_MODEL = "publishers/google/models/text-embedding-005"  # @param {type:"string", isTemplate: true}

rag_corpus = rag.create_corpus(
    display_name="my-rag-corpus",
    backend_config=rag.RagVectorDbConfig(
        rag_embedding_model_config=rag.RagEmbeddingModelConfig(
            vertex_prediction_endpoint=rag.VertexPredictionEndpoint(
                publisher_model=EMBEDDING_MODEL
            )
        )
    ),
)

### Check the corpus just created

In [10]:
rag.list_corpora()

ListRagCorporaPager<rag_corpora {
  name: "projects/first-presence-453619-j6/locations/us-central1/ragCorpora/4611686018427387904"
  display_name: "my-rag-corpus"
  create_time {
    seconds: 1754526577
    nanos: 939614000
  }
  update_time {
    seconds: 1754526577
    nanos: 939614000
  }
  corpus_status {
    state: ACTIVE
  }
  vector_db_config {
    rag_managed_db {
      knn {
      }
    }
    rag_embedding_model_config {
      vertex_prediction_endpoint {
        endpoint: "projects/first-presence-453619-j6/locations/us-central1/publishers/google/models/text-embedding-005"
      }
    }
  }
}
rag_corpora {
  name: "projects/first-presence-453619-j6/locations/us-central1/ragCorpora/2305843009213693952"
  display_name: "my-rag-corpus"
  create_time {
    seconds: 1754545106
    nanos: 637583000
  }
  update_time {
    seconds: 1754545106
    nanos: 637583000
  }
  corpus_status {
    state: ACTIVE
  }
  vector_db_config {
    rag_managed_db {
      knn {
      }
    }
    rag_em

### Upload a local file to the corpus

In [8]:
%%writefile test.md

Retrieval-Augmented Generation (RAG) is a technique that enhances the capabilities of large language models (LLMs) by allowing them to access and incorporate external data sources when generating responses. Here's a breakdown:

**What it is:**

* **Combining Retrieval and Generation:**
    * RAG combines the strengths of information retrieval systems (like search engines) with the generative power of LLMs.
    * It enables LLMs to go beyond their pre-trained data and access up-to-date and specific information.
* **How it works:**
    * When a user asks a question, the RAG system first retrieves relevant information from external data sources (e.g., databases, documents, web pages).
    * This retrieved information is then provided to the LLM as additional context.
    * The LLM uses this augmented context to generate a more accurate and informative response.

**Why it's helpful:**

* **Access to Up-to-Date Information:**
    * LLMs are trained on static datasets, so their knowledge can become outdated. RAG allows them to access real-time or frequently updated information.
* **Improved Accuracy and Factual Grounding:**
    * RAG reduces the risk of LLM "hallucinations" (generating false or misleading information) by grounding responses in verified external data.
* **Enhanced Contextual Relevance:**
    * By providing relevant context, RAG enables LLMs to generate more precise and tailored responses to specific queries.
* **Increased Trust and Transparency:**
    * RAG can provide source citations, allowing users to verify the information and increasing trust in the LLM's responses.
* **Cost Efficiency:**
    * Rather than constantly retraining large language models, RAG allows for the introduction of new data in a more cost effective way.

In essence, RAG bridges the gap between the vast knowledge of LLMs and the need for accurate, current, and contextually relevant information.


Writing test.md


### Subir Arancel Nacional de Uruguay

Ahora vamos a subir el arancel nacional de Uruguay para hacer consultas de clasificación arancelaria.

In [16]:
rag_file = rag.upload_file(
    corpus_name=rag_corpus.name,
    path="../../Arancel Nacional_Abril 2024.pdf",  # Usar el archivo PDF directamente
    display_name="Arancel Nacional Uruguay Abril 2024",
    description="Arancel Nacional de Uruguay con códigos NCM, descripciones y tarifas actualizadas a Abril 2024 (formato PDF)",
)

### Import files from Google Cloud Storage

Remember to grant "Viewer" access to the "Vertex RAG Data Service Agent" (with the format of `service-{project_number}@gcp-sa-vertex-rag.iam.gserviceaccount.com`) for your Google Cloud Storage bucket.

For this example, we'll use a public GCS bucket containing earning reports from Alphabet.

In [None]:
# Configuración optimizada para el arancel uruguayo en formato PDF
# INPUT_GCS_BUCKET = (
#     "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/"
# )

# Para el arancel uruguayo en PDF, usamos configuración específica para documentos estructurados
response = rag.import_files(
    corpus_name=rag_corpus.name,
    paths=["../../Arancel Nacional_Abril 2024.pdf"],  # Usar el archivo PDF
    # Configuración optimizada para documentos PDF con tablas arancelarias
    transformation_config=rag.TransformationConfig(
        chunking_config=rag.ChunkingConfig(
            chunk_size=1000,  # Tamaño apropiado para entradas del arancel en PDF
            chunk_overlap=150  # Overlap mayor para mantener contexto entre códigos relacionados
        )
    ),
    max_embedding_requests_per_min=900,  # Optional
)

### Import files from Google Drive

Eligible paths can be formatted as:

- `https://drive.google.com/drive/folders/{folder_id}`
- `https://drive.google.com/file/d/{file_id}`.

Remember to grant "Viewer" access to the "Vertex RAG Data Service Agent" (with the format of `service-{project_number}@gcp-sa-vertex-rag.iam.gserviceaccount.com`) for your Drive folder/files.


In [19]:
response = rag.import_files(
    corpus_name=rag_corpus.name,
    paths=["https://drive.google.com/file/d/1sLFbb_ncJ5yYvBYocU7kDxZAF1X3zG8H"],
    # Optional
    transformation_config=rag.TransformationConfig(
        chunking_config=rag.ChunkingConfig(chunk_size=512, chunk_overlap=50)
    ),
)

### Optional: Perform direct context retrieval

In [15]:
# Direct context retrieval
response = rag.retrieval_query(
    rag_resources=[
        rag.RagResource(
            rag_corpus=rag_corpus.name,
            # Optional: supply IDs from `rag.list_files()`.
            # rag_file_ids=["rag-file-1", "rag-file-2", ...],
        )
    ],
    rag_retrieval_config=rag.RagRetrievalConfig(
        top_k=10,  # Optional
        filter=rag.Filter(
            vector_distance_threshold=0.5,  # Optional
        ),
    ),
    text="What is RAG and why it is helpful?",
)
print(response)

# Optional: The retrieved context can be passed to any SDK or model generation API to generate final results.
# context = " ".join([context.text for context in response.contexts.contexts]).replace("\n", "")

contexts {
  contexts {
    source_uri: "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2021_alphabet_annual_report.pdf"
    text: "Information\r\n1WTYGDUKVGKUNQECVGFCVYYY CDE Z[\\ CPFQWTKPXGUVQTTGNCVKQPUYGDUKVGKUNQECVGFCVYYY CDE Z[\\ KPXGUVQT 1WT#PPWCN4GRQTVU\r\nQP(QTO   - 3WCTVGTN[4GRQTVUQP(QTO   3 %WTTGPV4GRQTVUQP(QTO  - CPFQWT2TQZ[5VCVGOGPVU CPFCP[COGPFOGPVUVQ\r\nVJGUGTGRQTVU CTGCXCKNCDNGVJTQWIJQWTKPXGUVQTTGNCVKQPUYGDUKVG HTGGQHEJCTIG CHVGTYGƒNGVJGOYKVJVJG5\'% 9GCNUQRTQXKFGC\r\nNKPMVQVJGUGEVKQPQHVJG5\'%ŦUYGDUKVGCVYYY UGE IQXVJCVJCUCNNQHVJGTGRQTVUVJCVYGƒNGQTHWTPKUJYKVJVJG5\'%   J G K T E Q O R N K C P E G Y K V J ) Q Q I N G Ŧ U 5 W R R N K G T % Q F G Q H % Q P F W E V   9 G E Q P V K P W C N N [ O C M G K O R T Q X G O G P V U V Q R T Q O Q V G C \r \n T G U R G E V H W N C P F R Q U K V K X G Y Q T M K P I G P X K T Q P O G P V H Q T G X G T [ Q P G ţ G O R N Q [ G G U   X G P F Q T U   C P F V G O R Q T C T [ U V C H H C N K M G   \r \n G o v e r n m e n t

### Create RAG Retrieval Tool

In [19]:
# Create a tool for the RAG Corpus
rag_retrieval_tool = Tool(
    retrieval=Retrieval(
        vertex_rag_store=VertexRagStore(
            rag_corpora=[rag_corpus.name],
            similarity_top_k=10,
            vector_distance_threshold=0.5,
        )
    )
)

### Generate Content with Gemini using RAG Retrieval Tool

In [20]:
MODEL_ID = "gemini-2.0-flash-001"

In [21]:
response = client.models.generate_content(
    model=MODEL_ID,
    contents="List me your provided documents",
    config=GenerateContentConfig(tools=[rag_retrieval_tool]),
)

display(Markdown(response.text))

The documents provided are:

*   Arancel Nacional Uruguay Abril 2024: 4 0 10
*   Arancel Nacional Uruguay Abril 2024: 22.00.10
*   Arancel Nacional Uruguay Abril 2024: 22.00.10 Crudos
*   Arancel Nacional Uruguay Abril 2024: 59.90.00
*   Arancel Nacional Uruguay Abril 2024: 10.80 10.8 0 10
*   Arancel Nacional Uruguay Abril 2024: 29.90.10
*   Arancel Nacional Uruguay Abril 2024: 1209.10.00.00
*   Arancel Nacional Uruguay Abril 2024: 80 10.8 0 10
*   Arancel Nacional Uruguay Abril 2024: 21.00.00
*   Arancel Nacional Uruguay Abril 2024


### Funciones para Consultar el Arancel Uruguayo

Ahora crearemos funciones específicas para consultar códigos arancelarios y tarifas del arancel nacional de Uruguay.

In [22]:
# Función especializada para consultar el arancel uruguayo
def consultar_arancel_uruguay(descripcion_producto):
    response = client.models.generate_content(
        model=MODEL_ID,
        contents=f"""
        Basándote en el Arancel Nacional de Uruguay (Abril 2024), encuentra la clasificación arancelaria para:
        
        PRODUCTO: {descripcion_producto}
        
        Proporciona la información en este formato exacto:
        
        **Código NCM:** [código de 8 dígitos]
        **Descripción:** [descripción oficial del arancel]
        **TEA (%):** [Tarifa Externa de Arancel]
        **Régimen:** [información sobre régimen especial si aplica]
        **Observaciones:** [notas adicionales si las hay]
        
        Si hay múltiples códigos posibles, lista los 2 más apropiados.
        """,
        config=GenerateContentConfig(tools=[rag_retrieval_tool]),
    )
    return response

In [36]:
# Casos de prueba específicos para el mercado uruguayo
productos_test = [
    "Café verde en grano sin tostar",
    "Smartphone con pantalla táctil",
    "Carne bovina congelada",
    "Vino tinto en botellas de vidrio",
    "Computadora portátil",
    "Medicamentos para diabetes",
    "Aceite de girasol refinado",
    "Neumáticos para automóvil",
    "Queso tipo mozzarella",
    "Arroz blanco pulido"
]

print("=== CONSULTAS AL ARANCEL NACIONAL URUGUAY ===\n")

for i, producto in enumerate(productos_test[:3], 1):  # Probamos solo los primeros 3
    print(f"{i}. PRODUCTO: {producto}")
    resultado = consultar_arancel_uruguay(producto)
    display(Markdown(resultado.text))
    print("\n" + "="*70 + "\n")

=== CONSULTAS AL ARANCEL NACIONAL URUGUAY ===

1. PRODUCTO: Café verde en grano sin tostar


**Código NCM:** 0901.10.00
**Descripción:** Café verde en grano sin tostar
**TEA (%):** 0%
**Régimen:** No aplica
**Observaciones:** No aplica




2. PRODUCTO: Smartphone con pantalla táctil


No puedo proporcionar la clasificación arancelaria para un smartphone con pantalla táctil. Los documentos proporcionados no contienen información sobre ese producto.




3. PRODUCTO: Carne bovina congelada


**Código NCM:** 0202.10.00.00
**Descripción:** En canales o medias canales
**TEA (%):** 9
**Régimen:** Ninguno especificado
**Observaciones:** N/A

**Código NCM:** 0202.20
**Descripción:** Los demás cortes (trozos) sin deshuesar
**TEA (%):** 9
**Régimen:** Ninguno especificado
**Observaciones:** N/A






In [24]:
# Función para validar códigos arancelarios específicos
def validar_codigo_ncm(codigo_ncm, descripcion_producto):
    response = client.models.generate_content(
        model=MODEL_ID,
        contents=f"""
        Verifica en el Arancel Nacional de Uruguay si el código NCM {codigo_ncm} 
        es correcto para el producto: {descripcion_producto}
        
        Responde:
        1. ¿Es correcto el código? (SÍ/NO)
        2. Si es correcto: confirma tarifa y descripción oficial
        3. Si es incorrecto: proporciona el código correcto
        4. Justificación de la clasificación
        """,
        config=GenerateContentConfig(tools=[rag_retrieval_tool]),
    )
    return response

# Ejemplo de validación
codigo_test = "09011100"  # Ejemplo de código para café
producto_test = "Café verde en grano, sin tostar, sin descafeinar"

print("=== VALIDACIÓN DE CÓDIGO NCM ===")
print(f"Código: {codigo_test}")
print(f"Producto: {producto_test}")
print("-" * 40)

resultado_validacion = validar_codigo_ncm(codigo_test, producto_test)
display(Markdown(resultado_validacion.text))

=== VALIDACIÓN DE CÓDIGO NCM ===
Código: 09011100
Producto: Café verde en grano, sin tostar, sin descafeinar
----------------------------------------


1. SÍ
2. La descripción de la NCM 0901.11.10.00 es: Café sin tostar, sin descafeinar, en grano. La tarifa es 9 0 0 10.
3. No aplica
4. No aplica

### Generate Content with Llama3 using RAG Retrieval Tool

## 🔄 Generación de Descripciones Técnicas del Arancel

Esta función toma una descripción de producto en lenguaje coloquial y genera múltiples descripciones alternativas usando el lenguaje formal y técnico característico del arancel uruguayo. Esto mejora significativamente la precisión del RAG al crear un "puente" entre el lenguaje cotidiano y la terminología arancelaria oficial.

In [38]:
def generar_descripciones_arancel(descripcion_producto, modelo="gemini", num_alternativas=5):
    """
    Genera descripciones alternativas de un producto usando el lenguaje técnico 
    y formal característico del arancel uruguayo para mejorar la precisión del RAG.
    
    Args:
        descripcion_producto (str): Descripción del producto en lenguaje coloquial
        modelo (str): Modelo a usar ("gemini" o "llama")
        num_alternativas (int): Número de descripciones alternativas a generar
        
    Returns:
        list: Lista de descripciones técnicas alternativas
    """
    
    prompt = f"""
    Actúa como un experto en clasificación arancelaria uruguaya. Tu tarea es generar {num_alternativas} descripciones alternativas para el siguiente producto, usando el lenguaje técnico y formal característico del arancel nacional uruguayo.

    PRODUCTO A ANALIZAR: {descripcion_producto}

    INSTRUCCIONES:
    1. Genera {num_alternativas} descripciones técnicas diferentes del producto
    2. Usa terminología específica del arancel (materiales, procesos, usos, características técnicas)
    3. Incluye posibles sinónimos técnicos y variaciones terminológicas
    4. Considera diferentes aspectos: composición, función, uso industrial/comercial, método de fabricación
    5. Mantén el formato y estilo de las descripciones del arancel uruguayo
    6. No inventes códigos NCM, solo genera las descripciones

    EJEMPLOS DE LENGUAJE ARANCELARIO:
    - "Artículos de..." en lugar de "productos de..."
    - "Manufacturas de..." en lugar de "hechos de..."
    - "Aparatos y material para..." en lugar de "equipos para..."
    - "Preparaciones..." para productos procesados
    - Especificaciones técnicas como "con contenido de...", "de peso superior a...", etc.

    Formato de respuesta:
    1. [Primera descripción técnica]
    2. [Segunda descripción técnica]
    3. [Tercera descripción técnica]
    4. [Cuarta descripción técnica]
    5. [Quinta descripción técnica]

    Responde únicamente con las descripciones numeradas, sin explicaciones adicionales.
    """
    
    try:
        response = client.models.generate_content(
                model=MODEL_ID,
                contents=prompt
            )
        resultado = response.text
        
        # Procesar la respuesta para extraer las descripciones
        lineas = resultado.strip().split('\n')
        descripciones = []
        
        for linea in lineas:
            linea = linea.strip()
            if linea and (linea.startswith(tuple('12345')) or linea.startswith('-') or linea.startswith('•')):
                # Limpiar numeración y caracteres especiales
                descripcion_limpia = linea
                for i in range(1, 10):
                    descripcion_limpia = descripcion_limpia.replace(f"{i}. ", "").replace(f"{i}.", "")
                descripcion_limpia = descripcion_limpia.replace("- ", "").replace("• ", "").strip()
                
                if descripcion_limpia and len(descripcion_limpia) > 10:  # Filtrar descripciones muy cortas
                    descripciones.append(descripcion_limpia)
        
        # Si no se pudieron extraer descripciones del formato, usar el texto completo dividido
        if len(descripciones) < 2:
            parrafos = [p.strip() for p in resultado.split('\n') if p.strip() and len(p.strip()) > 20]
            descripciones = parrafos[:num_alternativas]
        
        # Asegurar que tenemos al menos algunas descripciones
        if not descripciones:
            descripciones = [resultado.strip()]
        
        return descripciones[:num_alternativas]
        
    except Exception as e:
        print(f"❌ Error al generar descripciones técnicas: {e}")
        return [descripcion_producto]  # Devolver la descripción original como fallback


def consultar_con_descripciones_mejoradas(descripcion_producto, modelo="gemini", usar_descripciones_tecnicas=True):
    """
    Consulta el arancel usando descripciones técnicas generadas automáticamente 
    para mejorar la precisión del RAG.
    
    Args:
        descripcion_producto (str): Descripción del producto en lenguaje coloquial
        modelo (str): Modelo a usar ("gemini" o "llama")
        usar_descripciones_tecnicas (bool): Si generar descripciones técnicas adicionales
        
    Returns:
        dict: Resultados de la consulta con descripciones técnicas
    """
    
    print(f"🔍 Consultando arancel para: '{descripcion_producto}'")
    print(f"🤖 Modelo seleccionado: {modelo}")
    
    # Generar descripciones técnicas si está habilitado
    descripciones_para_consultar = [descripcion_producto]
    
    if usar_descripciones_tecnicas:
        print("🔄 Generando descripciones técnicas alternativas...")
        descripciones_tecnicas = generar_descripciones_arancel(descripcion_producto, modelo, 3)
        descripciones_para_consultar.extend(descripciones_tecnicas)
        
        print("📝 Descripciones técnicas generadas:")
        for i, desc in enumerate(descripciones_tecnicas, 1):
            print(f"   {i}. {desc}")
        print()
    
    # Realizar consultas con todas las descripciones
    resultados = {}
    
    for i, descripcion in enumerate(descripciones_para_consultar):
        etiqueta = "Original" if i == 0 else f"Técnica {i}"
        print(f"🔍 Consultando con descripción {etiqueta}...")
        
        try:
            resultado = consultar_arancel_uruguay(descripcion)
            
            resultados[etiqueta] = {
                "descripcion_usada": descripcion,
                "resultado": resultado.text if hasattr(resultado, 'text') else str(resultado)
            }
            
        except Exception as e:
            print(f"❌ Error en consulta {etiqueta}: {e}")
            resultados[etiqueta] = {
                "descripcion_usada": descripcion,
                "resultado": f"Error: {e}"
            }
    
    return resultados

### 🧪 Ejemplos de Generación de Descripciones Técnicas

Demostraciones de cómo la función mejora la precisión del RAG transformando descripciones coloquiales en lenguaje técnico arancelario.

In [33]:
# Ejemplo 1: Generación de descripciones técnicas para un producto común
producto_ejemplo = "zapatillas deportivas"

print("🔄 Generando descripciones técnicas del arancel...")
print(f"📦 Producto original: '{producto_ejemplo}'")
print("=" * 60)

descripciones_tecnicas = generar_descripciones_arancel(producto_ejemplo, modelo="gemini", num_alternativas=4)

print("📝 Descripciones técnicas generadas:")
for i, descripcion in enumerate(descripciones_tecnicas, 1):
    print(f"\n{i}. {descripcion}")

print("\n" + "=" * 60)
print("✅ Las descripciones técnicas ayudan al RAG a encontrar clasificaciones más precisas en el arancel.")

🔄 Generando descripciones técnicas del arancel...
📦 Producto original: 'zapatillas deportivas'
📝 Descripciones técnicas generadas:

1. Calzado deportivo con suela de caucho o plástico y parte superior de materia textil, concebido para la práctica de actividades físicas, que comprende calzado para entrenamiento, atletismo, baloncesto, tenis y otros deportes, independientemente de su diseño o marca. Se excluyen las botas de esquí y el calzado con dispositivos especiales, tales como patines o cuchillas fijas.

2. Artículos de calzado para deportes, cuya parte superior esté confeccionada principalmente con cuero natural o regenerado, y la suela sea de caucho vulcanizado, adherido o cosido a la parte superior. Considerar las variaciones en el diseño y la presencia de elementos de refuerzo o protección, tales como taloneras o punteras.

3. Manufacturas de calzado, diseñadas para el soporte y protección del pie durante la actividad deportiva, incluyendo calzado para uso recreativo o profesion

In [34]:
# Ejemplo 2: Consulta completa con descripciones técnicas mejoradas
producto_test_mejorado = "cámara digital"

print("🚀 CONSULTA CON DESCRIPCIONES TÉCNICAS MEJORADAS")
print("=" * 70)

# Realizar consulta con descripciones técnicas automáticas
resultados_mejorados = consultar_con_descripciones_mejoradas(
    producto_test_mejorado, 
    modelo="gemini", 
    usar_descripciones_tecnicas=True
)

print("\n📊 RESULTADOS COMPARATIVOS:")
print("=" * 70)

for etiqueta, datos in resultados_mejorados.items():
    print(f"\n🔹 {etiqueta.upper()}:")
    print(f"   📝 Descripción: {datos['descripcion_usada']}")
    print(f"   🎯 Resultado: {datos['resultado'][:200]}...")
    print("-" * 50)

🚀 CONSULTA CON DESCRIPCIONES TÉCNICAS MEJORADAS
🔍 Consultando arancel para: 'cámara digital'
🤖 Modelo seleccionado: gemini
🔄 Generando descripciones técnicas alternativas...
📝 Descripciones técnicas generadas:
   1. Aparatos fotográficos digitales, de imagen fija, con dispositivo visor electrónico incorporado, capaces de grabar video, incluso con función de almacenamiento interno o externo, para uso doméstico o profesional, con lente objetivo intercambiable o no, excluidas las cámaras cinematográficas.
   2. Cámaras fotográficas digitales, comprendidas entre las cámaras de imagen fija, que emplean un sensor electrónico (CCD o CMOS) para la captación de imágenes, con capacidad de visualización inmediata en pantalla LCD o OLED, provistas o no de flash incorporado, incluso aquellas con funciones adicionales de grabación de audio y/o video digital, y con interfaz de comunicación para transferencia de datos a dispositivos externos.
   3. Artículos electrónicos de consumo, constituidos por a

In [None]:
# Ejemplo 3: Comparación directa - Consulta simple vs. Consulta con descripciones técnicas
producto_comparacion = "Smartphone con pantalla táctil"

print("🆚 COMPARACIÓN: CONSULTA SIMPLE vs. CONSULTA MEJORADA")
print("=" * 80)

# Consulta simple (tradicional)
print("1️⃣ CONSULTA SIMPLE (método tradicional):")
print("-" * 50)
try:
    resultado_simple = consultar_arancel_uruguay(producto_comparacion)
    print(f"📱 Producto: {producto_comparacion}")
    print(f"🎯 Resultado: {resultado_simple.text[:300]}...")
except Exception as e:
    print(f"❌ Error en consulta simple: {e}")

print("\n" + "=" * 80)

# Consulta mejorada con descripciones técnicas
print("2️⃣ CONSULTA MEJORADA (con descripciones técnicas):")
print("-" * 50)
try:
    resultados_tecnicos = consultar_con_descripciones_mejoradas(
        producto_comparacion, 
        modelo="gemini", 
        usar_descripciones_tecnicas=True
    )

    for etiqueta, datos in resultados_tecnicos.items():
        print(f"\n🔹 {etiqueta.upper()}:")
        print(f"   📝 Descripción: {datos['descripcion_usada']}")
        print(f"   🎯 Resultado: {datos['resultado'][:200]}...")
        print("-" * 50)
    
    
except Exception as e:
    print(f"❌ Error en consulta mejorada: {e}")


🆚 COMPARACIÓN: CONSULTA SIMPLE vs. CONSULTA MEJORADA
1️⃣ CONSULTA SIMPLE (método tradicional):
--------------------------------------------------
📱 Producto: Smartphone con pantalla táctil
🎯 Resultado: No puedo proporcionar la clasificación arancelaria para un smartphone con pantalla táctil. Los documentos proporcionados no contienen información sobre ese producto.
...

2️⃣ CONSULTA MEJORADA (con descripciones técnicas):
--------------------------------------------------
🔍 Consultando arancel para: 'Smartphone con pantalla táctil'
🤖 Modelo seleccionado: gemini
🔄 Generando descripciones técnicas alternativas...
📱 Producto: Smartphone con pantalla táctil
🎯 Resultado: No puedo proporcionar la clasificación arancelaria para un smartphone con pantalla táctil. Los documentos proporcionados no contienen información sobre ese producto.
...

2️⃣ CONSULTA MEJORADA (con descripciones técnicas):
--------------------------------------------------
🔍 Consultando arancel para: 'Smartphone con pantalla

### 🎯 Función Utilitaria Final - Flujo Completo de Clasificación

Función todo-en-uno que combina generación de descripciones técnicas, consulta RAG mejorada, y validación de códigos NCM.

In [None]:
def clasificar_producto_completo(descripcion_producto, modelo_preferido="gemini", validar_codigo=True):
    """
    Función completa que realiza todo el flujo de clasificación arancelaria:
    1. Genera descripciones técnicas alternativas
    2. Consulta el RAG con múltiples descripciones
    3. Extrae y valida códigos NCM encontrados
    4. Proporciona recomendaciones finales
    
    Args:
        descripcion_producto (str): Descripción del producto a clasificar
        modelo_preferido (str): Modelo preferido ("gemini" o "llama")
        validar_codigo (bool): Si validar códigos NCM encontrados
        
    Returns:
        dict: Reporte completo de clasificación
    """
    
    print("🎯 SISTEMA COMPLETO DE CLASIFICACIÓN ARANCELARIA")
    print("=" * 80)
    print(f"📦 Producto a clasificar: '{descripcion_producto}'")
    print(f"🤖 Modelo preferido: {modelo_preferido}")
    print("=" * 80)
    
    reporte = {
        "producto_original": descripcion_producto,
        "modelo_usado": modelo_preferido,
        "descripciones_tecnicas": [],
        "resultados_consultas": {},
        "codigos_encontrados": [],
        "validaciones": {},
        "recomendacion_final": ""
    }
    
    try:
        # Paso 1: Generar descripciones técnicas
        print("\n🔄 PASO 1: Generando descripciones técnicas...")
        descripciones_tecnicas = generar_descripciones_arancel(
            descripcion_producto, modelo_preferido, 3
        )
        reporte["descripciones_tecnicas"] = descripciones_tecnicas
        
        print("✅ Descripciones técnicas generadas:")
        for i, desc in enumerate(descripciones_tecnicas, 1):
            print(f"   {i}. {desc[:80]}...")
        
        # Paso 2: Realizar consultas mejoradas
        print("\n🔍 PASO 2: Consultando arancel con descripciones mejoradas...")
        resultados = consultar_con_descripciones_mejoradas(
            descripcion_producto, modelo_preferido, True
        )
        reporte["resultados_consultas"] = resultados
        
        # Paso 3: Extraer códigos NCM de las respuestas
        print("\n🔢 PASO 3: Extrayendo códigos NCM...")
        import re
        codigos_encontrados = set()
        
        for etiqueta, datos in resultados.items():
            texto_resultado = datos["resultado"]
            # Buscar patrones de códigos NCM (8 dígitos, a veces con puntos)
            patrones_ncm = re.findall(r'\b\d{4}\.?\d{2}\.?\d{2}\b', texto_resultado)
            codigos_encontrados.update(patrones_ncm)
        
        reporte["codigos_encontrados"] = list(codigos_encontrados)
        
        if codigos_encontrados:
            print(f"✅ Códigos NCM encontrados: {', '.join(codigos_encontrados)}")
        else:
            print("⚠️  No se encontraron códigos NCM específicos en las respuestas")
        
        # Paso 4: Validar códigos si está habilitado
        if validar_codigo and codigos_encontrados:
            print("\n✔️  PASO 4: Validando códigos NCM...")
            for codigo in list(codigos_encontrados)[:3]:  # Validar máximo 3 códigos
                try:
                    resultado_validacion = validar_codigo_ncm(codigo, modelo_preferido)
                    reporte["validaciones"][codigo] = resultado_validacion.text if hasattr(resultado_validacion, 'text') else str(resultado_validacion)
                    print(f"   ✅ Código {codigo}: Validado")
                except Exception as e:
                    print(f"   ❌ Error validando {codigo}: {e}")
                    reporte["validaciones"][codigo] = f"Error: {e}"
        
        # Paso 5: Generar recomendación final
        print("\n📋 PASO 5: Generando recomendación final...")
        
        if codigos_encontrados:
            recomendacion = f"""
            RECOMENDACIÓN DE CLASIFICACIÓN:
            
            📦 Producto: {descripcion_producto}
            🔢 Códigos NCM sugeridos: {', '.join(list(codigos_encontrados)[:3])}
            🤖 Análisis realizado con: {modelo_preferido}
            ✅ Descripciones técnicas generadas: {len(descripciones_tecnicas)}
            
            Se recomienda verificar los códigos sugeridos con el arancel oficial 
            y considerar las características específicas del producto.
            """
        else:
            recomendacion = f"""
            ANÁLISIS COMPLETADO:
            
            📦 Producto: {descripcion_producto}
            ⚠️  No se identificaron códigos NCM específicos
            🤖 Análisis realizado con: {modelo_preferido}
            ✅ Descripciones técnicas generadas: {len(descripciones_tecnicas)}
            
            Se recomienda revisar manualmente las consultas generadas 
            o proporcionar una descripción más específica del producto.
            """
        
        reporte["recomendacion_final"] = recomendacion
        print(recomendacion)
        
        print("\n" + "=" * 80)
        print("🎉 CLASIFICACIÓN COMPLETA FINALIZADA")
        print("=" * 80)
        
        return reporte
        
    except Exception as e:
        error_msg = f"❌ Error en el proceso de clasificación: {e}"
        print(error_msg)
        reporte["error"] = error_msg
        return reporte


# Función de demostración con productos de ejemplo
def demo_clasificacion_completa():
    """Demuestra el sistema completo con varios productos de ejemplo"""
    
    productos_demo = [
        "tablet con pantalla táctil",
        "zapatos de cuero para hombre", 
        "aceite de oliva extra virgen"
    ]
    
    print("🚀 DEMOSTRACIÓN DEL SISTEMA COMPLETO DE CLASIFICACIÓN")
    print("=" * 90)
    
    for i, producto in enumerate(productos_demo, 1):
        print(f"\n🎯 DEMO {i}/3:")
        print("-" * 60)
        
        reporte = clasificar_producto_completo(producto, "gemini", True)
        
        print(f"\n📊 RESUMEN DEMO {i}:")
        print(f"   ✅ Descripciones técnicas: {len(reporte.get('descripciones_tecnicas', []))}")
        print(f"   ✅ Consultas realizadas: {len(reporte.get('resultados_consultas', {}))}")
        print(f"   ✅ Códigos encontrados: {len(reporte.get('codigos_encontrados', []))}")
        
        if i < len(productos_demo):
            print("\n" + "⏭️ " * 20)
    
    print(f"\n🎉 DEMOSTRACIÓN COMPLETA FINALIZADA")
    print("=" * 90)

## 📚 Guía de Uso - Nuevas Funcionalidades

### 🆕 Funciones Añadidas para Mejorar la Precisión del RAG

**1. `generar_descripciones_arancel(descripcion_producto, modelo, num_alternativas)`**
- Convierte descripciones coloquiales en lenguaje técnico del arancel
- Genera múltiples variaciones terminológicas
- Mejora significativamente la precisión del RAG

**2. `consultar_con_descripciones_mejoradas(descripcion_producto, modelo, usar_descripciones_tecnicas)`**
- Realiza consultas usando tanto la descripción original como las técnicas generadas
- Compara resultados entre diferentes enfoques
- Proporciona mayor cobertura de clasificación

**3. `clasificar_producto_completo(descripcion_producto, modelo_preferido, validar_codigo)`**
- Flujo completo end-to-end de clasificación arancelaria
- Integra generación de descripciones, consulta RAG, extracción y validación de códigos NCM
- Genera reporte completo con recomendaciones

### 🎯 Ejemplos de Uso Rápido

```python
# Uso básico - generar descripciones técnicas
descripciones = generar_descripciones_arancel("smartphone", "gemini", 3)

# Consulta mejorada con descripciones técnicas
resultados = consultar_con_descripciones_mejoradas("cámara digital", "gemini", True)

# Flujo completo de clasificación
reporte = clasificar_producto_completo("zapatillas deportivas", "gemini", True)

# Demostración con múltiples productos
demo_clasificacion_completa()
```

### 🚀 Beneficios de las Mejoras

- **Mayor Precisión**: Las descripciones técnicas mejoran la coincidencia con el lenguaje del arancel
- **Mejor Cobertura**: Múltiples consultas capturan diferentes aspectos del producto
- **Automatización**: Proceso completo automatizado de principio a fin
- **Flexibilidad**: Compatible con Gemini y Llama3/modelos alternativos
- **Validación**: Incluye verificación automática de códigos NCM encontrados

¡El sistema está listo para uso en producción con clasificación arancelaria mejorada! 🎉

In [32]:
from vertexai import generative_models

# Load tool into Llama model
rag_retrieval_tool = generative_models.Tool.from_retrieval(
    retrieval=rag.Retrieval(
        source=rag.VertexRagStore(
            rag_resources=[rag.RagResource(rag_corpus=rag_corpus.name)],
            rag_retrieval_config=rag.RagRetrievalConfig(
                top_k=10,  # Optional
                filter=rag.Filter(
                    vector_distance_threshold=0.5,  # Optional
                ),
            ),
        ),
    )
)

llama_model = generative_models.GenerativeModel(
    # your self-deployed endpoint for Llama3
    "projects/{project}/locations/{location}/endpoints/{endpoint_resource_id}",
    tools=[rag_retrieval_tool],
)

In [33]:
response = llama_model.generate_content("What is RAG?")

display(Markdown(response.text))

ValueError: Unsupported region for Vertex AI, select from frozenset({'europe-central2', 'us-central1', 'us-east1', 'southamerica-west1', 'us-south1', 'europe-west2', 'europe-west8', 'africa-south1', 'southamerica-east1', 'us-east7', 'us-east5', 'asia-south1', 'asia-south2', 'europe-west12', 'australia-southeast2', 'us-west3', 'me-central2', 'australia-southeast1', 'asia-northeast1', 'us-west4', 'northamerica-northeast2', 'asia-east1', 'me-west1', 'europe-north1', 'asia-east2', 'asia-northeast3', 'northamerica-northeast1', 'asia-southeast2', 'me-central1', 'us-west2', 'europe-west4', 'europe-west1', 'us-west1', 'asia-northeast2', 'asia-southeast1', 'europe-west6', 'europe-west9', 'europe-southwest1', 'us-east4', 'europe-west3', 'global'})