<a href="https://colab.research.google.com/github/Chekosworld/Aitopia/blob/main/Taller_Pr%C3%A1ctico_Construyendo_un_Agente_con_IA_Generativa.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Taller Práctico: Construyendo un Agente con IA Generativa.

## 1. Introducción

En este taller, exploraremos el fascinante mundo de los agentes y cómo la inteligencia artificial generativa puede ser utilizada para crear experiencias de usuario únicas y significativas.

**¿Qué aprenderemos?:**

*   Introducción a los chatbots y la IA generativa.
*   Conceptos básicos sobre GPT-2, Sentence Transformers y FAISS.
*   Desarrollo de un chatbot paso a paso.

## 2. Preparación del Entorno

En esta sección, prepararemos nuestro entorno de desarrollo instalando las bibliotecas necesarias y importando los módulos que utilizaremos a lo largo del taller.

In [1]:
# Instalar dependencias necesarias
!pip install transformers==4.35.2 faiss-cpu==1.7.4 sentence-transformers==2.2.2 gradio==4.12.0
!pip install --upgrade huggingface_hub==0.21.0



In [2]:
# Importar librerías necesarias
from transformers import GPT2LMHeadModel, GPT2Tokenizer
import faiss
import numpy as np
import gradio as gr
from sentence_transformers import SentenceTransformer

  _torch_pytree._register_pytree_node(
  _torch_pytree._register_pytree_node(
  _torch_pytree._register_pytree_node(


## 3. Construyendo el Chatbot: Base y Funcionalidades
En esta sección, crearemos la funcionalidad básica del chatbot utilizando el modelo preentrenado GPT-2. Cargaremos el modelo y su tokenizador, que son fundamentales para la generación de texto.



In [3]:
# Cargar el modelo preentrenado de GPT-2
model = GPT2LMHeadModel.from_pretrained("gpt2")
tokenizer = GPT2Tokenizer.from_pretrained("gpt2")

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json:   0%|          | 0.00/665 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/548M [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/124 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/26.0 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/1.04M [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/456k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.36M [00:00<?, ?B/s]

### Función Básica del Chatbot
Definiremos una función que utilizará GPT-2 para generar respuestas a preguntas.

In [4]:
# Función básica para generar respuestas
def chatbot(query):
    input_text = f"Pregunta: {query}\nRespuesta:"
    inputs = tokenizer.encode(input_text, return_tensors="pt")
    output = model.generate(inputs, max_length=100, num_return_sequences=1, pad_token_id=tokenizer.eos_token_id)
    return tokenizer.decode(output[0], skip_special_tokens=True)

## 4. Implementando Búsqueda Semántica con Sentence Transformers y FAISS

En esta sección, mejoraremos nuestro chatbot utilizando Sentence Transformers para la generación de embeddings y FAISS para la búsqueda semántica.
Cargamos el modelo Sentence Transformer para obtener embeddings de texto.

In [5]:
# Cargar modelo SentenceTransformer para embeddings
sentence_model = SentenceTransformer('paraphrase-MiniLM-L6-v2')

.gitattributes:   0%|          | 0.00/744 [00:00<?, ?B/s]

1_Pooling/config.json:   0%|          | 0.00/190 [00:00<?, ?B/s]

README.md:   0%|          | 0.00/3.73k [00:00<?, ?B/s]

config.json:   0%|          | 0.00/629 [00:00<?, ?B/s]

config_sentence_transformers.json:   0%|          | 0.00/122 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/90.9M [00:00<?, ?B/s]

model.onnx:   0%|          | 0.00/90.4M [00:00<?, ?B/s]

model_O1.onnx:   0%|          | 0.00/90.4M [00:00<?, ?B/s]

model_O2.onnx:   0%|          | 0.00/90.3M [00:00<?, ?B/s]

model_O3.onnx:   0%|          | 0.00/90.3M [00:00<?, ?B/s]

model_O4.onnx:   0%|          | 0.00/45.2M [00:00<?, ?B/s]

model_qint8_arm64.onnx:   0%|          | 0.00/23.0M [00:00<?, ?B/s]

model_qint8_avx512.onnx:   0%|          | 0.00/23.0M [00:00<?, ?B/s]

model_qint8_avx512_vnni.onnx:   0%|          | 0.00/23.0M [00:00<?, ?B/s]

model_quint8_avx2.onnx:   0%|          | 0.00/23.0M [00:00<?, ?B/s]

openvino_model.bin:   0%|          | 0.00/90.3M [00:00<?, ?B/s]

openvino/openvino_model.xml:   0%|          | 0.00/211k [00:00<?, ?B/s]

openvino_model_qint8_quantized.bin:   0%|          | 0.00/22.9M [00:00<?, ?B/s]

(…)nvino/openvino_model_qint8_quantized.xml:   0%|          | 0.00/368k [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/90.9M [00:00<?, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/53.0 [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/466k [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/314 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/232k [00:00<?, ?B/s]

modules.json:   0%|          | 0.00/229 [00:00<?, ?B/s]

  _torch_pytree._register_pytree_node(


### Generar Embeddings
Generaremos embeddings para un conjunto de preguntas frecuentes.

In [6]:
# Generar embeddings para preguntas frecuentes
corpus = ["¿Qué es la inteligencia artificial generativa?", "¿Cuáles son los tipos de agentes de IA?", "¿Qué applicaciones tienen los agentes en los negocios?"]
embeddings = sentence_model.encode(corpus)

### Crear Índice FAISS
Crearemos un índice FAISS para realizar búsquedas eficientes.

In [7]:
# Crear un índice FAISS para búsqueda rápida
index = faiss.IndexFlatL2(embeddings.shape[1])
index.add(np.array(embeddings).astype('float32'))

### Función de Búsqueda
Definiremos una función para buscar respuestas relevantes basadas en la similitud semántica.

In [8]:
# Función para buscar respuestas relevantes usando FAISS
def search_answer(query):
    query_embedding = sentence_model.encode([query]).astype('float32')
    distances, indices = index.search(query_embedding, k=1)
    return corpus[indices[0][0]]

## 5. Interfaz de Usuario con Gradio

En esta sección, integraremos nuestro chatbot con Gradio para crear una interfaz de usuario interactiva.

In [9]:
# Crear la interfaz de Gradio para interactuar con el chatbot
def gradio_chatbot(query):
    context = search_answer(query)
    return chatbot(f"Contexto: {context} \n Pregunta: {query}")

### Lanzar la Interfaz
Lanzaremos la interfaz interactiva para interactuar con el chatbot.

In [10]:
# Lanzar la interfaz interactiva
gr.Interface(fn=gradio_chatbot, inputs="text", outputs="text", live=True).launch()

IMPORTANT: You are using gradio version 4.12.0, however version 4.44.1 is available, please upgrade.
--------
Setting queue=True in a Colab notebook requires sharing enabled. Setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
Running on public URL: https://4e7d0c2291fc7eb2a1.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from Terminal to deploy to Spaces (https://huggingface.co/spaces)




## 7. Conclusiones y Próximos Pasos

**Resumen:**
Recapitularemos lo aprendido en el taller.

**Posibles mejoras y extensiones:**
Sugiero algunas ideas para mejorar el chatbot, como:
*   Incorporar más datos para mejorar la búsqueda semántica.
*   Ajustar los parámetros de GPT-2 para mejorar la generación de respuestas.

**Recursos adicionales**
