# **Procesamiento de Lenguaje Natural**

## Maestría en Inteligencia Artificial Aplicada
#### Tecnológico de Monterrey
#### Prof Luis Eduardo Falcón Morales

### **Adtividad en Equipos: sistema LLM + RAG**

* **Nombres y matrículas:**

* 🧑‍💻 Ovidio Alejandro Hernández Ruano (A01796714)
* 🧑‍💻 José Manuel Toral Cruz (A01122243)
* 🧑‍💻 Oscar Enrique García García (A01016093)
* 🧑‍💻 Luis Gerardo Sanchez Salazar (A01232963)

* **Número de Equipo:**
* Equipo #20


* ##### **El formato de este cuaderno de Jupyter es libre, pero debe incuir al menos las siguientes secciones:**

  * ##### **Introducción de la problemática a resolver.**
  * ##### **Sistema RAG + LLM**
  * ##### **El chatbot, incluyendo ejemplos de prueba.**
  * ##### **Conclusiones**

* ##### **Pueden importar los paquetes o librerías que requieran.**

* ##### **Pueden incluir las celdas y líneas de código que deseen.**

# **Introducción de la problemática a resolver.**

## 💡 Ansiedad y depresión: Falta de acceso inmediato, confiable y seguro a información

**La ansiedad y la depresión** son dos de los transtornos de salud mental más comunes a nivel mundial, afectando a millones de personas de todas las edades. A pesar de su prevalencia, muchas personas no cuentan con acceso oportuno a información clara, comprensible y basada en evidencia que les permita entender sus síntomas, buscar ayuda o simplemente sentirse acompañadas en su proceso.

Factores como la estigma social, la desinformación, las barreras económicas, la escasez de profesionales en salud mental y largos tiempos de espera para recibir atención dificultan quee quienes sufren de estos trastornos obtengan orientación adecuada. Además, en entornos digitales sobrecargados de contenido, es frecuente encontrar información errónea, poco útil o incluso perjudicial.

En este contexto, se propone el desarrollo de un **chatbot** especializado en ansiedad y depresión, que brinde respuestas confiables, empáticas y accesibles. Este asistente digital tiene como objetivo reducir la brecha de información, orientar a las personas hacia recursos apropiados y contribuir al bienestar emocional desde un enfoque preventivo y educativo.

Para el desarrollo del chatbot, se usará Retrieval-Augmented Generation (**RAG**) en combinación de modelos de lenguaje de gran escala (**LLM**), generando así una solución efectiva, principalmente por las siguientes razones:

* ✅ **Actualización y precisión sobre el contenido:** RAG permite que el modelo no genere respuestas aleatorias basadas en su entrenamiento previo, sino que consulte una base documental curada como guías clínicas, material psicoeducativo validado, publicaciones científicas, o preguntas frecuentes verificadas, reduciendo el riesgo de respuestas incorrectas o no fundamentadas, lo cual es crucial al tratar temas sensibles como la salud mental.

* ✅ **Actualización dinámica y adaptabilidad**: A diferencia de un LLM puro, que no puede aprender nueva información tras su entrenamiento, un sistema RAG puede actualizar fácilmente su corpus de conocimiento sin necesidad de reentrenamiento. Así, el chatbot puede mantenerse actualizado con las últimas recomendaciones clínicas, normativas locales o recursos disponibles (como líneas de ayuda o centros de atención comunitarios) o incluso, diagnósticos, conversaciones, o historiales clínicos del paciente para una experiencia más personalizada.

* ✅ **Respuestas contextuales, empáticas y comprensibles**: El LLM permite que las respuestas se generen en lenguaje natural, adaptadas al tono del usuario, con un estilo conversacional empático y accesible. Esto ayuda a que las personas se sientan comprendidas y no juzgadas, y que la información se transmita con claridad y calidez.

* ✅ **Escalabilidad y disponibilidad**: Al ser una solución automatizada, el chatbot puede estar disponible 24/7, sin importar la zona horaria ni la demanda, lo que permite llegar a más personas en momentos de urgencia o duda. Esto lo convierte en una herramienta valiosa en comunidades con recursos limitados.

* ✅ **Privacidad y anonimato**: Muchos usuarios prefieren explorar sus dudas sobre salud mental de forma anónima, sin tener que hablar cara a cara con un profesional desde el inicio. Un chatbot con estas características ofrece un espacio seguro, privado y no intrusivo donde dar los primeros pasos hacia el autocuidado o la búsqueda de ayuda.

Combinar RAG + LLM para desarrollar un chatbot sobre ansiedad y depresión no solo mejora la calidad y seguridad de las respuestas, sino que además ofrece una solución técnica ética, escalable y centrada en el bienestar del usuario. Esta herramienta no pretende reemplazar el acompañamiento profesional, sino funcionar como una guía accesible, informada y confiable que ayude a reducir barreras, brindar contención y facilitar el acceso a recursos de salud mental adecuados.

A continuación se presenta una propuesta desarrollada con **fines exclusivamente educativos**. Por ello, las respuestas generadas deben ser interpretadas como orientaciones generales y no deben considerarse asesoramiento médico, diagnóstico clínico ni sustituto de atención profesional. Se recomienda que los usuarios consulten a especialistas en salud mental ante cualquier duda o situación que requiera intervención profesional.

# **Paquetes y librerías**

## 🔍 Procesamiento de Lenguaje Natural (NLP)
* **📚 transformers:**  Biblioteca de modelos preentrenados desarrollada por Hugging Face. Permite usar modelos de NLP como BERT, GPT, T5, etc., para tareas como clasificación, resumen, traducción, y más.

* **🧠 sentence-transformers:** Extensión sobre transformers enfocada en generar representaciones vectoriales (embeddings) de oraciones y párrafos. Ideal para tareas como búsqueda semántica, comparación de textos y clustering.

* **📊 datasets:** Colección de datasets estandarizados de Hugging Face para NLP. Simplifica la carga, preprocesamiento y uso de datos para entrenamiento y evaluación de modelos.

## 📦 Vectorización y Búsqueda Semántica
* **🧭 faiss-cpu:** Biblioteca de búsqueda eficiente de vectores desarrollada por Facebook AI. Se usa para encontrar rápidamente los elementos más cercanos en grandes conjuntos de embeddings.

## 🖼️ Interfaz de Usuario / Aplicaciones Web
* **🧪 gradio:**
 Herramienta para crear interfaces web rápidas y simples para modelos de machine learning. Ideal para prototipar y compartir modelos con inputs y outputs interactivos (texto, audio, imagen, etc.).

## 📄 Lectura de Documentos PDF
* **📄 PyMuPDF:** Biblioteca para leer, extraer texto y trabajar con archivos PDF y otros documentos. Muy útil para convertir PDFs a texto para análisis posterior.

In [13]:
# Incluyan a continuación todas las celdas (de código o texto) que deseen...
!pip install transformers
!pip install sentence-transformers
!pip install faiss-cpu
!pip install gradio
!pip install datasets
!pip install PyMuPDF



## 🧱 Utilidades del Sistema y Datos

* **📂 os:** Módulo estándar de Python para interactuar con el sistema operativo. Se usa para operaciones como navegar entre carpetas, crear directorios o manipular archivos.

* **📦 pickle:** Biblioteca estándar de Python para serializar y deserializar objetos. Útil para guardar modelos, datos procesados o estructuras en archivos binarios para reutilización.

* **🔢 numpy:** Paquete fundamental para computación numérica en Python. Permite manejar arrays y realizar operaciones matemáticas eficientes a nivel de matriz.

* **🌎 IPython.display:** Importamos las funciones `display` y `HTML` para desplegar contenido enriquecido como HTML dentro de celdas de Google Colab.

* **🔡 re:** Módulo de expresiones regulares en Python. Se usa para buscar, reemplazar o dividir texto mediante patrones definidos.

## 📄 Procesamiento de Documentos PDF

* **📄 fitz (PyMuPDF):** Interfaz principal de la biblioteca PyMuPDF. Permite abrir, leer y extraer texto o imágenes de archivos PDF y otros documentos.

## 📦 Búsqueda Semántica

* **🧭 faiss:** Biblioteca de Facebook AI para búsqueda rápida de vectores en grandes volúmenes de datos. Se usa para tareas de similitud semántica y recuperación de información basada en embeddings.

## 🔍 Procesamiento de Lenguaje Natural (NLP)

* **🧠 sentence-transformers:** Biblioteca que permite generar embeddings semánticos de textos. Generalmente utilizada para tareas como clustering, recuperación semántica y comparación de oraciones.

* **🧬 transformers (AutoTokenizer, AutoModelForSeq2SeqLM, pipeline):** Componentes clave de la librería Hugging Face Transformers:
  - **AutoTokenizer:** Convierte texto a tokens entendibles por modelos.
  - **AutoModelForSeq2SeqLM:** Carga modelos preentrenados para tareas de secuencia a secuencia.
  - **pipeline:** Interfaz simplificada para aplicar tareas comunes con modelos preentrenados.

* **🗣️ nltk & sent_tokenize:** `nltk` es una biblioteca para procesamiento de lenguaje natural. En este caso, se utiliza para **tokenizar texto en oraciones** mediante `sent_tokenize`, útil para dividir grandes textos en unidades más manejables.

## 📐 Normalización de Vectores

* **📐 normalize:** Se utiliza para escalar vectores de forma que tengan una norma unitaria. Es esencial para calcular similitudes de forma coherente entre vectores.

In [14]:
import os
import fitz
import faiss
import pickle
import numpy as np
import re
import nltk
nltk.download("punkt")
nltk.download('punkt_tab')
from nltk.tokenize import sent_tokenize
from IPython.display import display, HTML
from sentence_transformers import SentenceTransformer
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM, pipeline
from sklearn.preprocessing import normalize

[nltk_data] Downloading package punkt to /root/nltk_data...
[nltk_data]   Package punkt is already up-to-date!
[nltk_data] Downloading package punkt_tab to /root/nltk_data...
[nltk_data]   Package punkt_tab is already up-to-date!


## 📂 Archivos PDF y sus descripciones

A continuación se enlistan los archivos a utilizar para el chatbot, junto con su tema principal y una berve descripción de su conrtenido.

**1. empatia_comunicacion.pdf**
* Tema: Empatía en la comunicación
* Descripción: Describe el concepto de empatía desde el punto de vista cognitivo y emocional, destacando la importancia de las neuronas espejo y cómo la empatía mejora la calidad de la comunicación interpersonal. Incluye técnicas como la escucha activa, actitud de apertura y rechazo de prejuicios


**2. primeras-paginas-lo-mejor-de-tu-vida-es.pdf**
* Tema: Autoestima y confianza personal
* Descripción: Fragmento del libro de Ma. Jesús Álava Reyes. Enfatiza la importancia de confiar en uno mismo para alcanzar la felicidad. Incluye reflexiones, testimonios y capítulos orientados al desarrollo de la autoconfianza y la superación del sufrimiento emocional


**3. Guia de Primeros Auxilios Psicológicos_Integra.pdf**
* Tema: Primeros Auxilios Psicológicos (PAP)
* Descripción: Guía orientada a personas en movilidad humana. Explica qué es una crisis psicológica, cómo se manifiesta, tipos de intervención, principios del PAP, y autocuidado del personal interviniente. Incluye técnicas como escucha empática, estabilización y contención emocional


**4. depresion.pdf**
* Tema: Depresión
* Descripción: Documento del National Institute of Mental Health. Define la depresión, sus síntomas, causas, tipos (mayor, distimia, estacional, posparto, etc.), diagnóstico y tratamientos (psicoterapia, medicamentos, terapia de estimulación cerebral)


**5. Abre-tu-mente-modo-positivo-salud-mental.pdf**
* Tema: Promoción de salud mental en jóvenes
* Descripción: Guía educativa dirigida a docentes y familias. Aborda temas como salud mental, adolescencia, estilo de vida saludable, relaciones sociales, emociones, inteligencia emocional y prevención de problemas de salud mental.


**6. AtencionPrimAmb1988_spa.pdf**
* Tema: Atención Primaria Ambiental (APA)
* Descripción: Publicación de la OPS que presenta el concepto de APA. Ofrece un enfoque holístico para mejorar el ambiente y la salud pública. Incluye marco conceptual, principios, problemas ambientales locales, participación ciudadana y organización de centros APA


**7. 9789243548203_spa.pdf**
* Tema: Primera Ayuda Psicológica (OMS)
* Descripción: Guía práctica para trabajadores de campo en situaciones de emergencia. Define PAP, principios de acción (observar, escuchar, conectar), cómo ayudar de forma responsable y cómo cuidarse como interviniente. Incluye ejercicios y casos simulados


**8. empatia.pdf**
* Tema: Empatía y neurociencia
* Descripción: Presentación sobre empatía desde una perspectiva emocional, cognitiva y neurocientífica.


**9. Guiasautoayudadepresionansiedad.pdf**
* Tema: Autoayuda para depresión y ansiedad
* Descripción: Conjunto de guías del Servicio Andaluz de Salud. Contienen información y actividades sobre depresión, ansiedad, duelo, autoestima, control de pensamientos, técnicas de relajación, afrontamiento del estrés, etcértera.

## 📁 Creación de Carpeta y Descarga Condicional de Archivos

Este bloque de código verifica si existe una carpeta llamada `pdf` en el entorno (`/content/pdf`) y realiza las siguientes acciones:

* 🗂️ **Crea la carpeta si no existe**, asegurando el espacio necesario para almacenar los archivos PDF.
* 🔍 **Verifica si la carpeta está vacía**:
  - Si está vacía, **descarga los archivos desde una carpeta pública en Google Drive** usando `gdown`.
  - Si ya contiene archivos, **omite la descarga** para evitar redundancias.

In [15]:
# Crear la carpeta "pdf" si es que no existe
folder_path = "/content/pdf"
if not os.path.exists(folder_path):
    os.makedirs(folder_path)
    print(f"✅ Carpeta creada: {folder_path}")
else:
    print(f"📁 La carpeta ya existe: {folder_path}")

# Revisar si la carpeta está vacía y descargar los archivos de la misma. Si no, saltar descarga.
if not os.listdir(folder_path):
    print("📥 La carpeta está vacía. Iniciando descarga de contenidos...")
    folder_url = "https://drive.google.com/drive/folders/1WxKzp5YHdhS4hf47zFUScL9FHpRSaexE?usp=sharing"
    !gdown --folder {folder_url} -O {folder_path}
else:
    print("✅ La carpeta ya tiene contenidos. Se omite la descarga.")

📁 La carpeta ya existe: /content/pdf
✅ La carpeta ya tiene contenidos. Se omite la descarga.


## 📄 Extracción y Visualización de Contenido de Archivos PDF

Este bloque realiza la lectura, procesamiento y previsualización del contenido de archivos PDF utilizando PyMuPDF (`fitz`):

* **📥 `extract_text_from_pdf(file_path)`**  
  Función que **abre un archivo PDF y concatena el texto de todas sus páginas** en un solo string, utilizando `fitz` para extraer el texto página por página.

* **📂 Procesamiento de archivos PDF**  
  Recorre todos los archivos dentro de la carpeta `/content/pdf`, aplica la función anterior y guarda los resultados en un diccionario `pdf_texts` con la estructura `{nombre_archivo: texto_extraído}`.

* **👀 Previsualización de contenido**  
  Por cada archivo procesado, **muestra los primeros 100 caracteres del contenido extraído**, lo cual permite verificar rápidamente si la extracción fue exitosa y si el contenido es legible.

In [16]:
# Función para extraer y concatenar el texto de todas las páginas de un archivo PDF usando PyMuPDF (fitz)
def extract_text_from_pdf(file_path):
    doc = fitz.open(file_path)
    text = ""
    for page in doc:
        text += page.get_text()
    return text

# Procesar todos los archivos PDF subidos
pdf_texts = {}
for filename in os.listdir(folder_path):
      file_path = os.path.join(folder_path, filename)
      text = extract_text_from_pdf(file_path)
      pdf_texts[filename] = text

# Mostrar los primeros 1000 caracteres de un archivo
for name, content in pdf_texts.items():
    print(f">>> Desplegando previzualización del contenido del archivo 📚[{name}]:\n")
    print(content[:100])
    print("=" * 80)

>>> Desplegando previzualización del contenido del archivo 📚[Abre-tu-mente-modo-positivo-salud-mental.pdf]:

1
GUÍA PARA
DOCENTES Y FAMILIAS
PROMOCIÓN DE SALUD
MENTAL EN JÓVENES
PROMOCIÓN DE SALUD MENTAL EN JÓ
>>> Desplegando previzualización del contenido del archivo 📚[Guiasautoayudadepresionansiedad.pdf]:

PARA LA DEPRESIÓN Y LOS TRASTORNOS DE ANSIEDAD
PARA LA DEPRESIÓN Y LOS TRASTORNOS DE ANSIEDAD
Servic
>>> Desplegando previzualización del contenido del archivo 📚[empatia.pdf]:

EMPATÍA
EL ARTE DE COMPRENDER EMOCIONES
EMPATÍA
EL ARTE DE COMPRENDER EMOCIONES
3
 Mahatma G a n d h
>>> Desplegando previzualización del contenido del archivo 📚[depresion.pdf]:

Depresión 
 
¿Qué es la depresión?
Todas las personas se sienten tristes o decaídas de vez en cuando
>>> Desplegando previzualización del contenido del archivo 📚[9789243548203_spa.pdf]:

Primera ayuda psicológica:  Guía para trabajadores de 
campo
Catalogación por la Biblioteca de la OM
>>> Desplegando previzualización del contenido

## 🧠 Carga de Modelo de Embeddings Multilingüe

📦 A continuación se carga un modelo preentrenado de la librería `sentence-transformers`, específicamente el modelo **`paraphrase-multilingual-MiniLM-L12-v2`**, el cual genera embeddings (representaciones vectoriales) de frases o textos.

### ✅ Razones para usar este modelo:
* 🌍 **Multilingüe:** Soporta más de 50 idiomas, ideal para trabajar con datos en distintos idiomas sin necesidad de traducir.
* ⚡ **Ligero y rápido:** Basado en la arquitectura MiniLM, lo que permite un buen equilibrio entre rendimiento y velocidad, incluso sin GPU.
* 🔍 **Precisión en similitud semántica:** Entrenado para tareas como detección de paráfrasis y búsqueda semántica, lo que lo hace muy útil para clustering, recuperación de texto y comparación de oraciones.

In [17]:
# Cargando modelo preentrenado
model_sentence = SentenceTransformer("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")

## ✂️ División Semántica de Texto por Oraciones

Esta función divide un texto en fragmentos **respetando los límites de tokens y las fronteras semánticas de las oraciones**, usando `sent_tokenize()` de NLTK.

### ⚙️ ¿Cómo funciona?
* 🧠 Divide el texto en oraciones individuales.
* 📦 Agrupa las oraciones en bloques cuya **longitud no supere `max_tokens` (por defecto 25 palabras)**.
* 🔁 Aplica **solapamiento configurable (`overlap`)** entre bloques, preservando coherencia contextual entre fragmentos.
* ✅ Devuelve una lista de bloques listos para análisis semántico, embeddings o respuestas de chatbot.

In [18]:
# CHUNKING SEMANTICO CON NLTK
# Función para dividir el texto en fragmentos (oraciones)
def split_text_semantic(text, max_tokens=25, overlap=1):
    sentences = sent_tokenize(text)
    chunks = []
    current_chunk = []
    current_len = 0
    for sentence in sentences:
        token_count = len(sentence.split())
        if current_len + token_count > max_tokens:
            chunks.append(" ".join(current_chunk))
            current_chunk = current_chunk[-overlap:] if overlap > 0 else []
            current_len = sum(len(s.split()) for s in current_chunk)
        current_chunk.append(sentence)
        current_len += token_count

    if current_chunk:
        chunks.append(" ".join(current_chunk))

    return chunks

# Función para dividir el texto en fragmentos (chunks) - NOT USED
def split_text(text, chunk_size=500, overlap=50): ##chunk_size=5000, overlap=50)
    chunks = []
    for i in range(0, len(text), chunk_size - overlap):
        chunks.append(text[i:i + chunk_size])
    return chunks

## 🧠 Fragmentación, Vectorización y Creación del Índice Semántico

* **Fragmenta textos PDF, genera sus embeddings y construye un índice FAISS para habilitar búsquedas semánticas en un chatbot.**

### ⚙️ ¿Cómo funciona?

* 🧩 **Fragmentación semántica de documentos**  
  Recorre los textos extraídos de los PDFs y los divide en fragmentos utilizando `split_text_semantic`, que respeta los límites de oración y evita cortes arbitrarios. Luego, cada fragmento se guarda junto con su metadato correspondiente (nombre del archivo y contenido del fragmento).

* 🧬 **Generación y normalización de embeddings**  
  Los fragmentos generados se convierten en vectores semánticos (embeddings) mediante un modelo de `sentence-transformers`. A continuación, se normalizan para que todos tengan norma unitaria, lo cual es necesario para aplicar similitud coseno correctamente.

* 🧭 **Construcción del índice FAISS**  
  Se crea un índice FAISS utilizando `IndexFlatIP`, diseñado para trabajar con similitud coseno entre vectores normalizados. Luego se agregan todos los embeddings al índice para habilitar búsquedas rápidas y precisas.

Este flujo pemrite que el chatbot pueda realizar búsquedas semánticas inteligentes y responder preguntas con base en el contenido de múltiples documentos PDF.


In [19]:
# Recorrer todos los archivos PDF, divide su contenido en fragmentos,
# y guarda tanto los textos como los metadatos (nombre del archivo y texto del fragmento)
all_chunks = []
metadata = []
for filename, text in pdf_texts.items():
    #chunks = split_text(text)
    chunks = split_text_semantic(text)
    all_chunks.extend(chunks)
    metadata.extend([{"source": filename, "text": chunk} for chunk in chunks])

# Crear embeddings
embeddings = model_sentence.encode(all_chunks, show_progress_bar=True)
embeddings = normalize(embeddings, axis=1)  # normalizar para usar cosine similarity (IndexFlatIP)

# Crear índice FAISS
dimension = embeddings.shape[1]
#index = faiss.IndexFlatL2(dimension)
index = faiss.IndexFlatIP(dimension) # Se usa IndexFlatIP oara cosine similatiry
index.add(np.array(embeddings))

Batches:   0%|          | 0/208 [00:00<?, ?it/s]

## 💾 Guardado del Índice y Metadatos

* **Guarda el índice FAISS y los metadatos para reutilizarlos sin reprocesar los documentos.**

### ⚙️ ¿Cómo funciona?

* 🧭 **Guardar el índice FAISS**  
  Se almacena el índice generado en un archivo `.faiss`, lo que permite reutilizarlo en futuras sesiones sin tener que volver a generar todos los embeddings y reconstruir el índice desde cero.

* 🗂️ **Guardar los metadatos**  
  Los metadatos (información del fragmento y su documento de origen) se guardan en un archivo `.pkl` usando `pickle`. Esto es esencial para que, al recuperar un fragmento desde el índice, el chatbot pueda identificar de qué archivo proviene y mostrarlo correctamente.

In [20]:
# Guardar FAISS index
faiss.write_index(index, "chatbot_index.faiss")

# Guardar los metadatos
with open("chatbot_metadata.pkl", "wb") as f:
    pickle.dump(metadata, f)

# **Sistema RAG + LLM**

Un sistema **RAG** (Retrieval-Augmented Generation) es una arquitectura de inteligencia artificial que combina recuperación de información con generación de texto, con el objetivo de mejorar la precisión, relevancia y actualidad de las respuestas generadas por modelos de lenguaje.

## 🧠 Modelos LLM y de Embeddings

* **Carga un modelo de lenguaje para generación de respuestas y un modelo de embeddings para comprensión semántica.**

### ⚙️ ¿Cómo funciona?

* 💬 **Modelo generador de respuestas (LLM)**  
  Se carga el modelo `google/flan-t5-base`, un modelo de tipo encoder-decoder optimizado para tareas text-to-text.  
  A través de `AutoTokenizer` y `AutoModelForSeq2SeqLM` de `transformers`, se inicializa el modelo junto con su tokenizador, y se configura un `pipeline` de generación de texto (`text2text-generation`).  
  Este modelo permite al chatbot **redactar respuestas completas en lenguaje natural** a partir de consultas y contextos.

* 🧩 **Modelo de embeddings semánticos**  
  Se carga el modelo `paraphrase-multilingual-MiniLM-L12-v2` de `sentence-transformers`, el cual convierte oraciones o fragmentos de texto en vectores numéricos.  
  Estos vectores permiten comparar significados y buscar respuestas relevantes dentro del índice FAISS.


In [21]:
# LLM para generar respuestas
model_name = "google/flan-t5-base"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
generator = pipeline("text2text-generation", model=model, tokenizer=tokenizer)

# Modelo para embeddings (vectorización)
embedder = SentenceTransformer("sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2")

Device set to use cuda:0


## 🧠 Búsqueda Semántica y Generación de Respuestas

* **Estas funciones permiten buscar fragmentos relevantes mediante similitud semántica y generar respuestas con un modelo LLM.**

### ⚙️ ¿Cómo funciona?

* 🔎 **`search_similar_chunks( )`**  
  Genera un embedding para la consulta del usuario y lo compara contra el índice FAISS para encontrar los fragmentos más relevantes.  
  Si no se encuentra ningún resultado con una similitud suficiente (basada en el `threshold`), retorna `None`.  
  Si hay coincidencias, devuelve los textos correspondientes desde los metadatos.

* 🧩 **`build_prompt( )`**  
  Construye un mensaje (prompt) combinando los fragmentos de contexto recuperados con la pregunta del usuario.  
  Este prompt es lo que se le entrega al modelo generador para que forme una respuesta informada y contextualizada.

* 💬 **`generate_answer( )`**  
  Orquesta el flujo completo: busca los fragmentos más parecidos a la consulta, genera el prompt y produce una respuesta con el modelo `flan-t5-base`.  
  Si no se encuentran fragmentos relevantes, devuelve un mensaje de disculpa.

* 💾 **Carga del índice y metadatos**  
  Se cargan el índice FAISS (`chatbot_index.faiss`) y los metadatos (`chatbot_metadata.pkl`) previamente guardados, para que el sistema esté listo para responder sin tener que reentrenar o reprocesar documentos.

In [22]:
def build_prompt(query, context_chunks):
    context = "\n".join(context_chunks)
    prompt = (
        f"Con este contexto:\n"
        f"{context}\n\n"
        f"Responde brevemente:\n"
        f"{query}"
    )
    return prompt

def search_similar_chunks(query, top_k=3, threshold=0.3):
    query_embedding = embedder.encode([query])
    query_embedding = normalize(query_embedding, axis=1) #Normalizar los embeddings
    distances, indices = index.search(query_embedding, top_k)
    if max(distances[0] < threshold):
      return None

    results = []
    for i in indices[0]:
        results.append(metadata[i]['text'])
    return results

def generate_answer(query, top_k=3):
    chunks = search_similar_chunks(query, top_k=top_k)
    if chunks is None:
      return "Lo siento, no encontré información suficiente para responder a eso."
    prompt = build_prompt(query, chunks)

    output = generator(prompt, max_new_tokens=256, do_sample=False)
    return output[0]['generated_text']

# Cargar índice
index = faiss.read_index("chatbot_index.faiss")

# Cargar metadatos
with open("chatbot_metadata.pkl", "rb") as f:
    metadata = pickle.load(f)

# **El chatbot, incluyendo ejemplos de prueba.**

## 🤖 Prueba de Consultas al Chatbot

* **Evalúa una lista de preguntas simuladas y muestra las respuestas generadas.**

### ⚙️ ¿Cómo funciona?

* 🧾 **Lista de preguntas (`queries`)**  
  Contiene ejemplos representativos de preguntas que un usuario podría hacerle al chatbot, relacionadas con ansiedad, depresión y emociones humanas.

* 🔄 **Bucle de interacción con el chatbot**  
  Para cada pregunta:
  - Se imprime la consulta.
  - Se llama a `generate_answer()` para obtener una respuesta contextual.
  - La respuesta se imprime.

Este bloque permite probar y validar cómo responde el sistema a distintas consultas, ideal para demostraciones, testing o debugging del chatbot.


In [23]:
queries = [
    "Cómo superar la ansiedad?",
    "Qué es ansiedad?",
    "Cuando es grave la ansiedad?",
    "Cuales son los sintomas de la ansiedad",
    "Qué hacer si estoy triste?",
    "Qué es una depresión?",
    "¿Cúales son las causas de la depresión?",
    "Quieres ser mi amigo?",
    "Que es un iPhone?"
           ]

for query in queries:
  print(f"="*60)
  print(f">> 👨🏻‍💻 Pregunta realizada:\n{query}\n")
  respuesta = generate_answer(query)
  print("++ 💻 Respuesta del chatbot:")
  print(respuesta)

>> 👨🏻‍💻 Pregunta realizada:
Cómo superar la ansiedad?

++ 💻 Respuesta del chatbot:
• Controle su preocupación. Escoja un lugar y una hora para preocuparse. • Los sntomas de ansiedad originales pueden volver. Considere otras formas de hacer frente a sus sntomas. For example, aprenda a relajarse. Cambiar los comportamientos relacionados con la ansiedad • Trate de reconocer cuando está evitando cosas. • Siempre que se puede tratar de hacer frente a estostemores, no todos a la vez pero siempre gradual. Responde briefly:
>> 👨🏻‍💻 Pregunta realizada:
Qué es ansiedad?

++ 💻 Respuesta del chatbot:
Para la ansiedad Los sntomas de la ansiedad incluyen: agitación, tensión, irritabilidad, palpitaciones, temblores, sudoración, preocuparse en exceso, dormir mal, falta de concentración, respiración rapida, sensación de “pellizco en el estómago” y tensión muscular
>> 👨🏻‍💻 Pregunta realizada:
Cuando es grave la ansiedad?

++ 💻 Respuesta del chatbot:
• Graves and desagradables. • Duran mucho tiempo. • Oc

## 🖼️ Despliegue de Interfaz Interactiva con Gradio

* **Por último, se crea una interfaz web simple para interactuar con el chatbot directamente desde el navegador.**

### ⚙️ ¿Cómo funciona?

* 🔌 **`chat_interface(question)`**  
  Define una función que toma una pregunta como entrada, genera una respuesta utilizando `generate_answer()`, y la retorna. Esta será la función que conecta la interfaz con la lógica del chatbot.

* 🧪 **`gr.Interface(...)`**  
  Utiliza la librería `Gradio` para crear una interfaz gráfica mínima:
  - `inputs="text"` permite al usuario ingresar una pregunta en una caja de texto.
  - `outputs="text"` muestra la respuesta generada.
  - `launch(share=True)` despliega la interfaz y genera un enlace público para compartirla fácilmente.

  ### Captura de interfaz con Gradio:
  <img src="https://drive.google.com/uc?id=1cyyi2xpzoqWzWiK4OQVcgSx9eUTEwXwx" width="1200">

In [24]:
import gradio as gr
def chat_interface(question):
    answer = generate_answer(question)
    return answer
gr.Interface(fn=chat_interface, inputs="text", outputs="text").launch(share=True)

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://7b1c0885a6dfdd66d2.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)





# **Conclusiones:**

* #### **Conclusiones de la actividad chatbot LLM + RAG:**

**Aprendizajes generales**
- Como equipo, logramos implementar un enfoque de Retrieval-Augmented Generation que permitió combinar la potencia de los modelos generativos con la precisión del sistema de recuperación documental mediante FAISS. Esto demostró ser útil para responder preguntas específicas del dominio de salud mental, generando respuestas contextualizadas y coherentes.

- Al utilizar corpus en español y modelos preentrenados compatibles con el idioma, se buscó la adecuación lingüística del chatbot para usuarios hispanohablantes. Este enfoque nos confirma la importancia de adaptar los modelos LLM a las necesidades culturales y lingüísticas de los usuarios.

- El prototipo desarrollado tiene potencial para convertirse en una herramienta de apoyo accesible para personas en búsqueda de información confiable y actualizada relacionada con salud mental.

- Se comprendió la arquitectura RAG como una solución que combina lo mejor del acceso a información (retrieval) con la generación fluida de lenguaje natural (LLM).

- Se identificó que los modelos LLM por sí solos pueden llegar a tener límites si no están conectados a una base de conocimiento actualizada o contextual.

- El enfoque RAG permitió ofrecer respuestas más precisas, relevantes y trazables, especialmente útil en temas delicados como salud mental.


**Técnicas y Herramientas Implementadas**

- Se utilizaron embeddings semánticos para representar texto y permitir búsquedas por similitud en lugar de coincidencia exacta de palabras clave.

- Se trabajó con herramientas como FAISS para construir índices de recuperación eficientes.

- Se aplicó un umbral de similitud para filtrar respuestas no relacionadas, mejorando la precisión del chatbot.

- Se integró el sistema en una interfaz interactiva mediante Gradio, facilitando la interacción con el usuario final.

- Se reafirmó la importancia del preprocesamiento del texto, incluyendo limpieza, normalización y tokenización.

- Se emplearon modelos preentrenados de HuggingFace Transformers para tareas de generación de texto, en busca de coherencia y naturalidad.

- Se comprobó que los LLM pueden ampliar, matizar o contextualizar mejor la información cuando se utilizan junto con RAG.

- Se logró generar respuestas basadas en fuentes específicas.

- Se apreciaron los beneficos de que es un enfoque modular y escalable, permitiendo incorporar nuevos documentos sin necesidad de reentrenar el modelo.

**Retos y Reflexiones**

- Se observan oportunidades en las respuestas, ya que hay errores en cuanto a formato, mezcla de idiomas e incluso omisión de caracteres. Esto pudiera mejorarse ya sea agregando instrucciones al promppt, hacer un proceso de limpieza más extensivo o aplicar filtros de idioma.

- Se identificó que definir un umbral de similitud adecuado es clave para evitar respuestas irrelevantes.

- Se observó que la curación del corpus (selección y fragmentación del contenido) tiene un impacto directo en la calidad del chatbot.

- Se concluyó que este enfoque puede adaptarse a otros dominios como educación, derecho, atención médica o servicio al cliente.

- Se reconoció que la estructura RAG es multilingüe y adaptable, facilitando su implementación en diversos contextos.

- Se evidenció el potencial para escalar esta tecnología hacia sistemas más complejos como tutores virtuales, asistentes personales o motores de búsqueda especializados.

# **Fin de la actividad chatbot: LLM + RAG**