# **Procesamiento de Lenguaje Natural**

## Maestría en Inteligencia Artificial Aplicada
#### Tecnológico de Monterrey
#### Profesor Titular: Luis Eduardo Falcón Morales
#### Profesor Tutor: Rodolfo Miguel Gameros Leal

## Actividad Semana 9

### **9.2 Actividad: chatbot : RAG + LLM**

---
---

### **Equipo 18**
> ### 👩‍💻 **Iris Monserrat Urbina Casas**
> `A01795999`

> ### 👨‍💻 **Javier Augusto Rebull Saucedo**
> `A01795838`

> ### 👨‍💻 **Juan Carlos Pérez Nava**
> `A01795941`

>
> ### 👩‍💻 **Sihiní Trinidad Sánchez**
> `A00889358`




---
---

### **Estructura Requerida para el Notebook**

El formato es libre, pero debe incluir como mínimo las siguientes secciones:

1.  **Introducción:**
    * Describe la problemática a resolver y el objetivo del proyecto.

2.  **Sistema RAG + LLM:**
    * Muestra la implementación técnica: carga de datos, procesamiento, creación de la base de datos vectorial y configuración del LLM.

3.  **Chatbot y Pruebas:**
    * Presenta la interfaz del chatbot e incluye ejemplos de prueba (preguntas y respuestas) que demuestren su funcionamiento.

4.  **Conclusiones:**
    * Resume los resultados, desafíos, aprendizajes y posibles mejoras futuras.

---

**Requisitos Técnicos:**
* **Librerías:** Se pueden importar todos los paquetes que sean necesarios.
* **Celdas:** Se puede incluir cualquier cantidad de celdas de código y texto para desarrollar y explicar la solución.

---
---

## **Proyecto de Asistente Virtual: "Tu Aliado para Dejar de Fumar"**

### 🎯 1. La Problemática: El Tabaquismo y una Motivación Personal

El consumo de tabaco representa una de las mayores amenazas para la salud pública a nivel mundial. Según la Organización Mundial de la Salud (OMS, 2023), esta adicción es responsable de la muerte de más de 8 millones de personas cada año. Más allá de las estadísticas, el impacto del tabaquismo resuena a un nivel profundamente personal, afectando a familias y dejando secuelas emocionales y físicas irreparables.

Este proyecto nace de una motivación directa y personal que afecta a nuestro equipo. **Javier Rebull**, compañero de equipo, está viviendo de cerca las devastadoras consecuencias del tabaquismo. Su tía, hermana gemela idéntica de su madre, ha sido diagnosticada con un **enfisema pulmonar terminal**, y su pronóstico de vida es de apenas unos meses. La tragedia se convierte en un poderoso testimonio al observar a su madre, quien tomó la decisión de dejar de fumar hace 10 años. Hoy, su madre goza de una salud robusta y una vitalidad que contrasta dolorosamente con el estado de su hermana gemela. Esta diferencia tan marcada en dos personas genéticamente idénticas subraya de manera inequívoca los beneficios de abandonar el tabaco y nos inspira a crear una herramienta que pueda ofrecer el apoyo necesario para que otros tomen esa misma decisión vital.

### 🧠 2. Selección del Modelo de Lenguaje (LLM)

Para dar vida a nuestro asistente, hemos seleccionado el modelo **`mistralai/Mistral-7B-Instruct-v0.2`**. La elección de este LLM se fundamenta en varios puntos clave:
* **Rendimiento en Español:** Ha demostrado una comprensión y generación de texto en español de alta calidad, lo cual es crucial para nuestro público objetivo.
* **Capacidad de Seguir Instrucciones:** Al ser un modelo "Instruct", está afinado para seguir directrices complejas, lo que nos permite moldear su personalidad y el formato de sus respuestas con gran precisión.
* **Equilibrio entre Potencia y Eficiencia:** Con 7 mil millones de parámetros y la posibilidad de ser cuantizado, ofrece un rendimiento excelente sin requerir hardware de servidor de alta gama, haciéndolo ideal para su ejecución en entornos como Google Colab.

### 🔗 3. Implementación del Sistema RAG

Para asegurar que nuestro asistente ofrezca respuestas precisas, seguras y basadas en evidencia, hemos implementado una arquitectura de **Generación Aumentada por Recuperación (RAG)**. En lugar de depender únicamente del conocimiento interno del LLM (que puede ser general o desactualizado), el sistema RAG primero **recupera información relevante** de una base de datos de documentos curada y luego utiliza esa información como contexto para **generar la respuesta**. Esto mejora drásticamente la calidad, reduce las "alucinaciones" y garantiza que el consejo proporcionado esté alineado con fuentes confiables.

### 📚 4. Selección de Documentos Relevantes

La base de conocimiento de nuestro chatbot se ha construido a partir de una cuidadosa selección de **más de 30 documentos de alta calidad**, todos en español. Las fuentes incluyen:
* Guías clínicas de organizaciones de salud gubernamentales (CDC, Ministerio de Sanidad de España).
* Artículos científicos y de investigación sobre tabaquismo y salud mental.
* Libros de expertos reconocidos en el campo de la deshabituación tabáquica.
* Manuales de autoayuda y recursos de organizaciones no gubernamentales.

Esta selección garantiza que el asistente se base en información pertinente, actualizada y fiable para ofrecer el mejor apoyo posible.

### 💬 5. Interfaz del Chatbot (Gradio)

Para hacer que nuestro sistema sea accesible para cualquier persona, hemos desarrollado una **interfaz de usuario web simple e intuitiva utilizando la biblioteca Gradio**. La interfaz cuenta con un diseño claro, un título y descripción que explican su propósito, y una serie de preguntas de ejemplo para facilitar la interacción inicial. Esto permite que los usuarios se enfoquen en sus consultas sin necesidad de tener conocimientos técnicos.

### 📄 6. Informe de Funcionamiento Técnico

Para aquellos interesados en los detalles técnicos profundos del proyecto, incluyendo la arquitectura detallada, las decisiones de diseño, las pruebas de rendimiento y las limitaciones del sistema, se ha preparado un informe completo.

El informe puede ser consultado y descargado en el siguiente enlace:
[**Descargar Informe Técnico Completo**](https://www.pendiente.com) *(Enlace pendiente de actualización)*

---
#### **Referencia**
Organización Mundial de la Salud. (2023, 24 de julio). *Tabaco*. [https://www.who.int/es/news-room/fact-sheets/detail/tobacco](https://www.who.int/es/news-room/fact-sheets/detail/tobacco)


---
---

---
---

# ⚙️ Sistema RAG + LLM

# **Retrieval-Augmented Generation (RAG)**

Según fuentes expertas como **AWS (2025)** y el curso **"Generative AI in Action" de IBM (2025)**, RAG se define como:

> Un enfoque diseñado para mejorar la *precisión* y *actualidad* de los Modelos de Lenguaje Grandes (LLMs) al momento de generar respuestas. Su objetivo es conectar el poder de los LLMs con fuentes de información externas y verificables.

-----

### **¿Cómo Funciona RAG?**

El proceso de RAG incorpora un mecanismo de recuperación de información antes de la generación de texto, lo que permite que el modelo se base en datos específicos y actualizados. El flujo es el siguiente:

1.  **❓ Recepción de la Consulta:** El sistema recibe una pregunta o instrucción por parte del usuario.
2.  **🔎 Recuperación de Contexto:** Antes de responder, el sistema busca y recupera información relevante desde una fuente de datos externa (como una base de datos de documentos, la web o una API).
3.  **✍️ Generación Aumentada:** El modelo de lenguaje utiliza tanto la pregunta original como el contexto recuperado para formular una respuesta mucho más informada, precisa y basada en evidencia.

-----

### **Beneficios Clave de RAG**

Implementar esta arquitectura ofrece ventajas significativas:

  * ✅ **Mayor Precisión y Actualidad:** Evita que el modelo se base únicamente en su conocimiento interno (que puede ser obsoleto), permitiéndole usar información reciente y específica del dominio.
  * 🧠 **Reducción de "Alucinaciones":** Al anclar la respuesta a un contexto real, se minimiza drásticamente la tendencia del modelo a inventar datos o hechos incorrectos.
  * 🛡️ **Mayor Confiabilidad y Transparencia:** Permite que el sistema reconozca cuándo no tiene información suficiente para dar una respuesta fiable. Además, puede citar las fuentes utilizadas, aumentando la confianza del usuario.

-----

### ⚠️ **Consideraciones Importantes**

La efectividad de un sistema RAG depende directamente de la calidad de su componente de recuperación.

> Si la información recuperada es insuficiente, irrelevante o de baja calidad, el modelo podría no ser capaz de generar una respuesta correcta, incluso si la información existe en la fuente de datos. Por lo tanto, un sistema de búsqueda y recuperación eficiente es fundamental para el éxito.

-----

#### **Referencias**

  * **AWS.** (2025). *What is retrieval augmented generation?* Recuperado el 23 de junio de 2025 de: [https://aws.amazon.com/es/what-is/retrieval-augmented-generation/](https://aws.amazon.com/es/what-is/retrieval-augmented-generation/)

  * **IBM.** (2025). *Generative AI in Action*. IBM SkillsLab. Training Recuperado el 23 de junio de 2025 de: [https://www.ibm.com/academic/topic/artificial-intelligence?ach\_id=9217fca4-c36f-4e1d-ab87-da43469344a5](https://skillsbuild.org/college-students/course-catalog/generative-ai-in-action)

# 📦 Instalación de Librerías

In [1]:
# =============================================================================
# SECCIÓN 1: CORE DE APRENDIZAJE PROFUNDO (DEBE IR PRIMERO)
# Fundamentos para la ejecución y optimización de modelos de IA.
# =============================================================================

# PyTorch: El framework base para todos los cálculos de redes neuronales.
!pip install torch --quiet

# Transformers: Para descargar y utilizar modelos de lenguaje de Hugging Face.
!pip install transformers --quiet

# Accelerate: Utilidad de Hugging Face para ejecutar modelos grandes de forma eficiente en cualquier hardware (GPU, TPU, multi-GPU).
!pip install accelerate --quiet

# BitsAndBytes: Permite la "cuantización" de modelos, una técnica clave para cargar modelos enormes en GPUs con memoria limitada.
!pip install bitsandbytes --quiet

# =============================================================================
# SECCIÓN 2: FRAMEWORK DE ORQUESTACIÓN Y MANEJO DE DATOS (RAG)
# Herramientas para construir la lógica de la aplicación y manejar datos vectoriales.
# =============================================================================

# LangChain: El framework principal para conectar componentes y construir la lógica de la aplicación de IA.
!pip install langchain --quiet

# LangChain Community: Módulo con todas las integraciones de terceros para LangChain (modelos, bases de datos, APIs).
!pip install langchain-community --quiet

# --- ¡LÍNEA AÑADIDA! --- Esta es la librería que faltaba para HuggingFaceEmbeddings.
!pip install langchain-huggingface --quiet

# Sentence-Transformers: Librería optimizada para crear embeddings de alta calidad a partir de texto.
!pip install sentence-transformers --quiet

# FAISS (CPU): Base de datos vectorial de alta velocidad para buscar y recuperar los embeddings más relevantes.
!pip install faiss-cpu --quiet

# =============================================================================
# SECCIÓN 3: UTILIDADES (ENTRADA/SALIDA)
# Herramientas para la interacción con el usuario y la lectura de archivos.
# =============================================================================

# PyMuPDF: Una de las librerías más rápidas y eficientes para extraer texto e imágenes de documentos PDF.
!pip install PyMuPDF --quiet

# pypdf: Una alternativa popular y robusta para la manipulación de archivos PDF.
!pip install pypdf --quiet

# Gradio: Para crear de forma sencilla y rápida una interfaz de usuario web y poder interactuar con tu modelo.
!pip install gradio --quiet


print("─" * 50)
print("🤖🤝💻   Equipo Sihino   💻🤝🤖")
print("✅ 🔋  Librerías Instaladas  🔋 ✅")
print("─" * 50)

──────────────────────────────────────────────────
🤖🤝💻   Equipo Sihino   💻🤝🤖
✅ 🔋  Librerías Instaladas  🔋 ✅
──────────────────────────────────────────────────


---
---

# Librerias Clave de este Notebook

A continuación, se detallan las librerías y componentes clave utilizados en este proyecto, agrupados por su función principal dentro de la arquitectura RAG.

### 📚 Componentes para Retrieval-Augmented Generation (RAG)

Estas herramientas se encargan de la ingesta, procesamiento y recuperación de la información que alimentará al modelo.

* **`TextLoader`:** Utilidad de LangChain para cargar documentos de texto plano (`.txt`) desde el sistema de archivos.

* **`RecursiveCharacterTextSplitter`:** Algoritmo avanzado que divide documentos largos en fragmentos más pequeños (*chunks*), intentando mantener la coherencia semántica al separar por párrafos o saltos de línea.

* **`HuggingFaceEmbeddings`:** Convierte los fragmentos de texto en representaciones vectoriales numéricas (*embeddings*) utilizando potentes modelos de la comunidad de Hugging Face.

* **`FAISS (Facebook AI Similarity Search)`:** Un motor de búsqueda de alta eficiencia para índices de vectores. Permite encontrar los fragmentos de texto más relevantes para una consulta de manera casi instantánea.

---

### 🧠 Componentes para el Modelo de Lenguaje (LLM)

Este conjunto de librerías gestiona la carga, optimización y ejecución del modelo de lenguaje que genera las respuestas finales.

* **`AutoModelForCausalLM` y `AutoTokenizer`:** Clases de la librería `transformers` que permiten cargar casi cualquier modelo de lenguaje y su tokenizador correspondiente con una sola línea de código.

* **`BitsAndBytesConfig`:** Configuración para aplicar técnicas de cuantización, que optimizan el modelo para que consuma mucha menos memoria de GPU sin una pérdida significativa de rendimiento.

* **`pipeline`:** Una abstracción de alto nivel de `transformers` que simplifica enormemente el proceso de usar un modelo para una tarea específica, como la generación de texto.

* **`torch (PyTorch)`:** El framework de aprendizaje profundo fundamental que sirve como motor para la ejecución y el manejo de los tensores (datos) que utilizan los modelos de lenguaje.

---

### Referencias y Documentación Oficial

* **[LangChain](https://python.langchain.com/):** Framework para el desarrollo de aplicaciones impulsadas por modelos de lenguaje.
* **[Hugging Face Transformers](https://huggingface.co/docs/transformers/index):** La librería de referencia para acceder a miles de modelos pre-entrenados de última generación.
* **[PyTorch](https://pytorch.org/):** El framework de computación científica y aprendizaje profundo sobre el que se construyen la mayoría de estas herramientas.
* **[FAISS](https://faiss.ai/):** Librería de Meta AI para la búsqueda eficiente de similitud entre vectores.
* **[bitsandbytes](https://github.com/TimDettmers/bitsandbytes):** Librería clave para la cuantización de modelos en 8 y 4 bits.

In [2]:
# =============================================================================
# SECCIÓN 1: LIBRERÍAS ESTÁNDAR, DE SISTEMA Y VISUALIZACIÓN
# =============================================================================
import os                          # Para interactuar con el sistema operativo (rutas de archivos, etc.).
import re                          # Para trabajar con expresiones regulares (limpieza de texto).
from pathlib import Path           # Para manejar rutas de archivos de forma moderna y orientada a objetos.
import gdown                       # Para descargar archivos directamente desde Google Drive.
import fitz                        # El nombre de importación de PyMuPDF, para leer archivos PDF.
import torch                       # Framework principal de Deep Learning (PyTorch).
import gradio as gr                # Para construir la interfaz de usuario web interactiva.

# --- Herramientas de Visualización en el Notebook ---
from IPython.display import display, HTML # Para renderizar salidas enriquecidas (como tablas HTML) en Colab.
import textwrap  # Importa la librería para manipular y formatear bloques de texto.


# =============================================================================
# SECCIÓN 2: LIBRERÍAS DE HUGGING FACE Y TRANSFORMERS
# Para cargar el modelo de lenguaje, el tokenizador y gestionar la autenticación.
# =============================================================================
from huggingface_hub import login
from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig, pipeline

# --- ACCIÓN: Login a Hugging Face (Método Seguro) ---
# Importamos la herramienta de Colab para acceder a los "Secrets" guardados.
from google.colab import userdata

# Obtenemos el token guardado de forma segura y nos logueamos.
HF_TOKEN = userdata.get('HF_TOKEN')
if HF_TOKEN:
    login(token=HF_TOKEN)
else:
    print("⚠️  Advertencia: No se encontró el token de Hugging Face. El login ha sido omitido.")


# =============================================================================
# SECCIÓN 3: COMPONENTES DE LANGCHAIN
# Todas las piezas necesarias de LangChain para construir el sistema RAG.
# =============================================================================

# 3.1: Carga y División de Documentos (Document Processing)
from langchain.document_loaders import TextLoader
from langchain.text_splitter import CharacterTextSplitter, RecursiveCharacterTextSplitter

# 3.2: Creación de Embeddings y Base de Datos Vectorial (Vectorization & Storage)
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_community.vectorstores import FAISS

# 3.3: Modelo de Lenguaje, Prompts y Cadena Final (LLM & Chains)
from langchain_community.llms import HuggingFacePipeline
from langchain.prompts import PromptTemplate
from langchain.schema.runnable import RunnablePassthrough
from langchain.schema import StrOutputParser

# =============================================================================
# CONFIRMACIÓN DE CARGA
# =============================================================================
print("─" * 50)
print("🤖🤝💻   Equipo Sihino   💻🤝🤖")
print("✅ 🔋  Librerías Cargadas  🔋 ✅")
print("⚡️🚀 ¡Listos para la Acción! 🚀⚡️")
print("─" * 50)

──────────────────────────────────────────────────
🤖🤝💻   Equipo Sihino   💻🤝🤖
✅ 🔋  Librerías Cargadas  🔋 ✅
⚡️🚀 ¡Listos para la Acción! 🚀⚡️
──────────────────────────────────────────────────


---
---

### ⚙️ **Configuración Global del Sistema**

Esta celda actúa como el panel de control principal para todo nuestro proyecto. Aquí definimos todas las variables y parámetros clave en un solo lugar, lo que nos permite modificar fácilmente el comportamiento del sistema sin tener que buscar en todo el código.

**Componentes Clave a Configurar:**

  * **Selección de Modelos:** Especificamos qué modelos de Hugging Face se usarán para la creación de *embeddings* y para la generación de respuestas.
  * **Orígenes de Datos:** Indicamos dónde se encuentran nuestros documentos.
  * **Parámetros de Procesamiento:** Ajustamos cómo se dividirán los documentos en fragmentos (*chunks*).

La función al final de la celda imprimirá un resumen para verificar que todo se ha cargado correctamente.

#### **Referencias de los Modelos**

  * **Embedding Model:** [`sentence-transformers/all-MiniLM-L6-v2`](https://huggingface.co/sentence-transformers/all-MiniLM-L6-v2))

      * Un modelo de embeddings ligero y eficiente, optimizado para convertir texto en vectores numéricos de alta calidad para tareas de búsqueda semántica.

  * **Language Model (LLM):** [`mistralai/Mistral-7B-Instruct-v0.2`](https://huggingface.co/mistralai/Mistral-7B-Instruct-v0.2))

      * Un potente modelo de lenguaje de 7 mil millones de parámetros, afinado para seguir instrucciones. Es conocido por su excelente rendimiento en múltiples idiomas, incluyendo el español.

In [3]:
# =============================================================================
# CONFIGURACIÓN GLOBAL DEL SISTEMA RAG
# =============================================================================
# --- 1. Selección de Modelos ---
EMBEDDING_MODEL_NAME = "sentence-transformers/all-MiniLM-L6-v2"
LLM_MODEL_NAME = "mistralai/Mistral-7B-Instruct-v0.2"

# --- 2. Rutas y Orígenes de Datos ---
DIRECTORIO_DOCUMENTOS = 'datos_RAG_LLM'
ID_REPOSITORIO_GDRIVE = '1L_5UCoUzXNJQRPXXByE7u4YjlJ71wEYs' # ID de tu carpeta de Drive

# --- 3. Parámetros de Procesamiento de Texto (Chunking) ---
CHUNK_SIZE = 3000
CHUNK_OVERLAP = 500

# --- Función de Verificación ---
def mostrar_resumen_configuracion():
    VERDE, CIAN, RESET, BOLD = "\033[92m", "\033[96m", "\033[0m", "\033[1m"
    SEPARADOR = "=" * 70
    print(SEPARADOR)
    print(f"🚀 {BOLD}{VERDE}CONFIGURACIÓN DEL EQUIPO SIHINO CARGADA{RESET} 🚀")
    print(SEPARADOR)
    print(f"🧠 {BOLD}Modelos:{RESET}\n   - Embedding: {CIAN}{EMBEDDING_MODEL_NAME}{RESET}\n   - LLM: {CIAN}{LLM_MODEL_NAME}{RESET}")
    print(f"\n📁 {BOLD}Datos:{RESET}\n   - Directorio: {CIAN}{DIRECTORIO_DOCUMENTOS}{RESET}\n   - GDrive ID: {CIAN}{ID_REPOSITORIO_GDRIVE}{RESET}")
    print(f"\n⚙️  {BOLD}Chunking:{RESET}\n   - Tamaño: {CIAN}{CHUNK_SIZE}{RESET}\n   - Superposición: {CIAN}{CHUNK_OVERLAP}{RESET}")
    print("\n" + SEPARADOR)

mostrar_resumen_configuracion()

🚀 [1m[92mCONFIGURACIÓN DEL EQUIPO SIHINO CARGADA[0m 🚀
🧠 [1mModelos:[0m
   - Embedding: [96msentence-transformers/all-MiniLM-L6-v2[0m
   - LLM: [96mmistralai/Mistral-7B-Instruct-v0.2[0m

📁 [1mDatos:[0m
   - Directorio: [96mdatos_RAG_LLM[0m
   - GDrive ID: [96m1L_5UCoUzXNJQRPXXByE7u4YjlJ71wEYs[0m

⚙️  [1mChunking:[0m
   - Tamaño: [96m3000[0m
   - Superposición: [96m500[0m



# 🚭 Descarga de Documentos: Fumar y sus Efectos en la Salud

In [4]:
# =============================================================================
# DESCARGA DE DOCUMENTOS DESDE GOOGLE DRIVE
# -----------------------------------------------------------------------------
# Este bloque utiliza el ID de la carpeta de Drive para descargar todos
# los archivos que contiene en un directorio local de Colab.
# =============================================================================

# --- 2. Proceso de Descarga ---

print(f"📥 Iniciando la descarga desde Google Drive...")
print(f"   - ID de la carpeta: {ID_REPOSITORIO_GDRIVE}")
print(f"   - Directorio de destino: '{DIRECTORIO_DOCUMENTOS}'")

# Usamos gdown para descargar el contenido de la carpeta en nuestro directorio local.
# 'quiet=False' nos mostrará el progreso de la descarga.
# 'output' especifica dónde guardar los archivos.
gdown.download_folder(id=ID_REPOSITORIO_GDRIVE, output=DIRECTORIO_DOCUMENTOS, quiet=False)

print(f"\n✅ ¡Descarga completada con éxito!")


# --- 3. Verificación (Opcional pero recomendado) ---

# Listamos los archivos en el directorio para confirmar que todo está en su lugar.
print("\n📄 Contenido de la carpeta local:")
try:
    archivos_descargados = os.listdir(DIRECTORIO_DOCUMENTOS)
    if not archivos_descargados:
        print("   -> La carpeta está vacía. Revisa los permisos de la carpeta en Google Drive.")
    else:
        for filename in archivos_descargados:
            print(f"   - {filename}")
except FileNotFoundError:
    print(f"   -> ¡Error! No se encontró el directorio '{DIRECTORIO_DOCUMENTOS}'.")

📥 Iniciando la descarga desde Google Drive...
   - ID de la carpeta: 1L_5UCoUzXNJQRPXXByE7u4YjlJ71wEYs
   - Directorio de destino: 'datos_RAG_LLM'


Retrieving folder contents


Processing file 1qtF7I7rO8lJREVYvnjlBPcoNrsAahWDs 0000000584cnt-2017-05_manual-autoayuda-dejar-de-fumar.pdf
Processing file 1mn_xzxihGPvmVskXtK_X9fZ61ACRM_Ky 0717-7348-rcher-33-03-0186.pdf
Processing file 1nsy03tgluF4YaIArersMj0QoH3ngTJ7g 0717-9227-rchnp-56-03-0147.pdf
Processing file 1QZSv_aXnfJDx4jRmTlRlFVd_lZE8MjEx 1130-5274-clinsa-31-3-0137.pdf
Processing file 154EJRnfCLhbkQSRPaHoBtxK0yr0AXaDg 2020-consumer-guide-spanish-508.pdf
Processing file 1t07t7kq-EGw67zuAhdAtJadi8lIgiAPy 2436.pdf
Processing file 1aHfgaDAjOM6yM7SHyIercL9XDDSqpMXy 180618320005.pdf
Processing file 1f7VYzZVFi4Fn7gzGcvTrkWKyEPNkt-07 9789275321805_spa.pdf
Processing file 1JBWKhqxKK-M2tlYxl0nGjgqSeYRqDAec art03.pdf
Processing file 172Atqry-5pRJ2uYDL_93BSTPTkbPjM2e Cómo dejar de fumar ¡definitivamente! y prevenir otras -- - Eduardo Hernández -- 2a ed_, México, Mexico, 2013 -- Editorial Trillas, S_A_ de C_V.pdf
Processing file 1QF0tkZ3yepwfefzyPQMg_5cA0RvBFG1J Consigue dejar de fumar con el Doctor Fum- Utiliza el 

Retrieving folder contents completed
Building directory structure
Building directory structure completed
Downloading...
From: https://drive.google.com/uc?id=1qtF7I7rO8lJREVYvnjlBPcoNrsAahWDs
To: /content/datos_RAG_LLM/0000000584cnt-2017-05_manual-autoayuda-dejar-de-fumar.pdf
100%|██████████| 11.2M/11.2M [00:00<00:00, 24.9MB/s]
Downloading...
From: https://drive.google.com/uc?id=1mn_xzxihGPvmVskXtK_X9fZ61ACRM_Ky
To: /content/datos_RAG_LLM/0717-7348-rcher-33-03-0186.pdf
100%|██████████| 267k/267k [00:00<00:00, 109MB/s]
Downloading...
From: https://drive.google.com/uc?id=1nsy03tgluF4YaIArersMj0QoH3ngTJ7g
To: /content/datos_RAG_LLM/0717-9227-rchnp-56-03-0147.pdf
100%|██████████| 102k/102k [00:00<00:00, 46.8MB/s]
Downloading...
From: https://drive.google.com/uc?id=1QZSv_aXnfJDx4jRmTlRlFVd_lZE8MjEx
To: /content/datos_RAG_LLM/1130-5274-clinsa-31-3-0137.pdf
100%|██████████| 259k/259k [00:00<00:00, 101MB/s]
Downloading...
From: https://drive.google.com/uc?id=154EJRnfCLhbkQSRPaHoBtxK0yr0AXaDg
To


✅ ¡Descarga completada con éxito!

📄 Contenido de la carpeta local:
   - Dejar de fumar con FUMABOOK- el fin de una adicción- DEJAR -- Alles, P_M_ -- 2019.txt
   - 2436.pdf
   - 2020-consumer-guide-spanish-508.txt
   - 0717-7348-rcher-33-03-0186.txt
   - 1130-5274-clinsa-31-3-0137.pdf
   - Journey_to_Quit Spanish.pdf
   - Guia Clinica Para Ayudar A Los Fumadores A Dejar De Fumar -- Becoa Iglesias Elisardo.txt
   - GUIA_DEJAR_DE_FUMAR.pdf
   - guiaTabaco.txt
   - 1130-5274-clinsa-31-3-0137.txt
   - Reporte de investigación National Institute on Drug Abuse.txt
   - LA CONSTANCIA QUE ME PARIÓ- El libro ideal para los hombres -- ANTONIO SERRANO PÉREZ -- 2022 --.txt
   - Consigue dejar de fumar con el Doctor Fum- Utiliza el método -- Dr_ Alberto Seoane [Seoane, Dr_ Alberto] -- Cuerpo y Salud, Place of publication not.pdf
   - 9789275321805_spa.pdf
   - El Metodo Rowshan Para Dejar De Fumar- Stop Smoking- La -- Arthur Rowshan; Maria del Carmen Bellver -- 1a ed, Barcelona, ©2006 -- Plan


Download completed


---
---

# 📊 Visualizador de Documentos Cargados

In [5]:
# =============================================================================
# EJECUCIÓN: VISUALIZADOR DE DOCUMENTOS PDF
# -----------------------------------------------------------------------------
# Este bloque genera la tabla HTML para mostrar los archivos PDF encontrados.
# Se asume que las librerías necesarias ya han sido importadas.
# =============================================================================

# --- 1. Apuntar al Directorio Correcto ---

# Usamos la variable global que contiene la ruta a nuestros documentos.
DIRECTORIO_DOCUMENTOS = 'datos_RAG_LLM'
print(f"🔎 Escaneando la carpeta: '{DIRECTORIO_DOCUMENTOS}' en busca de archivos PDF...")

# --- 2. Lógica de Búsqueda y Creación de HTML ---

# Convertimos nuestra ruta de texto a un objeto Path para poder trabajar con él.
pdf_folder = Path(DIRECTORIO_DOCUMENTOS)

# Verificamos si la carpeta existe y, si es así, buscamos archivos .pdf
if os.path.exists(pdf_folder):
    pdf_files = sorted(pdf_folder.glob("*.pdf"))
else:
    pdf_files = [] # Si la carpeta no existe, la lista de archivos estará vacía.

# Plantilla de estilos CSS para el diseño premium.
html_template = """
<style>
    .dark-table-container {{
        background: linear-gradient(145deg, #1e1e2e, #2d2d44);
        border-radius: 20px;
        padding: 30px;
        margin: 20px auto;
        max-width: 700px;
        box-shadow: 0 20px 60px rgba(0, 0, 0, 0.8);
        font-family: 'Segoe UI', Tahoma, Geneva, Verdana, sans-serif;
    }}
    .table-title {{
        color: #fff;
        font-size: 26px;
        font-weight: bold;
        text-align: center;
        margin-bottom: 25px;
        text-shadow: 0 0 20px rgba(100, 181, 246, 0.5);
    }}
    .pdf-table {{
        width: 100%;
        border-collapse: collapse;
        background: rgba(255, 255, 255, 0.02);
        border-radius: 15px;
        overflow: hidden;
    }}
    .pdf-table th {{
        background: linear-gradient(90deg, #6366f1, #8b5cf6);
        color: #fff;
        padding: 18px;
        font-weight: bold;
        text-transform: uppercase;
        letter-spacing: 1px;
    }}
    .pdf-table td {{ padding: 16px; color: #e2e8f0; border-bottom: 1px solid rgba(255, 255, 255, 0.05); }}
    .pdf-table tr:hover {{ background: rgba(99, 102, 241, 0.15); cursor: pointer; transition: all 0.3s; }}
    .pdf-table td:last-child {{ color: #60a5fa; font-weight: bold; }}
    .summary, .error-message {{
        margin-top: 20px;
        padding: 15px;
        background: rgba(99, 102, 241, 0.1);
        border-radius: 10px;
        color: #cbd5e1;
        text-align: center;
        font-size: 16px;
    }}
    .summary span {{ color: #a78bfa; font-weight: bold; }}
</style>
"""

# Si se encontraron archivos PDF, se construye la tabla de resultados.
if pdf_files:
    html = html_template + f"""
    <div class="dark-table-container">
        <h2 class="table-title">✨ Recursos PDF Disponibles ✨</h2>
        <table class="pdf-table">
            <tr>
                <th>📚 Documento</th>
                <th>💾 Tamaño</th>
            </tr>
    """

    total_size_mb = 0
    for pdf in pdf_files:
        size_mb = pdf.stat().st_size / (1024 * 1024)
        total_size_mb += size_mb
        clean_name = pdf.stem.replace("_", " ").replace("-", " ").title()
        html += f'<tr><td>{clean_name}</td><td>{size_mb:.2f} MB</td></tr>'

    avg_size_mb = total_size_mb / len(pdf_files)
    html += f"""
        </table>
        <div class="summary">
            Total: <span>{len(pdf_files)} archivos</span> |
            Tamaño Total: <span>{total_size_mb:.2f} MB</span> |
            Promedio: <span>{avg_size_mb:.2f} MB</span>
        </div>
    </div>
    """
# De lo contrario, se muestra el panel de error.
else:
    html = html_template + f"""
    <div class="dark-table-container" style="background: linear-gradient(145deg, #4a2e2e, #5d3d3d);">
        <h2 class="table-title" style="text-shadow: 0 0 20px rgba(246, 120, 120, 0.5);">❌ No se Encontraron Documentos</h2>
        <div class="error-message" style="background: rgba(241, 99, 99, 0.1);">
            La carpeta <strong>'{DIRECTORIO_DOCUMENTOS}'</strong> no existe o no contiene archivos PDF.
            <br><br>
            Asegúrate de haber ejecutado la celda de descarga de Google Drive primero.
        </div>
    </div>
    """

# --- 3. Renderizar el HTML en la Salida de la Celda ---
display(HTML(html))

🔎 Escaneando la carpeta: 'datos_RAG_LLM' en busca de archivos PDF...


📚 Documento,💾 Tamaño
0000000584Cnt 2017 05 Manual Autoayuda Dejar De Fumar,10.65 MB
0717 7348 Rcher 33 03 0186,0.25 MB
0717 9227 Rchnp 56 03 0147,0.10 MB
1130 5274 Clinsa 31 3 0137,0.25 MB
180618320005,0.14 MB
2020 Consumer Guide Spanish 508,7.38 MB
2436,0.10 MB
9789275321805 Spa,0.57 MB
"Consigue Dejar De Fumar Con El Doctor Fum Utiliza El MéTodo Dr Alberto Seoane [Seoane, Dr Alberto] Cuerpo Y Salud, Place Of Publication Not",1.30 MB
"CóMo Dejar De Fumar ¡Definitivamente! Y Prevenir Otras Eduardo HernáNdez 2A Ed , MéXico, Mexico, 2013 Editorial Trillas, S A De C V",10.20 MB


# 📄➡️📝 Conversión de PDF a Texto

### ⚙️ **Procesamiento y Extracción de Texto desde PDF**

Esta sección del notebook es un paso fundamental en la preparación de datos para nuestro sistema RAG. El siguiente código automatiza el proceso de "digestión" de los documentos fuente en formato PDF. Su lógica se puede resumir en los siguientes puntos:

1.  **Localiza** todos los archivos PDF en nuestro directorio de datos.
2.  **Abre** cada PDF y extrae el texto crudo de todas sus páginas.
3.  **Limpia** el texto extraído, eliminando artefactos comunes como guiones de separación silábica y secuencias de escape, además de filtrar líneas irrelevantes (ej. números de página).
4.  **Guarda** el contenido limpio y procesado en un nuevo archivo de texto (`.txt`), dejándolo listo para ser cargado y vectorizado en la siguiente fase del proyecto.

Este pre-procesamiento es crucial para asegurar la calidad del contexto que el modelo de lenguaje utilizará para responder preguntas.

#### **Referencias de las Herramientas Utilizadas**

* Artifex Software Inc. (2025). *PyMuPDF* (Versión 1.24.7) [Software]. [https://pypi.org/project/PyMuPDF/](https://pypi.org/project/PyMuPDF/)
* Python Software Foundation. (2025). *Python regular expression operations* (Versión 3.11) [Documentación de la biblioteca de software]. [https://docs.python.org/3/library/re.html](https://docs.python.org/3/library/re.html)

In [6]:
# =============================================================================
# PROCESAMIENTO Y LIMPIEZA DE DOCUMENTOS PDF
# -----------------------------------------------------------------------------
# Este bloque itera sobre los archivos PDF descargados, extrae su texto,
# lo limpia según varias reglas y lo guarda en archivos .txt.
# =============================================================================

# Definimos códigos de colores para una salida más visual
CIAN = "\033[96m"
VERDE = "\033[92m"
ROJO = "\033[91m"
RESET = "\033[0m"

print(f"{VERDE}Iniciando el proceso de extracción y limpieza de PDFs...{RESET}")

# --- 1. Obtener la lista de documentos PDF ---
# Usamos una "list comprehension" para crear la lista de forma concisa.
try:
    archivos_pdf = [f for f in os.listdir(DIRECTORIO_DOCUMENTOS) if f.lower().endswith(".pdf")]
    if not archivos_pdf:
        print(f"⚠️  No se encontraron archivos PDF en la carpeta '{DIRECTORIO_DOCUMENTOS}'.")
except FileNotFoundError:
    print(f"{ROJO}❌ Error: El directorio '{DIRECTORIO_DOCUMENTOS}' no existe.{RESET}")
    archivos_pdf = []


# --- 2. Bucle principal de procesamiento por cada archivo ---
documentos_procesados = 0
for archivo in archivos_pdf:
    print(f"\n📄 Procesando: {CIAN}{archivo}{RESET}")
    ruta_completa_pdf = os.path.join(DIRECTORIO_DOCUMENTOS, archivo)

    try:
        # --- A. Extracción de todo el texto del PDF ---
        texto_completo = ""
        with fitz.open(ruta_completa_pdf) as documento:
            for pagina in documento:
                texto_completo += pagina.get_text()

        # --- B. Limpieza y filtrado del texto extraído ---

        # 1. Eliminar "guiones blandos" (soft hyphens) que a veces aparecen en los PDFs.
        texto_completo = texto_completo.replace('\xad', '')

        # 2. Dividir el texto completo en líneas individuales.
        lineas_crudas = texto_completo.splitlines()

        # 3. Limpiar cada línea de secuencias de escape no deseadas.
        lineas_sin_secuencias = [re.sub(r'\\[a-zA-Z0-9]{1,6}', '', linea) for linea in lineas_crudas]

        # 4. Filtrar para mantener solo las líneas que aportan valor.
        #    - No están vacías o son solo espacios.
        #    - Contienen más de una palabra (evita encabezados/pies de página simples).
        #    - No son solo un número (evita números de página).
        lineas_utiles = [
            linea for linea in lineas_sin_secuencias
            if linea.strip() and len(linea.strip().split()) > 1 and not linea.strip().isdigit()
        ]

        # --- C. Guardado del archivo .txt resultante ---
        nombre_base = os.path.splitext(archivo)[0]
        nombre_archivo_txt = f"{nombre_base}.txt"
        ruta_archivo_txt = os.path.join(DIRECTORIO_DOCUMENTOS, nombre_archivo_txt)

        with open(ruta_archivo_txt, "w", encoding="utf-8") as f_out:
            f_out.write("\n".join(lineas_utiles))

        print(f"   {VERDE}✅ Texto extraído y guardado en: {CIAN}{nombre_archivo_txt}{RESET}")
        documentos_procesados += 1

    except Exception as e:
        print(f"   {ROJO}❌ Error al procesar el archivo '{archivo}': {e}{RESET}")

# --- 3. Resumen final ---
print("\n" + "="*70)
print(f"✨ {VERDE}Proceso finalizado. Se han procesado {documentos_procesados} de {len(archivos_pdf)} documentos.{RESET} ✨")
print("="*70)

[92mIniciando el proceso de extracción y limpieza de PDFs...[0m

📄 Procesando: [96m2436.pdf[0m
   [92m✅ Texto extraído y guardado en: [96m2436.txt[0m

📄 Procesando: [96m1130-5274-clinsa-31-3-0137.pdf[0m
   [92m✅ Texto extraído y guardado en: [96m1130-5274-clinsa-31-3-0137.txt[0m

📄 Procesando: [96mJourney_to_Quit Spanish.pdf[0m
   [92m✅ Texto extraído y guardado en: [96mJourney_to_Quit Spanish.txt[0m

📄 Procesando: [96mGUIA_DEJAR_DE_FUMAR.pdf[0m
   [92m✅ Texto extraído y guardado en: [96mGUIA_DEJAR_DE_FUMAR.txt[0m

📄 Procesando: [96mConsigue dejar de fumar con el Doctor Fum- Utiliza el método -- Dr_ Alberto Seoane [Seoane, Dr_ Alberto] -- Cuerpo y Salud, Place of publication not.pdf[0m
   [92m✅ Texto extraído y guardado en: [96mConsigue dejar de fumar con el Doctor Fum- Utiliza el método -- Dr_ Alberto Seoane [Seoane, Dr_ Alberto] -- Cuerpo y Salud, Place of publication not.txt[0m

📄 Procesando: [96m9789275321805_spa.pdf[0m
   [92m✅ Texto extraído y guar

# 🔎 Creación de la Base de Datos FAISS

Para que nuestro sistema de **Retrieval-Augmented Generation (RAG)** pueda encontrar información relevante, primero debemos procesar nuestros documentos fuente y almacenarlos en una estructura de datos optimizada para búsquedas de similitud. Para esto, utilizamos una base de datos vectorial, y **FAISS** es una de las bibliotecas más potentes para esta tarea.

> **FAISS (Facebook AI Similarity Search)** es una biblioteca de código abierto desarrollada por Meta AI, optimizada para la búsqueda eficiente de similitudes y la agrupación de vectores densos. Incorpora algoritmos capaces de realizar búsquedas en conjuntos de vectores de cualquier tamaño, desde miles hasta miles de millones.

El objetivo es transformar nuestros documentos de texto en un índice vectorial que el sistema pueda consultar rápidamente. El proceso se puede resumir en los siguientes cuatro pasos:

### 📂 1. Carga del Documento Fuente
El primer paso consiste en cargar el contenido de nuestros archivos de texto en la memoria.
* Se utiliza la clase `TextLoader` de LangChain para abrir y leer el contenido de un archivo de texto específico.
* El método `loader.load()` procesa el archivo y lo convierte en un objeto `Document` estándar de LangChain, listo para el siguiente paso.

### ✂️ 2. División del Texto en Fragmentos (Chunks)
Un documento completo es demasiado grande para ser procesado eficientemente por un modelo de embedding. Por lo tanto, debemos dividirlo en fragmentos más pequeños, pero coherentes.
* Se emplea un divisor de texto como `CharacterTextSplitter` o `RecursiveCharacterTextSplitter`.
* Este divisor segmenta el documento en *chunks* de un tamaño definido (ej. 2000 caracteres) y con una ligera superposición (*overlap*) entre ellos para no perder el contexto en los puntos de corte.

### 🧠 3. Carga del Modelo de Embedding
Cada *chunk* de texto debe ser convertido en una representación numérica (un vector) que capture su significado semántico.
* Se utiliza la clase `HuggingFaceEmbeddings`, que carga un modelo de la familia *Sentence-Transformers*.
* Este modelo está especializado en convertir frases y párrafos en vectores de alta dimensión, donde textos con significados similares tienen vectores cercanos en el espacio.

### 💾 4. Creación del Índice FAISS
Con los *chunks* de texto y el modelo de embedding listos, se construye la base de datos vectorial final.
* Se invoca el método `FAISS.from_documents(docs, embeddings)`.
* Este comando toma cada *chunk*, lo convierte en un vector usando el modelo de embedding y lo almacena en un índice FAISS optimizado. El resultado es una base de datos vectorial lista para recibir consultas y devolver los fragmentos más relevantes de manera eficiente.

---
### **Referencias**

Chase, H. (2024). *LangChain* (Versión 0.2.10) [Software]. [https://github.com/langchain-ai/langchain](https://github.com/langchain-ai/langchain)

Johnson, J., Douze, M., & Jégou, H. (2019). *Billion-scale similarity search with GPUs.* ArXiv. [https://arxiv.org/abs/1702.08734](https://arxiv.org/abs/1702.08734)

Reimers, N., & Gurevych, I. (2019). *Sentence-BERT: Sentence embeddings using siamese BERT-networks.* ArXiv. [https://arxiv.org/abs/1908.10084](https://arxiv.org/abs/1908.10084)

Wolf, T., Debut, L., Sanh, V., Chaumond, J., Delangue, C., Moi, A., Cistac, P., Rault, T., Louf, R., Funtowicz, M., & Brew, J. (2020). *Transformers: State-of-the-art natural language processing.* ArXiv. [https://arxiv.org/abs/1910.03771](https://arxiv.org/abs/1910.03771)

In [7]:
# =============================================================================
# CONSTANTES PARA LA CREACIÓN DE LA BASE DE DATOS VECTORIAL
# -----------------------------------------------------------------------------
# Parámetros que controlan cómo se dividen los documentos en fragmentos (chunks).
# =============================================================================
CHUNK_SIZE = 3000      # Tamaño máximo de cada chunk en caracteres.
CHUNK_OVERLAP = 500    # Caracteres de superposición entre chunks para no perder contexto.

### 🛠️ **Función: `crear_base_vectorial`**

Esta función es el motor de preparación de datos para nuestro sistema RAG. Su único propósito es tomar una carpeta con archivos de texto y convertirla en una base de datos vectorial (FAISS) inteligente, lista para realizar búsquedas semánticas de alta velocidad.

**El proceso se resume en 4 pasos clave:**

1.  **Carga:** Lee todos los archivos `.txt` del directorio especificado.
2.  **División:** Segmenta los documentos en fragmentos (`chunks`) más pequeños y manejables.
3.  **Vectorización:** Convierte cada fragmento de texto en un vector numérico que captura su significado.
4.  **Indexación:** Almacena todos los vectores en un índice FAISS para su recuperación casi instantánea.

En esencia, esta función construye la "memoria" a largo plazo de nuestro chatbot.

In [8]:
def crear_base_vectorial(directorio_docs: str, embedding_model_name: str, chunk_size: int, chunk_overlap: int):
    """
    Carga documentos de texto, los divide en chunks, crea embeddings y construye una base de datos vectorial FAISS.

    Args:
        directorio_docs (str): Ruta al directorio que contiene los archivos .txt.
        embedding_model_name (str): Nombre del modelo de embeddings de Hugging Face.
        chunk_size (int): Tamaño máximo de cada chunk.
        chunk_overlap (int): Superposición de caracteres entre chunks.

    Returns:
        tuple: Una tupla conteniendo el objeto vector_store (FAISS) y el modelo de embeddings.
    """
    # Definimos códigos de colores para la salida
    CIAN = "\033[96m"
    VERDE = "\033[92m"
    ROJO = "\033[91m"
    AMARILLO = "\033[93m"
    RESET = "\033[0m"
    BOLD = "\033[1m"

    print(f"\n{BOLD}{VERDE}--- INICIANDO CREACIÓN DE LA BASE DE DATOS VECTORIAL ---{RESET}")

    # --- PASO 1: Cargar los documentos de texto ---
    print(f"\n{BOLD}1. Cargando documentos desde '{directorio_docs}'...{RESET}")
    if not os.path.exists(directorio_docs):
        raise FileNotFoundError(f"{ROJO}❌ El directorio '{directorio_docs}' no fue encontrado.{RESET}")

    rutas_archivos = sorted([os.path.join(directorio_docs, f) for f in os.listdir(directorio_docs) if f.endswith('.txt')])
    if not rutas_archivos:
        print(f"{AMARILLO}⚠️  No se encontraron archivos .txt en el directorio.{RESET}")
        return None, None

    todos_los_documentos = []
    for ruta in rutas_archivos:
        print(f"   - Cargando: {CIAN}{os.path.basename(ruta)}{RESET}")
        loader = TextLoader(ruta, encoding="utf-8")
        todos_los_documentos.extend(loader.load())

    print(f"{VERDE}✅ Se cargaron {len(todos_los_documentos)} documentos.{RESET}")


    # --- PASO 2: Dividir los documentos en Chunks ---
    print(f"\n{BOLD}2. Dividiendo documentos en chunks...{RESET}")
    text_splitter = RecursiveCharacterTextSplitter(chunk_size=chunk_size, chunk_overlap=chunk_overlap)
    chunks = text_splitter.split_documents(todos_los_documentos)
    print(f"{VERDE}✅ Se crearon {len(chunks)} chunks en total.{RESET}")


    # --- PASO 3: Cargar el modelo de Embeddings ---
    print(f"\n{BOLD}3. Cargando modelo de Embeddings...{RESET}")
    print(f"   - Modelo: {CIAN}{embedding_model_name}{RESET}")
    embeddings = HuggingFaceEmbeddings(model_name=embedding_model_name)
    print(f"{VERDE}✅ Modelo de Embeddings cargado.{RESET}")


    # --- PASO 4: Crear la base de datos vectorial FAISS ---
    print(f"\n{BOLD}4. Creando la base de datos vectorial FAISS...{RESET}")
    vector_store = FAISS.from_documents(chunks, embeddings)
    print(f"{VERDE}✅ Base de datos vectorial creada y poblada con éxito.{RESET}")

    print(f"\n{BOLD}{VERDE}--- PROCESO FINALIZADO ---{RESET}")

    return vector_store, embeddings

---
---

# 🧠 Creación del Modelo LLM

### **⚙️ Arquitectura de la Función de Carga del LLM**

La siguiente función está diseñada para cargar de manera eficiente y robusta un Modelo de Lenguaje Grande (LLM) desde el ecosistema de Hugging Face. Su lógica se divide en los siguientes pasos clave:

1.  **📥 Carga del Modelo Pre-entrenado**
    * Se utiliza la biblioteca `transformers` de Hugging Face para **descargar y cargar un modelo** previamente entrenado, permitiendo acceder a arquitecturas de última generación con una sola línea de código.

2.  **💡 Optimización de Memoria (Cuantización)**
    * Para hacer manejables los modelos de miles de millones de parámetros, se **configura una cuantización en 4-bits**. Esta técnica reduce drásticamente el consumo de memoria VRAM en la GPU, permitiendo ejecutar modelos grandes en hardware con recursos limitados.

3.  **🖥️ Detección Automática de Hardware**
    * La función **verifica si una GPU está disponible** en el entorno. Si es así, carga el modelo optimizado directamente en la GPU para una máxima velocidad de inferencia. En caso contrario, carga una versión estándar del modelo en la CPU.

4.  **✍️ Configuración del Tokenizador**
    * Finalmente, se **prepara el `tokenizer` asociado al modelo**. Este componente es crucial para convertir el texto de entrada en un formato que el modelo pueda entender y para asegurar que la generación de texto se detenga correctamente.

In [9]:
def cargar_modelo_y_tokenizador(model_name: str):
    """
    Carga un modelo de lenguaje y su tokenizador correspondiente desde Hugging Face.
    Detecta automáticamente si hay una GPU disponible para aplicar cuantización
    y optimizar el uso de memoria.

    Args:
        model_name (str): El nombre del modelo a cargar (ej. "mistralai/Mistral-7B-Instruct-v0.2").

    Returns:
        tuple: Una tupla conteniendo el tokenizador y el modelo cargados.
    """
    # Definimos códigos de colores para una salida visualmente atractiva
    CIAN = "\033[96m"
    VERDE = "\033[92m"
    AMARILLO = "\033[93m"
    ROJO = "\033[91m"
    RESET = "\033[0m"
    BOLD = "\033[1m"

    print(f"\n{BOLD}{VERDE}--- INICIANDO CARGA DE MODELO DE LENGUAJE (LLM) ---{RESET}")
    print(f"{BOLD}Modelo a cargar:{RESET} {CIAN}{model_name}{RESET}")

    # --- PASO 1: Cargar el Tokenizador ---
    # Esto es común tanto para CPU como para GPU, así que lo hacemos primero.
    print(f"\n{BOLD}1. Cargando Tokenizador...{RESET}")
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    # Configuramos el token de padding para que sea igual al de fin de secuencia.
    # Esto es importante para evitar problemas en algunos modelos durante la generación.
    tokenizer.pad_token = tokenizer.eos_token
    print(f"{VERDE}   ✅ Tokenizador cargado y configurado.{RESET}")

    # --- PASO 2: Detección de Hardware y Carga del Modelo ---
    print(f"\n{BOLD}2. Detectando hardware y cargando el modelo...{RESET}")

    # Verificamos si hay una GPU compatible con CUDA disponible
    if torch.cuda.is_available():
        print(f"{VERDE}   - 🟢 GPU detectada. Se aplicará cuantización de 4-bit para optimizar memoria.{RESET}")

        # Configuración de cuantización para reducir el consumo de VRAM
        quantization_config = BitsAndBytesConfig(
            load_in_4bit=True,
            bnb_4bit_quant_type="nf4",
            bnb_4bit_compute_dtype=torch.bfloat16,
            bnb_4bit_use_double_quant=False,
        )

        # Cargar el modelo con la configuración de cuantización
        # device_map="auto" distribuye el modelo automáticamente en el hardware disponible
        model = AutoModelForCausalLM.from_pretrained(
            model_name,
            quantization_config=quantization_config,
            device_map="auto"
        )
        print(f"{VERDE}   ✅ Modelo cargado en GPU con éxito.{RESET}")

    else:
        print(f"{AMARILLO}   - 🟡 No se detectó GPU. Cargando modelo estándar en CPU (esto puede ser lento).{RESET}")
        # Cargar el modelo sin optimizaciones para la CPU
        model = AutoModelForCausalLM.from_pretrained(model_name)
        print(f"{VERDE}   ✅ Modelo cargado en CPU.{RESET}")

    print(f"\n{BOLD}{VERDE}--- CARGA DEL LLM COMPLETADA ---{RESET}")

    return tokenizer, model

---
---

# 🚀 Creación de la Base de Datos Vectorial y Carga del LLM


### 🚀 **Ejecución del Pipeline Principal**

Esta es la celda de ejecución central de nuestro proyecto. Actúa como un director de orquesta, llamando a las funciones que hemos preparado para construir y cargar los dos componentes esenciales de nuestro sistema RAG.

El proceso se ejecutará en el siguiente orden:
1.  **Creación de la Base de Conocimiento:** Se generará la base de datos vectorial FAISS a partir de los documentos de texto.
2.  **Carga de la Inteligencia:** Se cargará en memoria el modelo de lenguaje grande (LLM) junto con su tokenizador.

El código está diseñado para ser robusto y te notificará si todo ha salido bien o si ha ocurrido algún error crítico en el camino. Al finalizar con éxito, todos los componentes del sistema estarán listos para ser ensamblados en la cadena final.

In [10]:
# =============================================================================
# EJECUCIÓN DEL PIPELINE PRINCIPAL DE RAG
# -----------------------------------------------------------------------------
# Esta es la celda central que orquesta la construcción de nuestro sistema.
# Llama a las funciones que hemos definido para:
# 1. Crear la base de datos vectorial a partir de los documentos.
# 2. Cargar el potente modelo de lenguaje (LLM) y su tokenizador.
# =============================================================================

# -- Definimos los colores para la salida visual --
CIAN = "\033[96m"
VERDE = "\033[92m"
ROJO = "\033[91m"
AMARILLO = "\033[93m"
RESET = "\033[0m"
BOLD = "\033[1m"
SEPARADOR = "=" * 70
SEPARADOR_ERROR = "❌" * 35

# -- Bloque de ejecución principal con manejo de errores --
try:
    print(SEPARADOR)
    print(f"🚀 {BOLD}INICIANDO PIPELINE PRINCIPAL DEL EQUIPO SIHINO{RESET} 🚀")
    print(SEPARADOR)

    # --- PASO 1: CREAR LA BASE DE DATOS VECTORIAL ---
    # Llamamos a la función que preparamos para procesar los .txt y crear la BD.
    vector_db, embeddings_model = crear_base_vectorial(
        directorio_docs=DIRECTORIO_DOCUMENTOS,
        embedding_model_name=EMBEDDING_MODEL_NAME,
        chunk_size=CHUNK_SIZE,
        chunk_overlap=CHUNK_OVERLAP
    )

    # Verificación del Paso 1: Si la base de datos no se creó, detenemos la ejecución.
    if not vector_db:
        raise RuntimeError("La creación de la base de datos vectorial falló. Revisa los logs anteriores.")

    # --- PASO 2: CARGAR EL MODELO DE LENGUAJE (LLM) ---
    # Llamamos a la función que carga el LLM y el tokenizador, con detección de hardware.
    tokenizer, model = cargar_modelo_y_tokenizador(LLM_MODEL_NAME)

    # Verificación del Paso 2: Si el modelo no se cargó, detenemos la ejecución.
    if not model or not tokenizer:
        raise RuntimeError("La carga del modelo de lenguaje falló. Revisa los logs anteriores.")

    # --- FINALIZACIÓN EXITOSA ---
    print("\n" + SEPARADOR)
    print(f"✅🎉 {BOLD}{VERDE}¡SISTEMA RAG COMPLETAMENTE CARGADO Y LISTO!{RESET} 🎉✅")
    print(SEPARADOR)
    print(f"   - 🗂️  Base de Datos Vectorial: {VERDE}Operativa{RESET}")
    print(f"   - 🧠 Modelo de Lenguaje (LLM): {CIAN}{LLM_MODEL_NAME}{RESET} {VERDE}Cargado y en espera{RESET}")
    print(SEPARADOR)


except Exception as e:
    print("\n" + SEPARADOR_ERROR)
    print(f"❌ {BOLD}{ROJO}ERROR CRÍTICO DURANTE LA EJECUCIÓN DEL PIPELINE:{RESET}")
    print(f"{ROJO}   {e}{RESET}")
    print(SEPARADOR_ERROR)

🚀 [1mINICIANDO PIPELINE PRINCIPAL DEL EQUIPO SIHINO[0m 🚀

[1m[92m--- INICIANDO CREACIÓN DE LA BASE DE DATOS VECTORIAL ---[0m

[1m1. Cargando documentos desde 'datos_RAG_LLM'...[0m
   - Cargando: [96m0000000584cnt-2017-05_manual-autoayuda-dejar-de-fumar.txt[0m
   - Cargando: [96m0717-7348-rcher-33-03-0186.txt[0m
   - Cargando: [96m0717-9227-rchnp-56-03-0147.txt[0m
   - Cargando: [96m1130-5274-clinsa-31-3-0137.txt[0m
   - Cargando: [96m180618320005.txt[0m
   - Cargando: [96m2020-consumer-guide-spanish-508.txt[0m
   - Cargando: [96m2436.txt[0m
   - Cargando: [96m9789275321805_spa.txt[0m
   - Cargando: [96mConsigue dejar de fumar con el Doctor Fum- Utiliza el método -- Dr_ Alberto Seoane [Seoane, Dr_ Alberto] -- Cuerpo y Salud, Place of publication not.txt[0m
   - Cargando: [96mCómo dejar de fumar ¡definitivamente! y prevenir otras -- - Eduardo Hernández -- 2a ed_, México, Mexico, 2013 -- Editorial Trillas, S_A_ de C_V.txt[0m
   - Cargando: [96mDeja de fumar

Loading checkpoint shards:   0%|          | 0/3 [00:00<?, ?it/s]

[92m   ✅ Modelo cargado en GPU con éxito.[0m

[1m[92m--- CARGA DEL LLM COMPLETADA ---[0m

✅🎉 [1m[92m¡SISTEMA RAG COMPLETAMENTE CARGADO Y LISTO![0m 🎉✅
   - 🗂️  Base de Datos Vectorial: [92mOperativa[0m
   - 🧠 Modelo de Lenguaje (LLM): [96mmistralai/Mistral-7B-Instruct-v0.2[0m [92mCargado y en espera[0m


---
---

# ⛓️ Creación del Pipeline


### ⚙️ **Configuración del Pipeline de Generación de Texto (LLM)**

Este módulo define el flujo de trabajo principal para la generación de texto utilizando nuestro Modelo de Lenguaje Grande (LLM) de Hugging Face. Tras varias **pruebas experimentales** enfocadas en optimizar la **velocidad de respuesta** y la **calidad del texto generado** para nuestra tarea específica, se determinó que la siguiente configuración de parámetros ofrece el mejor equilibrio.

Los parámetros clave que definen el comportamiento de este pipeline son:

* **`model=llm_model`**:  Especifica la instancia del modelo de lenguaje pre-entrenado que se cargó previamente. Este modelo es el encargado de "comprender" el prompt y generar el texto de salida.

* **`tokenizer=tokenizer`**: Define el tokenizador asociado al modelo. Su función es crucial para la correcta **conversión del texto de entrada (el prompt) en tokens** (unidades numéricas que entiende el modelo) y para **decodificar los tokens generados de vuelta a texto legible**.

* **`max_new_tokens=800`**: Establece un límite en la **cantidad máxima de tokens nuevos que el modelo puede generar** en una sola respuesta. Este parámetro es fundamental para controlar la longitud y evitar respuestas excesivamente largas o infinitas.

* **`do_sample=True`**: Activa el **muestreo probabilístico** durante la generación. En lugar de seleccionar siempre el token con la probabilidad más alta, el modelo elige tokens de forma aleatoria según su distribución de probabilidad. Esto introduce **variedad y creatividad** en las respuestas.

* **`temperature=0.8`**: Controla la **aleatoriedad del muestreo**. Valores más altos (acercándose a 1) hacen que las predicciones sean más aleatorias y creativas, mientras que valores más bajos (acercándose a 0) las hacen más deterministas y conservadoras. El valor de `0.8` se eligió para un buen equilibrio entre creatividad y coherencia.

* **`top_k=50`**: Implementa una estrategia de muestreo que **considera únicamente los 50 tokens más probables** en cada paso de la generación. Luego, se elige un token aleatoriamente de este subconjunto. Esto ayuda a reducir la posibilidad de generar respuestas incoherentes.

* **`top_p=0.95`**: Aplica el **"nucleus sampling"**. El modelo considera el conjunto más pequeño de tokens cuya probabilidad acumulada suma el valor de `top_p` (en este caso, el 95%). Luego, se muestrea un token de este "núcleo". Esta técnica ayuda a generar respuestas más coherentes y relevantes.

* **`eos_token_id=tokenizer.eos_token_id`**: Define el **identificador del token especial que indica el "fin de la secuencia"**. El modelo detendrá automáticamente la generación de texto una vez que produzca este token, asegurando que las respuestas no se extiendan indefinidamente.

* **`return_full_text=False`**: Especifica que la salida del pipeline debe contener **únicamente el texto generado por el modelo**, excluyendo el prompt de entrada original.

---

#### **Referencias**

* Wolf, T., Debut, L., Sanh, V., Chaumond, J., Delangue, C., Moi, A., Cistac, P., Rault, T., Louf, R., Funtowicz, M., & Brew, J. (2020). *Transformers: State-of-the-art natural language processing.* ArXiv. [https://arxiv.org/abs/1910.03771](https://arxiv.org/abs/1910.03771)

In [11]:
# =============================================================================
# CONFIGURACIÓN DEL PIPELINE DE GENERACIÓN DE TEXTO
# -----------------------------------------------------------------------------
# Aquí se define el pipeline de Hugging Face que LangChain usará para
# interactuar con nuestro modelo de lenguaje (LLM). Los parámetros ajustan
# el "comportamiento" del modelo al generar las respuestas.
# =============================================================================

llm_pipeline = pipeline(
    task="text-generation",                # Tarea específica que realizará el pipeline.
    model=model,                           # El modelo de lenguaje que ya cargamos en memoria.
    tokenizer=tokenizer,                   # El tokenizador asociado al modelo.

    # --- Parámetros para controlar la creatividad y estilo de la respuesta ---
    do_sample=True,                        # Activa el muestreo, necesario para que temperature/top_k/top_p funcionen.
    temperature=0.6,                       # Controla la "creatividad". > 0.7 es más creativo, < 0.3 es más determinista.
    top_k=50,                              # En cada paso, considera solo los 50 tokens (palabras) más probables.
    top_p=0.95,                            # Considera el conjunto de tokens cuya probabilidad acumulada es >= 95%.

    # --- Parámetros para controlar la longitud y el formato de la salida ---
    max_new_tokens=500,                   # Límite máximo de tokens a generar en la respuesta.
    return_full_text=False,                # IMPORTANTE: Devuelve solo la respuesta, no el prompt + la respuesta.
    eos_token_id=tokenizer.eos_token_id    # Asegura que el modelo se detenga correctamente al generar el token de fin.
)

# El objeto `llm_pipeline` está ahora listo para ser encapsulado por LangChain.

Device set to use cuda:0


# 💬 RAG Langchain para responder preguntas de forma contextualizada

### **⛓️ Arquitectura de la Cadena RAG**

El siguiente código representa el ensamblaje final de nuestro sistema. Aquí, orquestamos todos los componentes previamente definidos para construir una cadena de `RAG` (Retrieval-Augmented Generation) completa, utilizando el poder y la flexibilidad de `LangChain`.

Esta cadena es el cerebro que impulsa a nuestro chatbot y su lógica sigue estos pasos clave:

1.  **🤖 Configuración del LLM:**
    * Se encapsula el `pipeline` de Hugging Face dentro de la clase `HuggingFacePipeline`, convirtiéndolo en un componente estándar que `LangChain` puede utilizar de manera fluida.

2.  **🔎 Creación del Retriever:**
    * Se configura un **`retriever`** a partir de nuestra base de datos vectorial. Su única misión es buscar y obtener los fragmentos de información más relevantes para la pregunta del usuario.

3.  **✍️ Diseño del Prompt Personalizado:**
    * Se define una **plantilla de prompt** que actúa como el manual de instrucciones para el LLM. Le indicamos su personalidad (amable y de apoyo), sus reglas (responder solo con el contexto) y el formato exacto de la respuesta.

4.  **➡️ Construcción de la Cadena RAG:**
    * Finalmente, se **ensambla la cadena** utilizando *LangChain Expression Language* (LCEL). Este encadenamiento (`|`) define el flujo de datos: la pregunta entra, el `retriever` busca el contexto, el `prompt` formatea la entrada, el `LLM` genera la respuesta y un `parser` limpia la salida final.

In [12]:
# =============================================================================
# ENSAMBLAJE FINAL DE LA CADENA RAG (CEREBRO DEL ASISTENTE)
# -----------------------------------------------------------------------------
# Esta es la celda más importante. Une todos los componentes que hemos
# preparado (LLM, retriever, prompt) para crear la cadena de lógica
# completa que puede recibir una pregunta y generar una respuesta contextual.
# =============================================================================

# --- 1. Encapsular el LLM para que sea compatible con LangChain ---
# Creamos un 'wrapper' estándar sobre nuestro pipeline de Hugging Face.
llm = HuggingFacePipeline(pipeline=llm_pipeline)


# --- 2. Crear el Recuperador (Retriever) de la Base de Datos Vectorial ---
# Este componente es el encargado de buscar y encontrar los fragmentos
# de texto más relevantes para responder a una pregunta.
retriever = vector_db.as_retriever(
    search_kwargs={"k": 6}  # "k" especifica el número de chunks a recuperar (6 es un buen número).
)


# --- 3. Definir la Plantilla de Prompt (Las Instrucciones del Asistente) ---
# Aquí definimos la "personalidad", las reglas y el formato que el LLM debe seguir.
prompt_template = PromptTemplate(
    input_variables=["context", "question"],
    template="""
    [INST] Eres un asistente de IA de apoyo para dejar de fumar.
    Usa SOLAMENTE el siguiente contexto para responder la pregunta.

    **Instrucciones Clave:**
    1.  **RESPONDE SIEMPRE Y ÚNICAMENTE EN ESPAÑOL.**
    2.  Sé extremadamente conciso. Responde en un máximo de 3 o 4 frases.
    3.  Si la información no está en el contexto, di "No encuentro información específica sobre eso, pero puedo ofrecerte apoyo general si lo necesitas."
    4.  Nunca menciones el "contexto" o los "documentos" que consultas.
    5.  Usa un tono amable y de apoyo.

    **Contexto:**
    {context}

    **Pregunta:**
    {question}

    **Respuesta concisa y amable en español:** [/INST]
    """
)


# --- 4. Ensamblar la Cadena RAG completa con LCEL ---
# Unimos todos los componentes en un solo flujo de datos usando el "pipe operator" (|).
# Este es el núcleo de la arquitectura de RAG.
rag_chain = (
    # En paralelo: el retriever busca el contexto y la pregunta original pasa directamente.
    {"context": retriever, "question": RunnablePassthrough()}

    # Los resultados se usan para formatear el prompt que definimos arriba.
    | prompt_template

    # El prompt ya completo se envía al LLM para que genere la respuesta.
    | llm

    # La respuesta del LLM se limpia para obtener únicamente el texto final.
    | StrOutputParser()
)


# --- Confirmación Final ---
print("✅⛓️ ¡Cadena RAG ensamblada y lista para usar!")
print("   - LLM encapsulado.")
print("   - Retriever configurado.")
print("   - Prompt definido.")
print("   - Cadena LCEL construida.")

✅⛓️ ¡Cadena RAG ensamblada y lista para usar!
   - LLM encapsulado.
   - Retriever configurado.
   - Prompt definido.
   - Cadena LCEL construida.


  llm = HuggingFacePipeline(pipeline=llm_pipeline)


---
---

# 💡 Responder Preguntas

### 🧪 **Pruebas de Calidad y Validación del Sistema**

Antes de lanzar la interfaz interactiva, es fundamental realizar un **control de calidad** para evaluar el rendimiento y la coherencia de nuestro asistente. Esta celda está diseñada precisamente para eso.

**El proceso es el siguiente:**

1.  **Batería de Preguntas:** Se define una lista (`preguntas_de_prueba`) que contiene una variedad de consultas, desde dudas técnicas hasta peticiones de apoyo emocional, para probar al chatbot en diferentes escenarios.
2.  **Ejecución Automatizada:** Un bucle itera sobre cada pregunta, la envía a nuestra `rag_chain` y recibe la respuesta.
3.  **Visualización Clara:** Para facilitar la lectura, se utiliza la función `imprimir_en_caja`, que formatea cada respuesta del asistente en un cuadro de texto limpio y ordenado.

Este paso nos permite analizar rápidamente la calidad, precisión y el tono de las respuestas, asegurando que el sistema esté listo para interactuar con los usuarios.

In [13]:
# =============================================================================
# PRUEBAS Y VALIDACIÓN (CON FORMATO DE SALIDA MEJORADO)
# =============================================================================

def imprimir_en_caja(texto: str, ancho_caja: int = 80):
    """
    Toma un string largo y lo imprime dentro de una caja de texto con
    saltos de línea automáticos.
    """
    # El ancho del texto debe ser menor para dejar espacio a los bordes
    ancho_texto = ancho_caja - 4

    # Usamos textwrap para dividir el texto en líneas del ancho correcto
    lineas_envueltas = textwrap.wrap(texto, width=ancho_texto)

    # Imprimimos la parte superior de la caja
    print("╭" + "─" * (ancho_caja - 2) + "╮")

    # Imprimimos cada línea de texto dentro de los bordes
    for linea in lineas_envueltas:
        print(f"│ {linea.ljust(ancho_texto)} │")

    # Imprimimos la parte inferior de la caja
    print("╰" + "─" * (ancho_caja - 2) + "╯")


# --- Lista de Preguntas para la Validación ---
preguntas_de_prueba = [
    "¿Cómo superar la ansiedad al dejar de fumar?",
    "¿Qué es la adicción al tabaco?",
    "¿Cuándo es grave el deseo de fumar?",
    "¿Cuáles son los sintomas de la abstinencia de nicotina?",
    "Si no fumo siento que me muero",
    "Mis padres siempre fumaron, yo por que deberia dejarlo?",
    "Si dejo de fumar, podria ser rico?",
    "Tengo Hambre y quiero una pizza y un tabaco",
    "cada que me fumo un porro siento que vuelo, me gusta sentirlo",
    "Si dejo de fumar podria gustarle mas a las damas?",
    "Mi tia fuma muchisimo tiene 70 años y tiene los globulos rojos muy bajos, podria morise?"
]

# --- Bucle de Ejecución de Pruebas con el Nuevo Formato ---
CIAN, VERDE, RESET, BOLD = "\033[96m", "\033[92m", "\033[0m", "\033[1m"
SEPARADOR = "=" * 80

if 'rag_chain' in locals():
    print(SEPARADOR)
    print(f"🤖 {BOLD}INICIANDO BATERÍA DE PRUEBAS CON RESPUESTAS CORTAS Y FORMATEADAS...{RESET} 🤖")
    print(SEPARADOR)

    for i, pregunta in enumerate(preguntas_de_prueba):
        print(f"\n{BOLD}Pregunta ({i+1}/{len(preguntas_de_prueba)}):{RESET} {CIAN}{pregunta}{RESET}")

        respuesta = rag_chain.invoke(pregunta)

        print(f"\n{BOLD}Respuesta del Asistente:{RESET}")
        # ¡Llamamos a nuestra nueva función de formato!
        imprimir_en_caja(respuesta)
else:
    ROJO = "\033[91m"
    print(f"{ROJO}❌ Error: La variable 'rag_chain' no está definida.{RESET}")

🤖 [1mINICIANDO BATERÍA DE PRUEBAS CON RESPUESTAS CORTAS Y FORMATEADAS...[0m 🤖

[1mPregunta (1/11):[0m [96m¿Cómo superar la ansiedad al dejar de fumar?[0m

[1mRespuesta del Asistente:[0m
╭──────────────────────────────────────────────────────────────────────────────╮
│ 1. Identifica las causas de tus ansias de fumar.     2. Aprende técnicas de  │
│ enfrentamiento, como la relajación o la meditación.     3. Utiliza           │
│ distracciones y reemplazos, como el ejercicio o jugar a un juego.            │
╰──────────────────────────────────────────────────────────────────────────────╯

[1mPregunta (2/11):[0m [96m¿Qué es la adicción al tabaco?[0m

[1mRespuesta del Asistente:[0m
╭──────────────────────────────────────────────────────────────────────────────╮
│ La adicción al tabaco se produce al consumir nicotina, una sustancia         │
│ presente en el tabaco, que actúa sobre el sistema nervioso central y crea    │
│ una dependencia. Esto puede llevar a síntomas de abstine

You seem to be using the pipelines sequentially on GPU. In order to maximize efficiency please use a dataset



[1mRespuesta del Asistente:[0m
╭──────────────────────────────────────────────────────────────────────────────╮
│ La evidencia no especifica si el desprendimiento de la costumbre de fumar    │
│ tiene un efecto particular en la atracción de las damas. En cambio, se puede │
│ enfocar en el bienestar personal y los beneficios de dejar de fumar, como    │
│ mayor energía y economía.                                                    │
╰──────────────────────────────────────────────────────────────────────────────╯

[1mPregunta (11/11):[0m [96mMi tia fuma muchisimo tiene 70 años y tiene los globulos rojos muy bajos, podria morise?[0m

[1mRespuesta del Asistente:[0m
╭──────────────────────────────────────────────────────────────────────────────╮
│ 1. Sí, el fumar en grandes cantidades puede aumentar el riesgo de problemas  │
│ de salud, incluso en personas mayores.     2. Sin embargo, no puedo decir si │
│ su tía morirá debido a su edad y el fumar, solo que es importante que tome  

# 🤖 Chatbot

### **🚀 Lanzamiento de la Interfaz Interactiva con Gradio**

En este paso final, damos vida a nuestro sistema `RAG` creando una aplicación web simple e intuitiva con la biblioteca `Gradio`. Esto permite que cualquier usuario pueda interactuar con nuestro asistente de una manera amigable y sin necesidad de ejecutar código.

La implementación se divide en dos partes principales:

#### **1. La Lógica de Conexión: La Función `chat_with_rag`**

Se define una función simple que actúa como un **puente seguro** entre la interfaz de usuario y nuestra cadena `RAG`. Su única responsabilidad es recibir la pregunta del usuario desde la interfaz, pasarla a la cadena para su procesamiento y devolver la respuesta generada.

#### **2. La Creación de la Interfaz: `gr.Interface`**

El componente `gr.Interface` es el constructor principal de la aplicación. Se configura con los siguientes parámetros clave para definir su apariencia y comportamiento:

* **`fn=chat_with_rag`**: Conecta la **lógica del backend** (nuestra función) con la interfaz visible para el usuario.
* **`inputs`**: Define el componente de entrada. En este caso, un **campo de texto (`gr.Textbox`)** donde el usuario escribe su pregunta.
* **`outputs`**: Especifica el componente de salida, que es otro **campo de texto** donde se mostrará la respuesta del asistente.
* **`title` y `description`**: Establecen el **título y la descripción** de la aplicación, explicando su propósito al usuario final.
* **`examples`**: Proporciona una lista de **preguntas de ejemplo** en las que el usuario puede hacer clic para probar el sistema fácilmente y entender qué tipo de consultas puede realizar.

In [14]:
# =============================================================================
# PASO 1: FUNCIÓN DE INFERENCIA (PUENTE ENTRE LANGCHAIN Y GRADIO)
# -----------------------------------------------------------------------------
# Esta función no cambia. Sigue siendo el intermediario seguro que recibe
# la consulta del usuario, la pasa a la cadena RAG y devuelve la respuesta.
# =============================================================================
def chat_with_rag(user_query: str) -> str:
    """
    Ejecuta la cadena RAG con la consulta del usuario y maneja posibles errores.
    """
    try:
        # Invoca la cadena completa con la pregunta del usuario.
        response = rag_chain.invoke(user_query)
        return response
    except Exception as e:
        # Si algo falla, devuelve un mensaje de error claro en la interfaz.
        return f"❌ Ocurrió un error al procesar tu mensaje: {e}"


# =============================================================================
# PASO 2: DEFINICIÓN DE LA INTERFAZ DE USUARIO CON GRADIO
# -----------------------------------------------------------------------------
# Aquí es donde ocurre la magia: cambiamos los textos para adaptar
# la aplicación a su nuevo rol como asistente para dejar de fumar.
# =============================================================================
print("🎨 Construyendo la interfaz de usuario de apoyo...")

iface = gr.Interface(
    # --- Lógica Principal ---
    fn=chat_with_rag,                                # La función que se ejecutará con cada entrada del usuario.

    # --- Componentes de la Interfaz ---
    inputs=gr.Textbox(
        lines=3,                                     # Altura inicial de la caja de texto (en líneas).
        placeholder="Escribe cómo te sientes, una pregunta o pide un consejo...", # Texto guía más empático.
        label="Tu Mensaje o Consulta"                # Etiqueta que aparece sobre la caja de texto.
    ),

    outputs=gr.Textbox(
        label="Respuesta de tu Asistente de Apoyo"    # Etiqueta para la caja de texto de la respuesta.
    ),

    # --- Títulos, Descripción y Ejemplos (ADAPTADOS) ---
    title="❤️ Tu Aliado para Dejar de Fumar",
    description="**Un espacio de apoyo para acompañarte en cada paso de tu camino hacia una vida sin humo. ¡Tú puedes lograrlo!**",

    examples=[
        "Siento mucha ansiedad ahora mismo, ¿qué puedo hacer?",
        "Dame un consejo para mi primer día sin fumar.",
        "Necesito motivación para no recaer este fin de semana.",
        "¿Cuáles son los beneficios de salud inmediatos al dejar el cigarrillo?"
    ]
)


# =============================================================================
# PASO 3: LANZAMIENTO DE LA APLICACIÓN
# -----------------------------------------------------------------------------
# Esta parte no cambia. Inicia el servidor web de Gradio.
# =============================================================================
print("🚀 ¡Lanzando la aplicación de apoyo! Haz clic en el enlace público (Running on public URL) que aparecerá a continuación.")

iface.launch(
    share=True,      # Crea un enlace público temporal (válido por 72 horas) para compartir.
    debug=False      # Poner en True si necesitas ver logs de error detallados en la consola.
)

🎨 Construyendo la interfaz de usuario de apoyo...
🚀 ¡Lanzando la aplicación de apoyo! Haz clic en el enlace público (Running on public URL) que aparecerá a continuación.
Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://cf0fbeb187ee5493e3.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)




# **Conclusiones:**

Claro, aquí tienes el texto formateado en Markdown.

## 6. Conclusiones

La culminación de este proyecto representa un logro significativo en la creación de un asistente de IA funcional y con un propósito claro. Sin embargo, un análisis riguroso revela tanto fortalezas notables como áreas críticas de mejora que son fundamentales para la evolución de este tipo de sistemas.

### a. Análisis Crítico de la Calidad del Sistema

La culminación de este proyecto marca un logro relevante en la creación de un asistente de inteligencia artificial funcional y enfocado. Se cumplió el objetivo central: desarrollar un *“aliado virtual”* que ofrece apoyo empático y basado en evidencia para dejar de fumar, atendiendo así a una motivación personal y social.

Sin embargo, al analizar críticamente el sistema, se aprecian tanto aciertos como limitaciones importantes. Por un lado, el asistente responde de forma efectiva a preguntas directas cuya solución se encuentra explícitamente en los documentos de referencia, demostrando solidez en tareas informativas concretas. No obstante, su desempeño se ve afectado cuando enfrenta consultas ambiguas o contextualmente complejas. En estos casos, el sistema depende excesivamente del contexto textual recuperado y muestra una capacidad de razonamiento limitada.

> Un ejemplo claro se evidenció al consultar sobre fumar un “porro”, donde la IA generó una respuesta irrelevante y moralizante sobre el tabaco, reflejando su falta de comprensión real y su tendencia a sintetizar únicamente el contenido disponible, sin distinguir matices importantes.

En cuanto a la generación de respuestas, el modelo mantiene una corrección gramatical constante y cumple con las instrucciones de formato. Sin embargo, persiste la dificultad para sintetizar información de manera empática y precisa, tendiendo a la repetición y la verbosidad. Ante preguntas emocionales, como *“Si no fumo siento que me muero”*, las respuestas tienden a ser listas extensas y genéricas, en vez de intervenciones personalizadas y empáticas. Además, en ocasiones recurre a estructuras de listas, aunque no estén presentes en las fuentes originales, lo que puede hacer que la interacción resulte forzada y poco natural.

### b. Análisis Comparativo de Modelos LLM

La selección del modelo de lenguaje constituye el factor más determinante en la calidad final del sistema. En este caso, el modelo `mistralai/Mistral-7B-Instruct-v0.2` ofreció un balance notable entre eficiencia y rendimiento, demostrando buena capacidad para entender español y seguir instrucciones específicas, además de ser apto para cuantización y ejecución en entornos limitados como Google Colab. Sin embargo, sus 7 mil millones de parámetros imponen barreras en términos de razonamiento profundo y manejo de matices, tal como quedó de manifiesto en situaciones donde el contexto exigía una interpretación más sofisticada.

Explorando alternativas, los modelos de código abierto más grandes —como `Meta-Llama-3-8B-Instruct` o superiores— podrían haber mejorado el razonamiento, la coherencia y la fluidez conversacional, permitiendo respuestas más ricas y personalizadas. No obstante, estos modelos **requieren recursos computacionales significativamente mayores**, lo que dificulta su uso en plataformas de acceso libre o gratuito.

Por otro lado, los modelos propietarios accesibles vía API, como `GPT-4o` o `Claude 3 Opus`, representan el estado del arte en cuanto a calidad, fluidez y *nuance* casi humana, además de no exigir gestión de hardware local. Sin embargo, su uso implica **costes económicos**, posibles problemas de **latencia** y, sobre todo, plantea importantes **retos éticos y de privacidad**, ya que el envío de datos sensibles a servidores de terceros requiere precauciones adicionales.

### c. Reflexión Final y Visión a Futuro

Para el **Equipo 18**, la experiencia de desarrollar este chatbot ha sido reveladora sobre el potencial de la inteligencia artificial generativa. El proceso demostró que las aplicaciones prácticas de estas tecnologías son vastas y que su impacto puede extenderse tanto en el ámbito personal como profesional.

El sistema desarrollado es, hoy en día, un prototipo robusto y escalable, que sienta las bases para futuras mejoras. De cara al futuro, los siguientes pasos podrían centrarse en:
* Ampliar y depurar la base de conocimientos.
* Explorar el *fine-tuning* del modelo para especializarlo aún más en temas de deshabituación tabáquica.
* Integrar la interfaz con plataformas de mensajería para incrementar su alcance y accesibilidad.

En definitiva, este proyecto no solo ha materializado una idea con impacto social, sino que también ha abierto nuevas perspectivas para la exploración y desarrollo de soluciones basadas en IA.

---
---

# Referencias

Alles, P. M. (2019). *Dejar de fumar con FUMABOOK: el fin de una adicción*.

Amat, S. L. (2010). *Guía para dejar de fumar: Un método eficaz que ha funcionado con millones de personas*. Amat Editorial.

Artifex Software Inc. (2025). *PyMuPDF* (Versión 1.24.7) [Software]. [https://pypi.org/project/PyMuPDF/](https://pypi.org/project/PyMuPDF/)

AWS. (2025). *What is retrieval augmented generation?* Amazon Web Services. Recuperado el 23 de junio de 2025, de [https://aws.amazon.com/es/what-is/retrieval-augmented-generation/](https://aws.amazon.com/es/what-is/retrieval-augmented-generation/)

Becoña, E. (s.f.). *Guía Clínica Para Ayudar A Los Fumadores A Dejar De Fumar*.

Becoña, E., & Vázquez, F. L. (1999). Psicopatología del tabaquismo. *Trastornos Adictivos, 1*(1), 27-33. [https://www.elsevier.es/es-revista-trastornos-adictivos-182-articulo-psicopatologia-del-tabaquismo-13010678](https://www.elsevier.es/es-revista-trastornos-adictivos-182-articulo-psicopatologia-del-tabaquismo-13010678)

Bello S., S., Flores C., A., Bello S., M., & Chamorro R., H. (2009). Diagnóstico y tratamiento psicosocial del tabaquismo. *Revista chilena de enfermedades respiratorias, 25*(4), 218-230. [https://dx.doi.org/10.4067/S0717-73482009000400003](https://dx.doi.org/10.4067/S0717-73482009000400003)

Carr, A. (2004). *Es fácil dejar de fumar, si sabes cómo*. Espasa Calpe Mexicana, S.A.

Carrel, H. (2022). *Dejar de Fumar Fácil: El manual definitivo*.

Centers for Disease Control and Prevention. (2020). *¡Felicitaciones por haber decidido dejar de fumar! Guía del consumidor*. Recuperado el 23 de junio de 2025, de [https://www.cdc.gov/tobacco-surgeon-general-reports/media/pdfs/2024/03/2020-consumer-guide-spanish-508.pdf](https://www.cdc.gov/tobacco-surgeon-general-reports/media/pdfs/2024/03/2020-consumer-guide-spanish-508.pdf)

Chase, H. (2024). *LangChain* (Versión 0.2.10) [Software]. [https://github.com/langchain-ai/langchain](https://github.com/langchain-ai/langchain)

Fiorenza, A. (2005). *Dejar de fumar es muy fácil -- todo fumador lo consigue un montón de veces: estrategias para dejar de intoxicarse y autoengañarse* (J. C. Gentile Vitale, Trad.). Integral / RBA Libros.

Gobierno de Aragón. (s.f.). *Guía para dejar de fumar*. Recuperado el 23 de junio de 2025, de [https://www.aragon.es/documents/20127/674325/GUIA_DEJAR_DE_FUMAR.pdf/1d07dd87-a7a1-a784-19ea-1b1514d916af](https://www.aragon.es/documents/20127/674325/GUIA_DEJAR_DE_FUMAR.pdf/1d07dd87-a7a1-a784-19ea-1b1514d916af)

Gobierno de Argentina. (2017). *Manual de autoayuda para dejar de fumar*. Recuperado el 23 de junio de 2025, de [https://www.argentina.gob.ar/sites/default/files/bancos/2018-10/0000000584cnt-2017-05_manual-autoayuda-dejar-de-fumar.pdf](https://www.argentina.gob.ar/sites/default/files/bancos/2018-10/0000000584cnt-2017-05_manual-autoayuda-dejar-de-fumar.pdf)

Hernández, E. (2013). *Cómo dejar de fumar ¡definitivamente! y prevenir otras adicciones*. Editorial Trillas, S.A. de C.V.

IBM. (2025). *Generative AI in Action*. IBM SkillsLab. Recuperado el 23 de junio de 2025, de [https://www.ibm.com/academic/topic/artificial-intelligence?ach_id=9217fca4-c36f-4e1d-ab87-da43469344a5](https://www.ibm.com/academic/topic/artificial-intelligence?ach_id=9217fca4-c36f-4e1d-ab87-da43469344a5)

Infocop. (s.f.). *Guía para dejar de fumar de forma saludable*. Consejo General de la Psicología de España. Recuperado el 23 de junio de 2025, de [https://www.infocoponline.es/pdf/Guia-para-dejar-de-fumar-de-forma-saludable.pdf](https://www.infocoponline.es/pdf/Guia-para-dejar-de-fumar-de-forma-saludable.pdf)

Johnson, J., Douze, M., & Jégou, H. (2019). *Billion-scale similarity search with GPUs*. ArXiv. [https://arxiv.org/abs/1702.08734](https://arxiv.org/abs/1702.08734)

Lewis, S., & Brizer, D. (2015). *Dejar de fumar para Dummies*. Grupo Planeta.

Lung Health Foundation. (s.f.). *Journey to Quit*. Recuperado el 23 de junio de 2025, de [https://lunghealth.ca/wp-content/uploads/2021/05/Journey_to_Quit.pdf](https://lunghealth.ca/wp-content/uploads/2021/05/Journey_to_Quit.pdf)

Mayo Clinic. (s.f.). *Dejar de fumar: 10 formas de resistir el deseo de consumir tabaco*. Recuperado el 23 de junio de 2025, de [https://www.mayoclinic.org/es/diseases-conditions/nicotine-dependence/in-depth/nicotine-craving/art-20045454?p=1](https://www.mayoclinic.org/es/diseases-conditions/nicotine-dependence/in-depth/nicotine-craving/art-20045454?p=1)

MedlinePlus. (s.f.). *Programas de apoyo para dejar de fumar*. Recuperado el 23 de junio de 2025, de [https://medlineplus.gov/spanish/ency/article/007440.htm](https://medlineplus.gov/spanish/ency/article/007440.htm)

Ministerio de Sanidad, Consumo y Bienestar Social de España. (s.f.). *Guía de bolsillo para ayudarte a dejar de fumar*. Recuperado el 23 de junio de 2025, de [https://www.sanidad.gob.es/areas/promocionPrevencion/tabaco/ciudadania/dejarDeFumar/docs/guiaTabaco.pdf](https://www.sanidad.gob.es/areas/promocionPrevencion/tabaco/ciudadania/dejarDeFumar/docs/guiaTabaco.pdf)

National Institute on Drug Abuse. (2025a, enero 30). *¿En qué consisten los tratamientos para la dependencia del tabaco?* Recuperado el 23 de junio de 2025, de [https://nida.nih.gov/es/publicaciones/serie-de-reportes/adiccion-al-tabaco/hay-tratamientos-eficaces-para-la-adiccion-al-tabaco](https://nida.nih.gov/es/publicaciones/serie-de-reportes/adiccion-al-tabaco/hay-tratamientos-eficaces-para-la-adiccion-al-tabaco)

National Institute on Drug Abuse. (2025b). *Reporte de investigación: Adicción al tabaco*. Recuperado el 23 de junio de 2025, de [https://nida.nih.gov/es/publicaciones/serie-de-reportes/adiccion-al-tabaco/introduccion](https://nida.nih.gov/es/publicaciones/serie-de-reportes/adiccion-al-tabaco/introduccion)

Nebraska Department of Health and Human Services. (s.f.). *Hablando con los pacientes sobre fumar y las enfermedades crónicas*. Recuperado el 23 de junio de 2025, de [https://dhhs.ne.gov/TFN%20Quitline%20Resources/Talking%20To%20Patients%20About%20Smoking%20And%20Chronic%20Disease%20](https://dhhs.ne.gov/TFN%20Quitline%20Resources/Talking%20To%20Patients%20About%20Smoking%20And%20Chronic%20Disease%20)–%20Spanish.pdf

Office of Disease Prevention and Health Promotion. (s.f.). *Deja de fumar*. MiBuscadorDeSalud. Recuperado el 23 de junio de 2025, de [https://odphp.health.gov/espanol/myhealthfinder/problemas-salud/diabetes/deja-fumar](https://odphp.health.gov/espanol/myhealthfinder/problemas-salud/diabetes/deja-fumar)

Organización Panamericana de la Salud. (s.f.). *Manual para el tratamiento del tabaquismo*. Recuperado el 23 de junio de 2025, de [https://iris.paho.org/bitstream/handle/10665.2/52141/9789275321805_spa.pdf](https://iris.paho.org/bitstream/handle/10665.2/52141/9789275321805_spa.pdf)

Ortemberg, A. (2000). *Quiero Dejar De Fumar...Para Siempre!* Océano Grupo Editorial.

Pérez-Pareja, F. J., García-Pazo, P., Jiménez, R., Escalas, T., & Gervilla, E. (2020). Dejar de fumar, terapia cognitivo-conductual y perfiles diferenciales con árboles de decisión. *Clínica y Salud, 31*(3), 137-145. [https://dx.doi.org/10.5093/clysa2020a12](https://dx.doi.org/10.5093/clysa2020a12)

Plena Inclusión. (s.f.). *Guía para dejar de fumar*. Recuperado el 23 de junio de 2025, de [https://www.laspalmasgc.es/web/bibliojoven/Salud/Adicciones/Drogas/Fumar/GUIA%20DEJAR%20FUMAR-PLENA%20INCLUSION.pdf](https://www.laspalmasgc.es/web/bibliojoven/Salud/Adicciones/Drogas/Fumar/GUIA%20DEJAR%20FUMAR-PLENA%20INCLUSION.pdf)

Python Software Foundation. (2025). *Python programming language* (Versión 3.11) [Software]. [https://www.python.org](https://www.python.org)

Quit Coach. (s.f.). *Usted puede dejar de fumar. Le enseñaremos cómo*.

Reimers, N., & Gurevych, I. (2019). *Sentence-BERT: Sentence embeddings using siamese BERT-networks*. ArXiv. [https://arxiv.org/abs/1908.10084](https://arxiv.org/abs/1908.10084)

Rodríguez Machain, A. C., Martínez Vélez, N. A., Juárez García, F., López Lugo, E. K., Carreño García, S., & Medina-Mora, M. E. (2008). Relación entre el consumo de tabaco, salud mental y malestares físicos en hombres trabajadores de una empresa textil mexicana. *Salud mental, 31*(4), 291-297. [http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S0185-33252008000400006&lng=es&tlng=es](http://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S0185-33252008000400006&lng=es&tlng=es)

Rowshan, A. (2006). *El Método Rowshan Para Dejar De Fumar: La Solución Definitiva Para Todos Los Fumadores*. Planeta Publishing.

Seoane, A. (2014). *Consigue dejar de fumar con el Doctor Fum: Utiliza el método de la Reducción Gradual Asistida*. Grupo Planeta.

Serrano Pérez, A. (2022). *LA CONSTANCIA QUE ME PARIÓ: El libro ideal para los hombres y mujeres del mañana*.

Squarespace. (s.f.). *Quit Smoking Book*. Recuperado el 23 de junio de 2025, de [https://static1.squarespace.com/static/53c1a2cce4b0e88e61f99b70/t/55dfc3eee4b0fdcdad526ee1/1440728046928/QUIT_SMOKING_BOOK.pdf](https://static1.squarespace.com/static/53c1a2cce4b0e88e61f99b70/t/55dfc3eee4b0fdcdad526ee1/1440728046928/QUIT_SMOKING_BOOK.pdf)

Trebilcock, J., & Corvalán, M. P. (2018). Tabaquismo y Salud Mental. *Revista chilena de neuro-psiquiatría, 56*(3), 147-150. [https://dx.doi.org/10.4067/s0717-92272018000300147](https://dx.doi.org/10.4067/s0717-92272018000300147)

U.S. Department of Veterans Affairs. (s.f.). *Mi Libro de Trabajo Para Dejar de Fumar*. Recuperado el 23 de junio de 2025, de [https://www.mentalhealth.va.gov/quit-tobacco/docs/My-Smoking-Workbook-508.pdf](https://www.mentalhealth.va.gov/quit-tobacco/docs/My-Smoking-Workbook-508.pdf)

Ünübol, H., & Hızlı Sayar, G. (2019). Psychological factors associated with smoking and quitting: addiction map of Turkey study. *Neuropsychiatric Disease and Treatment, 15*, 1971–1982. [https://doi.org/10.2147/NDT.S204167](https://doi.org/10.2147/NDT.S204167)

Wolf, T., Debut, L., Sanh, V., Chaumond, J., Delangue, C., Moi, A., Cistac, P., Rault, T., Louf, R., Funtowicz, M., & Brew, J. (2020). *Transformers: State-of-the-art natural language processing*. ArXiv. [https://arxiv.org/abs/1910.03771](https://arxiv.org/abs/1910.03771)

# **Fin de la actividad chatbot: LLM + RAG**