<a href="https://colab.research.google.com/github/jrebull/NLP/blob/main/DejardeFumar_2AJARCADA.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Procesamiento de Lenguaje Natural**

## Maestría en Inteligencia Artificial Aplicada
#### Tecnológico de Monterrey
#### Prof Luis Eduardo Falcón Morales

### **Adtividad en Equipos: sistema LLM + RAG**

### **Equipo 18**
> ### 👨‍💻 **Juan Carlos Pérez Nava**
> `A01795941`
>
> ### 👨‍💻 **Javier Augusto Rebull Saucedo**
> `A01795838`
>
> ### 👩‍💻 **Sihiní Trinidad Sánchez**
> `A00889358`
>
> ### 👩‍💻 **Iris Monserrat Urbina Casas**
> `A01795999`



* ##### **El formato de este cuaderno de Jupyter es libre, pero debe incuir al menos las siguientes secciones:**

  * ##### **Introducción de la problemática a resolver.**
  * ##### **Sistema RAG + LLM**
  * ##### **El chatbot, incluyendo ejemplos de prueba.**
  * ##### **Conclusiones**

* ##### **Pueden importar los paquetes o librerías que requieran.**

* ##### **Pueden incluir las celdas y líneas de código que deseen.**

# Introducción de la problemática a resolver

En las áreas operativas del Instituto Mexicano del Seguro Social existen diversas oportunidades de mejora en la atención al público, la resolución de problemas y el entendimiento del negocio y sus procedimientos. Por ello, se ha diseñado la integración de normas, reglas y procedimientos específicos para la atención en cada una de las ventanillas de la Dirección de Incorporación y Recaudación, encargada de recibir las solicitudes de registro de los patrones y sus trabajadores, así como de gestionar la recaudación de las aportaciones patronales.

Como parte de esta solución, se han incorporado documentos detallados que explican los procedimientos clave, como el trámite de alta de registro patronal. Además, estos documentos contienen instrucciones precisas sobre las acciones a seguir ante posibles errores en el sistema, garantizando que cada situación sea atendida de manera eficiente y conforme a la normatividad vigente.

Esta iniciativa tiene como objetivo proporcionar una herramienta que facilite la comprensión de cada etapa del proceso, permitiendo a los usuarios identificar, entender y resolver cualquier situación que pueda impedir la conclusión satisfactoria de su trámite.



# Sistema RAG + LLM

**Retrieval-Augmented Generation (RAG**)

Según AWS (2025) y el contenido del curso de IBM de Generative AI in Action, encontramos que RAG es un enfoque diseñado para mejorar la precisión y actualidad de los modelos de lenguaje grande (LLMs) que generan respuestas basadas en texto.

**¿Cómo funciona RAG?**

RAG incorpora un mecanismo de recuperación de información antes de generar una respuesta, lo que permite que el modelo se base en datos actualizados y verificables:
- El LLM recibe una pregunta del usuario.
- Antes de responder, consulta un repositorio de información actualizado, que puede ser una fuente abierta como la web o una base de datos específica.
- Genera la respuesta basada en los datos recuperados, proporcionando evidencia o fuentes verificables para respaldar su contenido

**Beneficios de RAG**

- Mayor precisión y actualidad: Evita respuestas erróneas o desactualizadas al basarse en información reciente.
- Reducción de "alucinaciones": Minimiza la generación de datos inventados por el modelo.
- Mayor confiabilidad: Permite que el modelo reconozca cuando no tiene una respuesta confiable, evitando la generación de información incorrecta

Para que RAG funcione de manera óptima, el sistema de recuperación debe ser eficiente y proporcionar datos relevantes y de alta calidad. Si la información recuperada es insuficiente o poco precisa, el modelo podría no responder correctamente, incluso si la respuesta existe en alguna fuente confiable

Referencias:
AWS. (2025). What is retrieval augmented generation? Recuperado el 15 de junio de 2025 de:
https://aws.amazon.com/es/what-is/retrieval-augmented-generation/

IBM. (2025). Generative AI in Action. IBM SkillsLab. Recuperado el 15 de junio de 2025 de: https://www.ibm.com/academic/topic/artificial-intelligence?ach_id=9217fca4-c36f-4e1d-ab87-da43469344a5Links

# Instalación de librerías

In [1]:
# =============================================================================
# SECCIÓN 1: CORE DE APRENDIZAJE PROFUNDO (DEBE IR PRIMERO)
# Fundamentos para la ejecución y optimización de modelos de IA.
# =============================================================================

# PyTorch: El framework base para todos los cálculos de redes neuronales.
!pip install torch --quiet

# Transformers: Para descargar y utilizar modelos de lenguaje de Hugging Face.
!pip install transformers --quiet

# Accelerate: Utilidad de Hugging Face para ejecutar modelos grandes de forma eficiente en cualquier hardware (GPU, TPU, multi-GPU).
!pip install accelerate --quiet

# BitsAndBytes: Permite la "cuantización" de modelos, una técnica clave para cargar modelos enormes en GPUs con memoria limitada.
!pip install bitsandbytes --quiet

# =============================================================================
# SECCIÓN 2: FRAMEWORK DE ORQUESTACIÓN Y MANEJO DE DATOS (RAG)
# Herramientas para construir la lógica de la aplicación y manejar datos vectoriales.
# =============================================================================

# LangChain: El framework principal para conectar componentes y construir la lógica de la aplicación de IA.
!pip install langchain --quiet

# LangChain Community: Módulo con todas las integraciones de terceros para LangChain (modelos, bases de datos, APIs).
!pip install langchain-community --quiet

# --- ¡LÍNEA AÑADIDA! --- Esta es la librería que faltaba para HuggingFaceEmbeddings.
!pip install langchain-huggingface --quiet

# Sentence-Transformers: Librería optimizada para crear embeddings de alta calidad a partir de texto.
!pip install sentence-transformers --quiet

# FAISS (CPU): Base de datos vectorial de alta velocidad para buscar y recuperar los embeddings más relevantes.
!pip install faiss-cpu --quiet

# =============================================================================
# SECCIÓN 3: UTILIDADES (ENTRADA/SALIDA)
# Herramientas para la interacción con el usuario y la lectura de archivos.
# =============================================================================

# PyMuPDF: Una de las librerías más rápidas y eficientes para extraer texto e imágenes de documentos PDF.
!pip install PyMuPDF --quiet

# pypdf: Una alternativa popular y robusta para la manipulación de archivos PDF.
!pip install pypdf --quiet

# Gradio: Para crear de forma sencilla y rápida una interfaz de usuario web y poder interactuar con tu modelo.
!pip install gradio --quiet


print("─" * 50)
print("🤖🤝💻   Equipo Sihino   💻🤝🤖")
print("✅ 🔋  Librerías Instaladas  🔋 ✅")
print("─" * 50)

[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m363.4/363.4 MB[0m [31m3.4 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m13.8/13.8 MB[0m [31m114.3 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m24.6/24.6 MB[0m [31m91.1 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m883.7/883.7 kB[0m [31m56.9 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m664.8/664.8 MB[0m [31m2.2 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m211.5/211.5 MB[0m [31m4.8 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m56.3/56.3 MB[0m [31m41.2 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m127.9/127.9 MB[0m [31m18.2 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━

🔹 Librerías para Retrieval-Augmented Generation (RAG)

Estas bibliotecas permiten cargar documentos, dividirlos en fragmentos y representarlos como vectores para una búsqueda eficiente.
- `TextLoader`: Carga documentos de texto.
- `CharacterTextSplitter` y `RecursiveCharacterTextSplitter`: Dividen los documentos en fragmentos más pequeños para su procesamiento.
- `HuggingFaceEmbeddings`: Convierte texto en representaciones vectoriales mediante modelos de embeddings.
- `FAISS`: Motor de búsqueda basado en índices de vectores, diseñado para recuperar información de manera rápida y eficiente.

🔹 Librerías para el Modelo de Lenguaje Grande (LLM)

Estas herramientas permiten generar respuestas utilizando modelos de lenguaje basados en Transformers.
- `AutoModelForCausalLM` y `AutoTokenizer`: Cargan y configuran el modelo de generación de texto.
- `BitsAndBytesConfig`: Optimiza la ejecución del modelo para reducir el consumo de memoria.
- `pipeline`: Establece un flujo de procesamiento que facilita la generación de texto.
- `torch`: Biblioteca de aprendizaje profundo utilizada para el manejo y ejecución de modelos de lenguaje.



In [6]:
# =============================================================================
# SECCIÓN 1: LIBRERÍAS ESTÁNDAR, DE SISTEMA Y VISUALIZACIÓN
# =============================================================================
import os                          # Para interactuar con el sistema operativo (rutas de archivos, etc.).
import re                          # Para trabajar con expresiones regulares (limpieza de texto).
from pathlib import Path           # Para manejar rutas de archivos de forma moderna y orientada a objetos.
import gdown                       # Para descargar archivos directamente desde Google Drive.
import fitz                        # El nombre de importación de PyMuPDF, para leer archivos PDF.
import torch                       # Framework principal de Deep Learning (PyTorch).
import gradio as gr                # Para construir la interfaz de usuario web interactiva.

# --- Herramientas de Visualización en el Notebook ---
from IPython.display import display, HTML # Para renderizar salidas enriquecidas (como tablas HTML) en Colab.


# =============================================================================
# SECCIÓN 2: LIBRERÍAS DE HUGGING FACE Y TRANSFORMERS
# Para cargar el modelo de lenguaje, el tokenizador y gestionar la autenticación.
# =============================================================================
from huggingface_hub import login
from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig, pipeline

# --- ACCIÓN: Login a Hugging Face (Método Seguro) ---
# Importamos la herramienta de Colab para acceder a los "Secrets" guardados.
from google.colab import userdata

# Obtenemos el token guardado de forma segura y nos logueamos.
HF_TOKEN = userdata.get('HF_TOKEN')
if HF_TOKEN:
    login(token=HF_TOKEN)
else:
    print("⚠️  Advertencia: No se encontró el token de Hugging Face. El login ha sido omitido.")


# =============================================================================
# SECCIÓN 3: COMPONENTES DE LANGCHAIN
# Todas las piezas necesarias de LangChain para construir el sistema RAG.
# =============================================================================

# 3.1: Carga y División de Documentos (Document Processing)
from langchain.document_loaders import TextLoader
from langchain.text_splitter import CharacterTextSplitter, RecursiveCharacterTextSplitter

# 3.2: Creación de Embeddings y Base de Datos Vectorial (Vectorization & Storage)
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_community.vectorstores import FAISS

# 3.3: Modelo de Lenguaje, Prompts y Cadena Final (LLM & Chains)
from langchain_community.llms import HuggingFacePipeline
from langchain.prompts import PromptTemplate
from langchain.schema.runnable import RunnablePassthrough
from langchain.schema import StrOutputParser

# =============================================================================
# CONFIRMACIÓN DE CARGA
# =============================================================================
print("─" * 50)
print("🤖🤝💻   Equipo Sihino   💻🤝🤖")
print("✅ 🔋  Librerías Cargadas  🔋 ✅")
print("⚡️🚀 ¡Listos para la Acción! 🚀⚡️")
print("─" * 50)

──────────────────────────────────────────────────
🤖🤝💻   Equipo Sihino   💻🤝🤖
✅ 🔋  Librerías Cargadas  🔋 ✅
⚡️🚀 ¡Listos para la Acción! 🚀⚡️
──────────────────────────────────────────────────


In [13]:
# =============================================================================
# CELDA 3: CONFIGURACIÓN GLOBAL DEL SISTEMA RAG
# =============================================================================
# --- 1. Selección de Modelos ---
EMBEDDING_MODEL_NAME = "sentence-transformers/all-MiniLM-L6-v2"
LLM_MODEL_NAME = "mistralai/Mistral-7B-Instruct-v0.2"

# --- 2. Rutas y Orígenes de Datos ---
DIRECTORIO_DOCUMENTOS = 'datos_RAG_LLM'
ID_REPOSITORIO_GDRIVE = '1L_5UCoUzXNJQRPXXByE7u4YjlJ71wEYs' # ID de tu carpeta de Drive

# --- 3. Parámetros de Procesamiento de Texto (Chunking) ---
CHUNK_SIZE = 3000
CHUNK_OVERLAP = 500

# --- Función de Verificación ---
def mostrar_resumen_configuracion():
    VERDE, CIAN, RESET, BOLD = "\033[92m", "\033[96m", "\033[0m", "\033[1m"
    SEPARADOR = "=" * 70
    print(SEPARADOR)
    print(f"🚀 {BOLD}{VERDE}CONFIGURACIÓN DEL EQUIPO SIHINO CARGADA{RESET} 🚀")
    print(SEPARADOR)
    print(f"🧠 {BOLD}Modelos:{RESET}\n   - Embedding: {CIAN}{EMBEDDING_MODEL_NAME}{RESET}\n   - LLM: {CIAN}{LLM_MODEL_NAME}{RESET}")
    print(f"\n📁 {BOLD}Datos:{RESET}\n   - Directorio: {CIAN}{DIRECTORIO_DOCUMENTOS}{RESET}\n   - GDrive ID: {CIAN}{ID_REPOSITORIO_GDRIVE}{RESET}")
    print(f"\n⚙️  {BOLD}Chunking:{RESET}\n   - Tamaño: {CIAN}{CHUNK_SIZE}{RESET}\n   - Superposición: {CIAN}{CHUNK_OVERLAP}{RESET}")
    print("\n" + SEPARADOR)

mostrar_resumen_configuracion()

🚀 [1m[92mCONFIGURACIÓN DEL EQUIPO SIHINO CARGADA[0m 🚀
🧠 [1mModelos:[0m
   - Embedding: [96msentence-transformers/all-MiniLM-L6-v2[0m
   - LLM: [96mmistralai/Mistral-7B-Instruct-v0.2[0m

📁 [1mDatos:[0m
   - Directorio: [96mdatos_RAG_LLM[0m
   - GDrive ID: [96m1L_5UCoUzXNJQRPXXByE7u4YjlJ71wEYs[0m

⚙️  [1mChunking:[0m
   - Tamaño: [96m3000[0m
   - Superposición: [96m500[0m



In [14]:
# =============================================================================
# DESCARGA DE DOCUMENTOS DESDE GOOGLE DRIVE
# -----------------------------------------------------------------------------
# Este bloque utiliza el ID de la carpeta de Drive para descargar todos
# los archivos que contiene en un directorio local de Colab.
# =============================================================================

# --- 2. Proceso de Descarga ---

print(f"📥 Iniciando la descarga desde Google Drive...")
print(f"   - ID de la carpeta: {ID_REPOSITORIO_GDRIVE}")
print(f"   - Directorio de destino: '{DIRECTORIO_DOCUMENTOS}'")

# Usamos gdown para descargar el contenido de la carpeta en nuestro directorio local.
# 'quiet=False' nos mostrará el progreso de la descarga.
# 'output' especifica dónde guardar los archivos.
gdown.download_folder(id=ID_REPOSITORIO_GDRIVE, output=DIRECTORIO_DOCUMENTOS, quiet=False)

print(f"\n✅ ¡Descarga completada con éxito!")


# --- 3. Verificación (Opcional pero recomendado) ---

# Listamos los archivos en el directorio para confirmar que todo está en su lugar.
print("\n📄 Contenido de la carpeta local:")
try:
    archivos_descargados = os.listdir(DIRECTORIO_DOCUMENTOS)
    if not archivos_descargados:
        print("   -> La carpeta está vacía. Revisa los permisos de la carpeta en Google Drive.")
    else:
        for filename in archivos_descargados:
            print(f"   - {filename}")
except FileNotFoundError:
    print(f"   -> ¡Error! No se encontró el directorio '{DIRECTORIO_DOCUMENTOS}'.")

📥 Iniciando la descarga desde Google Drive...
   - ID de la carpeta: 1L_5UCoUzXNJQRPXXByE7u4YjlJ71wEYs
   - Directorio de destino: 'datos_RAG_LLM'


Retrieving folder contents


Processing file 1qtF7I7rO8lJREVYvnjlBPcoNrsAahWDs 0000000584cnt-2017-05_manual-autoayuda-dejar-de-fumar.pdf
Processing file 1mn_xzxihGPvmVskXtK_X9fZ61ACRM_Ky 0717-7348-rcher-33-03-0186.pdf
Processing file 1nsy03tgluF4YaIArersMj0QoH3ngTJ7g 0717-9227-rchnp-56-03-0147.pdf
Processing file 1QZSv_aXnfJDx4jRmTlRlFVd_lZE8MjEx 1130-5274-clinsa-31-3-0137.pdf
Processing file 154EJRnfCLhbkQSRPaHoBtxK0yr0AXaDg 2020-consumer-guide-spanish-508.pdf
Processing file 1t07t7kq-EGw67zuAhdAtJadi8lIgiAPy 2436.pdf
Processing file 1aHfgaDAjOM6yM7SHyIercL9XDDSqpMXy 180618320005.pdf
Processing file 1f7VYzZVFi4Fn7gzGcvTrkWKyEPNkt-07 9789275321805_spa.pdf
Processing file 1JBWKhqxKK-M2tlYxl0nGjgqSeYRqDAec art03.pdf
Processing file 172Atqry-5pRJ2uYDL_93BSTPTkbPjM2e Cómo dejar de fumar ¡definitivamente! y prevenir otras -- - Eduardo Hernández -- 2a ed_, México, Mexico, 2013 -- Editorial Trillas, S_A_ de C_V.pdf
Processing file 1QF0tkZ3yepwfefzyPQMg_5cA0RvBFG1J Consigue dejar de fumar con el Doctor Fum- Utiliza el 

Retrieving folder contents completed
Building directory structure
Building directory structure completed
Downloading...
From: https://drive.google.com/uc?id=1qtF7I7rO8lJREVYvnjlBPcoNrsAahWDs
To: /content/datos_RAG_LLM/0000000584cnt-2017-05_manual-autoayuda-dejar-de-fumar.pdf
100%|██████████| 11.2M/11.2M [00:00<00:00, 127MB/s]
Downloading...
From: https://drive.google.com/uc?id=1mn_xzxihGPvmVskXtK_X9fZ61ACRM_Ky
To: /content/datos_RAG_LLM/0717-7348-rcher-33-03-0186.pdf
100%|██████████| 267k/267k [00:00<00:00, 101MB/s]
Downloading...
From: https://drive.google.com/uc?id=1nsy03tgluF4YaIArersMj0QoH3ngTJ7g
To: /content/datos_RAG_LLM/0717-9227-rchnp-56-03-0147.pdf
100%|██████████| 102k/102k [00:00<00:00, 82.2MB/s]
Downloading...
From: https://drive.google.com/uc?id=1QZSv_aXnfJDx4jRmTlRlFVd_lZE8MjEx
To: /content/datos_RAG_LLM/1130-5274-clinsa-31-3-0137.pdf
100%|██████████| 259k/259k [00:00<00:00, 94.4MB/s]
Downloading...
From: https://drive.google.com/uc?id=154EJRnfCLhbkQSRPaHoBtxK0yr0AXaDg
To


✅ ¡Descarga completada con éxito!

📄 Contenido de la carpeta local:
   - Dejar de fumar con FUMABOOK- el fin de una adicción- DEJAR -- Alles, P_M_ -- 2019.txt
   - 2436.pdf
   - 2020-consumer-guide-spanish-508.txt
   - 0717-7348-rcher-33-03-0186.txt
   - 1130-5274-clinsa-31-3-0137.pdf
   - Journey_to_Quit Spanish.pdf
   - Guia Clinica Para Ayudar A Los Fumadores A Dejar De Fumar -- Becoa Iglesias Elisardo.txt
   - GUIA_DEJAR_DE_FUMAR.pdf
   - guiaTabaco.txt
   - 1130-5274-clinsa-31-3-0137.txt
   - Reporte de investigación National Institute on Drug Abuse.txt
   - LA CONSTANCIA QUE ME PARIÓ- El libro ideal para los hombres -- ANTONIO SERRANO PÉREZ -- 2022 --.txt
   - Consigue dejar de fumar con el Doctor Fum- Utiliza el método -- Dr_ Alberto Seoane [Seoane, Dr_ Alberto] -- Cuerpo y Salud, Place of publication not.pdf
   - 9789275321805_spa.pdf
   - El Metodo Rowshan Para Dejar De Fumar- Stop Smoking- La -- Arthur Rowshan; Maria del Carmen Bellver -- 1a ed, Barcelona, ©2006 -- Plan


Download completed


In [15]:
# =============================================================================
# EJECUCIÓN: VISUALIZADOR DE DOCUMENTOS PDF
# -----------------------------------------------------------------------------
# Este bloque genera la tabla HTML para mostrar los archivos PDF encontrados.
# Se asume que las librerías necesarias ya han sido importadas.
# =============================================================================

# --- 1. Apuntar al Directorio Correcto ---

# Usamos la variable global que contiene la ruta a nuestros documentos.
DIRECTORIO_DOCUMENTOS = 'datos_RAG_LLM'
print(f"🔎 Escaneando la carpeta: '{DIRECTORIO_DOCUMENTOS}' en busca de archivos PDF...")

# --- 2. Lógica de Búsqueda y Creación de HTML ---

# Convertimos nuestra ruta de texto a un objeto Path para poder trabajar con él.
pdf_folder = Path(DIRECTORIO_DOCUMENTOS)

# Verificamos si la carpeta existe y, si es así, buscamos archivos .pdf
if os.path.exists(pdf_folder):
    pdf_files = sorted(pdf_folder.glob("*.pdf"))
else:
    pdf_files = [] # Si la carpeta no existe, la lista de archivos estará vacía.

# Plantilla de estilos CSS para el diseño premium.
html_template = """
<style>
    .dark-table-container {{
        background: linear-gradient(145deg, #1e1e2e, #2d2d44);
        border-radius: 20px;
        padding: 30px;
        margin: 20px auto;
        max-width: 700px;
        box-shadow: 0 20px 60px rgba(0, 0, 0, 0.8);
        font-family: 'Segoe UI', Tahoma, Geneva, Verdana, sans-serif;
    }}
    .table-title {{
        color: #fff;
        font-size: 26px;
        font-weight: bold;
        text-align: center;
        margin-bottom: 25px;
        text-shadow: 0 0 20px rgba(100, 181, 246, 0.5);
    }}
    .pdf-table {{
        width: 100%;
        border-collapse: collapse;
        background: rgba(255, 255, 255, 0.02);
        border-radius: 15px;
        overflow: hidden;
    }}
    .pdf-table th {{
        background: linear-gradient(90deg, #6366f1, #8b5cf6);
        color: #fff;
        padding: 18px;
        font-weight: bold;
        text-transform: uppercase;
        letter-spacing: 1px;
    }}
    .pdf-table td {{ padding: 16px; color: #e2e8f0; border-bottom: 1px solid rgba(255, 255, 255, 0.05); }}
    .pdf-table tr:hover {{ background: rgba(99, 102, 241, 0.15); cursor: pointer; transition: all 0.3s; }}
    .pdf-table td:last-child {{ color: #60a5fa; font-weight: bold; }}
    .summary, .error-message {{
        margin-top: 20px;
        padding: 15px;
        background: rgba(99, 102, 241, 0.1);
        border-radius: 10px;
        color: #cbd5e1;
        text-align: center;
        font-size: 16px;
    }}
    .summary span {{ color: #a78bfa; font-weight: bold; }}
</style>
"""

# Si se encontraron archivos PDF, se construye la tabla de resultados.
if pdf_files:
    html = html_template + f"""
    <div class="dark-table-container">
        <h2 class="table-title">✨ Recursos PDF Disponibles ✨</h2>
        <table class="pdf-table">
            <tr>
                <th>📚 Documento</th>
                <th>💾 Tamaño</th>
            </tr>
    """

    total_size_mb = 0
    for pdf in pdf_files:
        size_mb = pdf.stat().st_size / (1024 * 1024)
        total_size_mb += size_mb
        clean_name = pdf.stem.replace("_", " ").replace("-", " ").title()
        html += f'<tr><td>{clean_name}</td><td>{size_mb:.2f} MB</td></tr>'

    avg_size_mb = total_size_mb / len(pdf_files)
    html += f"""
        </table>
        <div class="summary">
            Total: <span>{len(pdf_files)} archivos</span> |
            Tamaño Total: <span>{total_size_mb:.2f} MB</span> |
            Promedio: <span>{avg_size_mb:.2f} MB</span>
        </div>
    </div>
    """
# De lo contrario, se muestra el panel de error.
else:
    html = html_template + f"""
    <div class="dark-table-container" style="background: linear-gradient(145deg, #4a2e2e, #5d3d3d);">
        <h2 class="table-title" style="text-shadow: 0 0 20px rgba(246, 120, 120, 0.5);">❌ No se Encontraron Documentos</h2>
        <div class="error-message" style="background: rgba(241, 99, 99, 0.1);">
            La carpeta <strong>'{DIRECTORIO_DOCUMENTOS}'</strong> no existe o no contiene archivos PDF.
            <br><br>
            Asegúrate de haber ejecutado la celda de descarga de Google Drive primero.
        </div>
    </div>
    """

# --- 3. Renderizar el HTML en la Salida de la Celda ---
display(HTML(html))

🔎 Escaneando la carpeta: 'datos_RAG_LLM' en busca de archivos PDF...


📚 Documento,💾 Tamaño
0000000584Cnt 2017 05 Manual Autoayuda Dejar De Fumar,10.65 MB
0717 7348 Rcher 33 03 0186,0.25 MB
0717 9227 Rchnp 56 03 0147,0.10 MB
1130 5274 Clinsa 31 3 0137,0.25 MB
180618320005,0.14 MB
2020 Consumer Guide Spanish 508,7.38 MB
2436,0.10 MB
9789275321805 Spa,0.57 MB
"Consigue Dejar De Fumar Con El Doctor Fum Utiliza El MéTodo Dr Alberto Seoane [Seoane, Dr Alberto] Cuerpo Y Salud, Place Of Publication Not",1.30 MB
"CóMo Dejar De Fumar ¡Definitivamente! Y Prevenir Otras Eduardo HernáNdez 2A Ed , MéXico, Mexico, 2013 Editorial Trillas, S A De C V",10.20 MB


Convertir los archivos PDF descargados en un documento de texto

In [16]:
# =============================================================================
# PROCESAMIENTO Y LIMPIEZA DE DOCUMENTOS PDF
# -----------------------------------------------------------------------------
# Este bloque itera sobre los archivos PDF descargados, extrae su texto,
# lo limpia según varias reglas y lo guarda en archivos .txt.
# =============================================================================

# Definimos códigos de colores para una salida más visual
CIAN = "\033[96m"
VERDE = "\033[92m"
ROJO = "\033[91m"
RESET = "\033[0m"

print(f"{VERDE}Iniciando el proceso de extracción y limpieza de PDFs...{RESET}")

# --- 1. Obtener la lista de documentos PDF ---
# Usamos una "list comprehension" para crear la lista de forma concisa.
try:
    archivos_pdf = [f for f in os.listdir(DIRECTORIO_DOCUMENTOS) if f.lower().endswith(".pdf")]
    if not archivos_pdf:
        print(f"⚠️  No se encontraron archivos PDF en la carpeta '{DIRECTORIO_DOCUMENTOS}'.")
except FileNotFoundError:
    print(f"{ROJO}❌ Error: El directorio '{DIRECTORIO_DOCUMENTOS}' no existe.{RESET}")
    archivos_pdf = []


# --- 2. Bucle principal de procesamiento por cada archivo ---
documentos_procesados = 0
for archivo in archivos_pdf:
    print(f"\n📄 Procesando: {CIAN}{archivo}{RESET}")
    ruta_completa_pdf = os.path.join(DIRECTORIO_DOCUMENTOS, archivo)

    try:
        # --- A. Extracción de todo el texto del PDF ---
        texto_completo = ""
        with fitz.open(ruta_completa_pdf) as documento:
            for pagina in documento:
                texto_completo += pagina.get_text()

        # --- B. Limpieza y filtrado del texto extraído ---

        # 1. Eliminar "guiones blandos" (soft hyphens) que a veces aparecen en los PDFs.
        texto_completo = texto_completo.replace('\xad', '')

        # 2. Dividir el texto completo en líneas individuales.
        lineas_crudas = texto_completo.splitlines()

        # 3. Limpiar cada línea de secuencias de escape no deseadas.
        lineas_sin_secuencias = [re.sub(r'\\[a-zA-Z0-9]{1,6}', '', linea) for linea in lineas_crudas]

        # 4. Filtrar para mantener solo las líneas que aportan valor.
        #    - No están vacías o son solo espacios.
        #    - Contienen más de una palabra (evita encabezados/pies de página simples).
        #    - No son solo un número (evita números de página).
        lineas_utiles = [
            linea for linea in lineas_sin_secuencias
            if linea.strip() and len(linea.strip().split()) > 1 and not linea.strip().isdigit()
        ]

        # --- C. Guardado del archivo .txt resultante ---
        nombre_base = os.path.splitext(archivo)[0]
        nombre_archivo_txt = f"{nombre_base}.txt"
        ruta_archivo_txt = os.path.join(DIRECTORIO_DOCUMENTOS, nombre_archivo_txt)

        with open(ruta_archivo_txt, "w", encoding="utf-8") as f_out:
            f_out.write("\n".join(lineas_utiles))

        print(f"   {VERDE}✅ Texto extraído y guardado en: {CIAN}{nombre_archivo_txt}{RESET}")
        documentos_procesados += 1

    except Exception as e:
        print(f"   {ROJO}❌ Error al procesar el archivo '{archivo}': {e}{RESET}")

# --- 3. Resumen final ---
print("\n" + "="*70)
print(f"✨ {VERDE}Proceso finalizado. Se han procesado {documentos_procesados} de {len(archivos_pdf)} documentos.{RESET} ✨")
print("="*70)

[92mIniciando el proceso de extracción y limpieza de PDFs...[0m

📄 Procesando: [96m2436.pdf[0m
   [92m✅ Texto extraído y guardado en: [96m2436.txt[0m

📄 Procesando: [96m1130-5274-clinsa-31-3-0137.pdf[0m
   [92m✅ Texto extraído y guardado en: [96m1130-5274-clinsa-31-3-0137.txt[0m

📄 Procesando: [96mJourney_to_Quit Spanish.pdf[0m
   [92m✅ Texto extraído y guardado en: [96mJourney_to_Quit Spanish.txt[0m

📄 Procesando: [96mGUIA_DEJAR_DE_FUMAR.pdf[0m
   [92m✅ Texto extraído y guardado en: [96mGUIA_DEJAR_DE_FUMAR.txt[0m

📄 Procesando: [96mConsigue dejar de fumar con el Doctor Fum- Utiliza el método -- Dr_ Alberto Seoane [Seoane, Dr_ Alberto] -- Cuerpo y Salud, Place of publication not.pdf[0m
   [92m✅ Texto extraído y guardado en: [96mConsigue dejar de fumar con el Doctor Fum- Utiliza el método -- Dr_ Alberto Seoane [Seoane, Dr_ Alberto] -- Cuerpo y Salud, Place of publication not.txt[0m

📄 Procesando: [96m9789275321805_spa.pdf[0m
   [92m✅ Texto extraído y guar

# Creación de la base de datos FAISS

Faiss es una biblioteca optimizada para la búsqueda eficiente de similitudes y la agrupación de vectores densos. Incorpora algoritmos avanzados capaces de realizar búsquedas en conjuntos de vectores de cualquier tamaño.

El objetivo es cargar documentos, dividirlos en fragmentos, convertirlos en vectores y almacenarlos en una base de datos FAISS.

1️⃣ Carga del Documento
- `TextLoader` abre el archivo de texto en la ubicación DATA_PATH.
- `loader.load()` lee el contenido y lo almacena en documents.
- Se imprime la cantidad de documentos cargados para verificación.

2️⃣ División del Texto en Fragmentos (chunks)
- `CharacterTextSplitter` divide los documentos en partes de 2000 caracteres con un solapamiento de 50 caracteres.
- Esto ayuda a mejorar las búsquedas sin perder el contexto entre fragmentos.

3️⃣ Carga del Modelo de Embedding
- `HuggingFaceEmbeddings` carga el modelo de embeddings, que convierte texto en vectores numéricos.
- Estos vectores representan el significado de las palabras y permiten búsquedas semánticas.

4️⃣ Creación de la Base de Datos FAISS
- `FAISS.from_documents(docs, embeddings)` crea una base de datos donde cada fragmento de texto se convierte en un vector mediante los embeddings.
- `FAISS` permite hacer búsquedas rápidas y eficientes dentro de este conjunto de datos vectoriales.



In [17]:
# =============================================================================
# CONSTANTES PARA LA CREACIÓN DE LA BASE DE DATOS VECTORIAL
# -----------------------------------------------------------------------------
# Parámetros que controlan cómo se dividen los documentos en fragmentos (chunks).
# =============================================================================
CHUNK_SIZE = 3000      # Tamaño máximo de cada chunk en caracteres.
CHUNK_OVERLAP = 500    # Caracteres de superposición entre chunks para no perder contexto.

In [18]:
def crear_base_vectorial(directorio_docs: str, embedding_model_name: str, chunk_size: int, chunk_overlap: int):
    """
    Carga documentos de texto, los divide en chunks, crea embeddings y construye una base de datos vectorial FAISS.

    Args:
        directorio_docs (str): Ruta al directorio que contiene los archivos .txt.
        embedding_model_name (str): Nombre del modelo de embeddings de Hugging Face.
        chunk_size (int): Tamaño máximo de cada chunk.
        chunk_overlap (int): Superposición de caracteres entre chunks.

    Returns:
        tuple: Una tupla conteniendo el objeto vector_store (FAISS) y el modelo de embeddings.
    """
    # Definimos códigos de colores para la salida
    CIAN = "\033[96m"
    VERDE = "\033[92m"
    ROJO = "\033[91m"
    AMARILLO = "\033[93m"
    RESET = "\033[0m"
    BOLD = "\033[1m"

    print(f"\n{BOLD}{VERDE}--- INICIANDO CREACIÓN DE LA BASE DE DATOS VECTORIAL ---{RESET}")

    # --- PASO 1: Cargar los documentos de texto ---
    print(f"\n{BOLD}1. Cargando documentos desde '{directorio_docs}'...{RESET}")
    if not os.path.exists(directorio_docs):
        raise FileNotFoundError(f"{ROJO}❌ El directorio '{directorio_docs}' no fue encontrado.{RESET}")

    rutas_archivos = sorted([os.path.join(directorio_docs, f) for f in os.listdir(directorio_docs) if f.endswith('.txt')])
    if not rutas_archivos:
        print(f"{AMARILLO}⚠️  No se encontraron archivos .txt en el directorio.{RESET}")
        return None, None

    todos_los_documentos = []
    for ruta in rutas_archivos:
        print(f"   - Cargando: {CIAN}{os.path.basename(ruta)}{RESET}")
        loader = TextLoader(ruta, encoding="utf-8")
        todos_los_documentos.extend(loader.load())

    print(f"{VERDE}✅ Se cargaron {len(todos_los_documentos)} documentos.{RESET}")


    # --- PASO 2: Dividir los documentos en Chunks ---
    print(f"\n{BOLD}2. Dividiendo documentos en chunks...{RESET}")
    text_splitter = RecursiveCharacterTextSplitter(chunk_size=chunk_size, chunk_overlap=chunk_overlap)
    chunks = text_splitter.split_documents(todos_los_documentos)
    print(f"{VERDE}✅ Se crearon {len(chunks)} chunks en total.{RESET}")


    # --- PASO 3: Cargar el modelo de Embeddings ---
    print(f"\n{BOLD}3. Cargando modelo de Embeddings...{RESET}")
    print(f"   - Modelo: {CIAN}{embedding_model_name}{RESET}")
    embeddings = HuggingFaceEmbeddings(model_name=embedding_model_name)
    print(f"{VERDE}✅ Modelo de Embeddings cargado.{RESET}")


    # --- PASO 4: Crear la base de datos vectorial FAISS ---
    print(f"\n{BOLD}4. Creando la base de datos vectorial FAISS...{RESET}")
    vector_store = FAISS.from_documents(chunks, embeddings)
    print(f"{VERDE}✅ Base de datos vectorial creada y poblada con éxito.{RESET}")

    print(f"\n{BOLD}{VERDE}--- PROCESO FINALIZADO ---{RESET}")

    return vector_store, embeddings

# Creación del modelo LLM

Se define una función que carga un modelo de lenguaje grande (LLM) siguiendo estos pasos:

1️⃣Carga el modelo desde la biblioteca Hugging Face, permitiendo el uso de modelos preentrenados.

2️⃣Optimiza el uso de memoria en GPU mediante cuantización en 4 bits, reduciendo el consumo de VRAM.

3️⃣Detecta la disponibilidad de una GPU y carga el modelo en GPU si está disponible; de lo contrario, lo carga en CPU.

4️⃣Configura el tokenizador para la generación de texto, asegurando un procesamiento adecuado de las entradas.





In [19]:
def cargar_modelo_y_tokenizador(model_name: str):
    """
    Carga un modelo de lenguaje y su tokenizador correspondiente desde Hugging Face.
    Detecta automáticamente si hay una GPU disponible para aplicar cuantización
    y optimizar el uso de memoria.

    Args:
        model_name (str): El nombre del modelo a cargar (ej. "mistralai/Mistral-7B-Instruct-v0.2").

    Returns:
        tuple: Una tupla conteniendo el tokenizador y el modelo cargados.
    """
    # Definimos códigos de colores para una salida visualmente atractiva
    CIAN = "\033[96m"
    VERDE = "\033[92m"
    AMARILLO = "\033[93m"
    ROJO = "\033[91m"
    RESET = "\033[0m"
    BOLD = "\033[1m"

    print(f"\n{BOLD}{VERDE}--- INICIANDO CARGA DE MODELO DE LENGUAJE (LLM) ---{RESET}")
    print(f"{BOLD}Modelo a cargar:{RESET} {CIAN}{model_name}{RESET}")

    # --- PASO 1: Cargar el Tokenizador ---
    # Esto es común tanto para CPU como para GPU, así que lo hacemos primero.
    print(f"\n{BOLD}1. Cargando Tokenizador...{RESET}")
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    # Configuramos el token de padding para que sea igual al de fin de secuencia.
    # Esto es importante para evitar problemas en algunos modelos durante la generación.
    tokenizer.pad_token = tokenizer.eos_token
    print(f"{VERDE}   ✅ Tokenizador cargado y configurado.{RESET}")

    # --- PASO 2: Detección de Hardware y Carga del Modelo ---
    print(f"\n{BOLD}2. Detectando hardware y cargando el modelo...{RESET}")

    # Verificamos si hay una GPU compatible con CUDA disponible
    if torch.cuda.is_available():
        print(f"{VERDE}   - 🟢 GPU detectada. Se aplicará cuantización de 4-bit para optimizar memoria.{RESET}")

        # Configuración de cuantización para reducir el consumo de VRAM
        quantization_config = BitsAndBytesConfig(
            load_in_4bit=True,
            bnb_4bit_quant_type="nf4",
            bnb_4bit_compute_dtype=torch.bfloat16,
            bnb_4bit_use_double_quant=False,
        )

        # Cargar el modelo con la configuración de cuantización
        # device_map="auto" distribuye el modelo automáticamente en el hardware disponible
        model = AutoModelForCausalLM.from_pretrained(
            model_name,
            quantization_config=quantization_config,
            device_map="auto"
        )
        print(f"{VERDE}   ✅ Modelo cargado en GPU con éxito.{RESET}")

    else:
        print(f"{AMARILLO}   - 🟡 No se detectó GPU. Cargando modelo estándar en CPU (esto puede ser lento).{RESET}")
        # Cargar el modelo sin optimizaciones para la CPU
        model = AutoModelForCausalLM.from_pretrained(model_name)
        print(f"{VERDE}   ✅ Modelo cargado en CPU.{RESET}")

    print(f"\n{BOLD}{VERDE}--- CARGA DEL LLM COMPLETADA ---{RESET}")

    return tokenizer, model

# Creación de la base de datos vectorial y carga de LLM

In [20]:
# =============================================================================
# EJECUCIÓN DEL PIPELINE PRINCIPAL DE RAG
# -----------------------------------------------------------------------------
# Esta es la celda central que orquesta la construcción de nuestro sistema.
# Llama a las funciones que hemos definido para:
# 1. Crear la base de datos vectorial a partir de los documentos.
# 2. Cargar el potente modelo de lenguaje (LLM) y su tokenizador.
# =============================================================================

# -- Definimos los colores para la salida visual --
CIAN = "\033[96m"
VERDE = "\033[92m"
ROJO = "\033[91m"
AMARILLO = "\033[93m"
RESET = "\033[0m"
BOLD = "\033[1m"
SEPARADOR = "=" * 70
SEPARADOR_ERROR = "❌" * 35

# -- Bloque de ejecución principal con manejo de errores --
try:
    print(SEPARADOR)
    print(f"🚀 {BOLD}INICIANDO PIPELINE PRINCIPAL DEL EQUIPO SIHINO{RESET} 🚀")
    print(SEPARADOR)

    # --- PASO 1: CREAR LA BASE DE DATOS VECTORIAL ---
    # Llamamos a la función que preparamos para procesar los .txt y crear la BD.
    vector_db, embeddings_model = crear_base_vectorial(
        directorio_docs=DIRECTORIO_DOCUMENTOS,
        embedding_model_name=EMBEDDING_MODEL_NAME,
        chunk_size=CHUNK_SIZE,
        chunk_overlap=CHUNK_OVERLAP
    )

    # Verificación del Paso 1: Si la base de datos no se creó, detenemos la ejecución.
    if not vector_db:
        raise RuntimeError("La creación de la base de datos vectorial falló. Revisa los logs anteriores.")

    # --- PASO 2: CARGAR EL MODELO DE LENGUAJE (LLM) ---
    # Llamamos a la función que carga el LLM y el tokenizador, con detección de hardware.
    tokenizer, model = cargar_modelo_y_tokenizador(LLM_MODEL_NAME)

    # Verificación del Paso 2: Si el modelo no se cargó, detenemos la ejecución.
    if not model or not tokenizer:
        raise RuntimeError("La carga del modelo de lenguaje falló. Revisa los logs anteriores.")

    # --- FINALIZACIÓN EXITOSA ---
    print("\n" + SEPARADOR)
    print(f"✅🎉 {BOLD}{VERDE}¡SISTEMA RAG COMPLETAMENTE CARGADO Y LISTO!{RESET} 🎉✅")
    print(SEPARADOR)
    print(f"   - 🗂️  Base de Datos Vectorial: {VERDE}Operativa{RESET}")
    print(f"   - 🧠 Modelo de Lenguaje (LLM): {CIAN}{LLM_MODEL_NAME}{RESET} {VERDE}Cargado y en espera{RESET}")
    print(SEPARADOR)


except Exception as e:
    print("\n" + SEPARADOR_ERROR)
    print(f"❌ {BOLD}{ROJO}ERROR CRÍTICO DURANTE LA EJECUCIÓN DEL PIPELINE:{RESET}")
    print(f"{ROJO}   {e}{RESET}")
    print(SEPARADOR_ERROR)

🚀 [1mINICIANDO PIPELINE PRINCIPAL DEL EQUIPO SIHINO[0m 🚀

[1m[92m--- INICIANDO CREACIÓN DE LA BASE DE DATOS VECTORIAL ---[0m

[1m1. Cargando documentos desde 'datos_RAG_LLM'...[0m
   - Cargando: [96m0000000584cnt-2017-05_manual-autoayuda-dejar-de-fumar.txt[0m
   - Cargando: [96m0717-7348-rcher-33-03-0186.txt[0m
   - Cargando: [96m0717-9227-rchnp-56-03-0147.txt[0m
   - Cargando: [96m1130-5274-clinsa-31-3-0137.txt[0m
   - Cargando: [96m180618320005.txt[0m
   - Cargando: [96m2020-consumer-guide-spanish-508.txt[0m
   - Cargando: [96m2436.txt[0m
   - Cargando: [96m9789275321805_spa.txt[0m
   - Cargando: [96mConsigue dejar de fumar con el Doctor Fum- Utiliza el método -- Dr_ Alberto Seoane [Seoane, Dr_ Alberto] -- Cuerpo y Salud, Place of publication not.txt[0m
   - Cargando: [96mCómo dejar de fumar ¡definitivamente! y prevenir otras -- - Eduardo Hernández -- 2a ed_, México, Mexico, 2013 -- Editorial Trillas, S_A_ de C_V.txt[0m
   - Cargando: [96mDeja de fumar

modules.json:   0%|          | 0.00/349 [00:00<?, ?B/s]

config_sentence_transformers.json:   0%|          | 0.00/116 [00:00<?, ?B/s]

README.md:   0%|          | 0.00/10.5k [00:00<?, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/53.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/612 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/90.9M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/350 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/232k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/466k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/190 [00:00<?, ?B/s]

[92m✅ Modelo de Embeddings cargado.[0m

[1m4. Creando la base de datos vectorial FAISS...[0m
[92m✅ Base de datos vectorial creada y poblada con éxito.[0m

[1m[92m--- PROCESO FINALIZADO ---[0m

[1m[92m--- INICIANDO CARGA DE MODELO DE LENGUAJE (LLM) ---[0m
[1mModelo a cargar:[0m [96mmistralai/Mistral-7B-Instruct-v0.2[0m

[1m1. Cargando Tokenizador...[0m


tokenizer_config.json:   0%|          | 0.00/2.10k [00:00<?, ?B/s]

tokenizer.model:   0%|          | 0.00/493k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.80M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/414 [00:00<?, ?B/s]

[92m   ✅ Tokenizador cargado y configurado.[0m

[1m2. Detectando hardware y cargando el modelo...[0m
[92m   - 🟢 GPU detectada. Se aplicará cuantización de 4-bit para optimizar memoria.[0m


config.json:   0%|          | 0.00/596 [00:00<?, ?B/s]

model.safetensors.index.json:   0%|          | 0.00/25.1k [00:00<?, ?B/s]

Fetching 3 files:   0%|          | 0/3 [00:00<?, ?it/s]

model-00003-of-00003.safetensors:   0%|          | 0.00/4.54G [00:00<?, ?B/s]

model-00002-of-00003.safetensors:   0%|          | 0.00/5.00G [00:00<?, ?B/s]

model-00001-of-00003.safetensors:   0%|          | 0.00/4.94G [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/3 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/111 [00:00<?, ?B/s]

[92m   ✅ Modelo cargado en GPU con éxito.[0m

[1m[92m--- CARGA DEL LLM COMPLETADA ---[0m

✅🎉 [1m[92m¡SISTEMA RAG COMPLETAMENTE CARGADO Y LISTO![0m 🎉✅
   - 🗂️  Base de Datos Vectorial: [92mOperativa[0m
   - 🧠 Modelo de Lenguaje (LLM): [96mmistralai/Mistral-7B-Instruct-v0.2[0m [92mCargado y en espera[0m


# Creación del pipeline

Se configura un flujo de trabajo para generar texto a partir de un prompt, utilizando un modelo de lenguaje (LLM) de Hugging Face.

⚙️ Parámetros principales
- `model=llm_model`: especifica el modelo de lenguaje preentrenado que se utilizará.
- `tokenizer=tokenizer`: define el tokenizador asociado al modelo, responsable de convertir texto en tokens y viceversa.
- `max_new_tokens=800`: establece la longitud máxima de texto generado, en número de tokens.
- `do_sample=True`: habilita el muestreo aleatorio en la generación de texto, en lugar de elegir siempre la opción más probable.
- `temperature=0.8`: ajusta el nivel de creatividad; valores más altos generan respuestas más variadas.
- `top_k=50`: limita la selección a los 50 tokens más probables antes de elegir aleatoriamente.
- `top_p=0.95`: aplica “nucleus sampling”, seleccionando entre los tokens con una probabilidad acumulada del 95 %.
- `eos_token_id=tokenizer.eos_token_id`: define el token de fin de secuencia para detener la generación cuando se alcanza.
- `return_full_text=False`: indica que se debe devolver solo el texto generado, excluyendo el texto de entrada.


In [21]:
# =============================================================================
# CONFIGURACIÓN DEL PIPELINE DE GENERACIÓN DE TEXTO
# -----------------------------------------------------------------------------
# Aquí se define el pipeline de Hugging Face que LangChain usará para
# interactuar con nuestro modelo de lenguaje (LLM). Los parámetros ajustan
# el "comportamiento" del modelo al generar las respuestas.
# =============================================================================

llm_pipeline = pipeline(
    task="text-generation",                # Tarea específica que realizará el pipeline.
    model=model,                           # El modelo de lenguaje que ya cargamos en memoria.
    tokenizer=tokenizer,                   # El tokenizador asociado al modelo.

    # --- Parámetros para controlar la creatividad y estilo de la respuesta ---
    do_sample=True,                        # Activa el muestreo, necesario para que temperature/top_k/top_p funcionen.
    temperature=0.8,                       # Controla la "creatividad". > 0.7 es más creativo, < 0.3 es más determinista.
    top_k=50,                              # En cada paso, considera solo los 50 tokens (palabras) más probables.
    top_p=0.95,                            # Considera el conjunto de tokens cuya probabilidad acumulada es >= 95%.

    # --- Parámetros para controlar la longitud y el formato de la salida ---
    max_new_tokens=1500,                   # Límite máximo de tokens a generar en la respuesta.
    return_full_text=False,                # IMPORTANTE: Devuelve solo la respuesta, no el prompt + la respuesta.
    eos_token_id=tokenizer.eos_token_id    # Asegura que el modelo se detenga correctamente al generar el token de fin.
)

# El objeto `llm_pipeline` está ahora listo para ser encapsulado por LangChain.

Device set to use cuda:0


# RAG Langchain para responder preguntas de forma contextualizada

El siguiente código, implementa un flujo completo basado en RAG (Retrieval-Augmented Generation) utilizando LangChain para responder preguntas de forma contextualizada.
- Configura un modelo de lenguaje (LLM) a través de Hugging Face mediante `HuggingFacePipeline`.
- Crea un retriever que obtiene fragmentos de información relevantes desde una base de datos vectorial.
- Define un prompt personalizado que orienta al modelo para responder con amabilidad, precisión y sin generar información inventada.
- Construye una cadena RAG que:
- Recupera información contextual.
- Genera una respuesta basada en dicha información.
- Devuelve una salida textual clara y útil.

In [22]:
# =============================================================================
# PASO 1: ENCAPSULACIÓN DEL LLM PARA LANGCHAIN
# -----------------------------------------------------------------------------
# LangChain necesita un "wrapper" o encapsulador estándar para interactuar
# con el pipeline de Hugging Face que creamos.
# =============================================================================
llm = HuggingFacePipeline(pipeline=llm_pipeline)


# =============================================================================
# PASO 2: CONFIGURACIÓN DEL RECUPERADOR (RETRIEVER)
# -----------------------------------------------------------------------------
# El retriever es el componente que busca en la base de datos vectorial
# los fragmentos (chunks) de texto más relevantes para una pregunta dada.
# =============================================================================
retriever = vector_db.as_retriever(
    search_kwargs={"k": 6}  # "k" especifica el número de chunks a recuperar. 6 es un buen punto de partida.
)


# =============================================================================
# PASO 3: DISEÑO DE LA PLANTILLA DE PROMPT (PROMPT TEMPLATE)
# -----------------------------------------------------------------------------
# Este es el corazón de la personalidad y las instrucciones de nuestro asistente.
# Le decimos exactamente cómo usar el contexto para formular una respuesta útil.
# =============================================================================
prompt_template = PromptTemplate(
    input_variables=["context", "question"],
    template="""
    [INST] Eres un asistente de IA experto y amigable. Tu tarea es responder preguntas basándote
    única y exclusivamente en el contexto que se te proporciona.

    **Instrucciones Clave:**
    1.  Usa SOLAMENTE la información del 'Contexto'. No añadas conocimiento externo.
    2.  Si la información no está en el contexto, responde claramente: "No tengo suficiente información para responder a esa pregunta."
    3.  Sé conciso y directo en tu respuesta.
    4.  Nunca menciones que estás consultando documentos o un contexto. Actúa como si supieras la información directamente.
    5.  Varía tus saludos iniciales. Comienza cada respuesta con una frase amable y única, como por ejemplo: "¡Hola! Con gusto te explico:", "¡Claro! Aquí tienes la información:", o "¡Buena pregunta! Te comento lo siguiente:".

    **Contexto:**
    {context}

    **Pregunta:**
    {question}

    **Respuesta útil y amable:** [/INST]
    """
)


# =============================================================================
# PASO 4: ENSAMBLAJE DE LA CADENA RAG CON LCEL
# -----------------------------------------------------------------------------
# Usando LangChain Expression Language (LCEL), unimos todos los componentes
# en un único "pipeline" de datos, desde la pregunta hasta la respuesta final.
# =============================================================================
rag_chain = (
    # El diccionario de entrada define qué se ejecutará en paralelo.
    # El 'retriever' busca el contexto mientras 'RunnablePassthrough'
    # simplemente pasa la pregunta original.
    {"context": retriever, "question": RunnablePassthrough()}

    # El resultado ({context:..., question:...}) se "entuba" al prompt para formatearlo.
    | prompt_template

    # El prompt ya formateado con la información se "entuba" al modelo de lenguaje.
    | llm

    # La respuesta del LLM se "entuba" a un parser que extrae únicamente el texto final.
    | StrOutputParser()
)

# La variable `rag_chain` ahora contiene todo el sistema RAG listo para ser invocado.

  llm = HuggingFacePipeline(pipeline=llm_pipeline)


#Responder preguntas

In [None]:
# =============================================================================
# PRUEBAS Y VALIDACIÓN DEL SISTEMA RAG (SIN INTERFAZ GRÁFICA)
# -----------------------------------------------------------------------------
# Antes de lanzar la interfaz interactiva, ejecutaremos una serie de preguntas
# predefinidas para validar el comportamiento y la calidad de las respuestas
# del sistema RAG que hemos construido.
# =============================================================================

# --- 1. Lista de Preguntas para la Validación ---
preguntas_de_prueba = [
    "¿Cómo superar la ansiedad al dejar de fumar?",
    "¿Qué es la adicción al tabaco?",
    "¿Cuándo es grave el deseo de fumar?",
    "¿Cuáles son los sintomas de la abstinencia de nicotina?",
    "¿Qué hacer si estoy nervioso sin cigarrillos?",
    "¿Qué es el sindrome de abstinencia?",
    "¿Cuáles son las causas de los antojos de fumar?",
    "¿Puedes ayudarme a dejar de fumar?",
    "¿Qué es un desencadenante para fumar?",
    "¿Cómo superar el miedo a fallar al dejar de fumar?",
    "¿Qué hacer si estoy triste sin fumar?",
    "¿Cuáles son los efectos del tabaco en mi cuerpo?",
    "¿Cuándo empiezan a mejorar los sintomas de abstinencia?",
    "¿Qué es la terapia para dejar de fumar?",
    "¿Cómo controlar los nervios sin un cigarrillo?",
    "¿Cuáles son las razones para dejar de fumar?",
    "¿Qué hacer si mis amigos fuman cerca de mi?",
    "¿Cómo mantener la motivacion para no fumar?",
    "¿Qué es el reemplazo de nicotina?",
    "¿Puedes ser mi apoyo para dejar de fumar?"
]

# --- 2. Bucle de Ejecución de Pruebas ---
# Definimos colores para la salida
CIAN = "\033[96m"
VERDE = "\033[92m"
ROJO = "\033[91m"
RESET = "\033[0m"
BOLD = "\033[1m"
SEPARADOR = "=" * 70

# Verificamos que la cadena RAG exista antes de empezar.
if 'rag_chain' in locals():
    print(SEPARADOR)
    print(f"🤖 {BOLD}INICIANDO BATERÍA DE PRUEBAS CON {len(preguntas_de_prueba)} PREGUNTAS...{RESET} 🤖")
    print(SEPARADOR)

    for i, pregunta in enumerate(preguntas_de_prueba):
        print(f"\n{BOLD}Pregunta ({i+1}/{len(preguntas_de_prueba)}):{RESET}")
        print(f"   👨🏻‍💻 {CIAN}{pregunta}{RESET}")

        # --- Invocamos nuestra cadena RAG para obtener la respuesta ---
        respuesta = rag_chain.invoke(pregunta)

        print(f"\n{BOLD}Respuesta del Asistente:{RESET}")
        print(f"   🤖 {VERDE}{respuesta}{RESET}")
        print("-" * 70)
else:
    print(f"{ROJO}❌ Error: La variable 'rag_chain' no está definida. Asegúrate de haber ejecutado las celdas anteriores correctamente.{RESET}")

🤖 [1mINICIANDO BATERÍA DE PRUEBAS CON 20 PREGUNTAS...[0m 🤖

[1mPregunta (1/20):[0m
   👨🏻‍💻 [96m¿Cómo superar la ansiedad al dejar de fumar?[0m

[1mRespuesta del Asistente:[0m
   🤖 [92m¡Claro! Aquí te ofreceremos algunas técnicas para superar la ansiedad al dejar de fumar. Recuerda que es normal experimentar ansiedades al iniciar este proceso, ya que estamos rompiendo un hábito fuerte y familiar. Sin embargo, con algunas herramientas y estrategias, podemos enfrentar esta desafío.

    Primero, es importante identificar las situaciones o hechos que provocan ansiedad. Al hacer esto, podemos prepararnos mentalmente para enfrentarlas y evitar la tentación de fumar. Esto puede incluir situaciones sociales, como ir a reuniones o salir con amigos que fuman, o situaciones cotidianas, como tomar café o pasar el ratón por encima de un cigarrillo.

    Una estrategia efectiva para superar la ansiedad es utilizar distracciones. Esto puede incluir realizar una actividad manual, como hilando

# Chatbot

La función `chat_with_rag` recibe una pregunta del usuario y devuelve una respuesta generada a partir de la cadena RAG, la cual combina recuperación de información y generación de texto.

Se crea una aplicación web interactiva que permite:
- Ingresar preguntas en un campo de texto.
- Obtener respuestas generadas por IA basadas en información recuperada.
- Visualizar un título, una descripción y ejemplos que facilitan la interacción del usuario.

La creación de la interfaz incluye las siguientes configuraciones clave:
- `fn=chat_with_rag`: conecta la función principal del asistente con la interfaz.
- `inputs`: define el campo de entrada donde el usuario formula su pregunta.
- `outputs`: especifica el área donde se muestra la respuesta generada.
- `title`: establece el título visible de la aplicación.
- `description`: proporciona una breve explicación sobre el propósito de la interfaz.
- `examples`: muestra preguntas sugeridas que el usuario puede seleccionar para probar el sistema.




In [23]:
# =============================================================================
# PASO 1: FUNCIÓN DE INFERENCIA (PUENTE ENTRE LANGCHAIN Y GRADIO)
# -----------------------------------------------------------------------------
# Esta función no cambia. Sigue siendo el intermediario seguro que recibe
# la consulta del usuario, la pasa a la cadena RAG y devuelve la respuesta.
# =============================================================================
def chat_with_rag(user_query: str) -> str:
    """
    Ejecuta la cadena RAG con la consulta del usuario y maneja posibles errores.
    """
    try:
        # Invoca la cadena completa con la pregunta del usuario.
        response = rag_chain.invoke(user_query)
        return response
    except Exception as e:
        # Si algo falla, devuelve un mensaje de error claro en la interfaz.
        return f"❌ Ocurrió un error al procesar tu mensaje: {e}"


# =============================================================================
# PASO 2: DEFINICIÓN DE LA INTERFAZ DE USUARIO CON GRADIO
# -----------------------------------------------------------------------------
# Aquí es donde ocurre la magia: cambiamos los textos para adaptar
# la aplicación a su nuevo rol como asistente para dejar de fumar.
# =============================================================================
print("🎨 Construyendo la interfaz de usuario de apoyo...")

iface = gr.Interface(
    # --- Lógica Principal ---
    fn=chat_with_rag,                                # La función que se ejecutará con cada entrada del usuario.

    # --- Componentes de la Interfaz ---
    inputs=gr.Textbox(
        lines=3,                                     # Altura inicial de la caja de texto (en líneas).
        placeholder="Escribe cómo te sientes, una pregunta o pide un consejo...", # Texto guía más empático.
        label="Tu Mensaje o Consulta"                # Etiqueta que aparece sobre la caja de texto.
    ),

    outputs=gr.Textbox(
        label="Respuesta de tu Asistente de Apoyo"    # Etiqueta para la caja de texto de la respuesta.
    ),

    # --- Títulos, Descripción y Ejemplos (ADAPTADOS) ---
    title="❤️ Tu Aliado para Dejar de Fumar",
    description="**Un espacio de apoyo para acompañarte en cada paso de tu camino hacia una vida sin humo. ¡Tú puedes lograrlo!**",

    examples=[
        "Siento mucha ansiedad ahora mismo, ¿qué puedo hacer?",
        "Dame un consejo para mi primer día sin fumar.",
        "Necesito motivación para no recaer este fin de semana.",
        "¿Cuáles son los beneficios de salud inmediatos al dejar el cigarrillo?"
    ]
)


# =============================================================================
# PASO 3: LANZAMIENTO DE LA APLICACIÓN
# -----------------------------------------------------------------------------
# Esta parte no cambia. Inicia el servidor web de Gradio.
# =============================================================================
print("🚀 ¡Lanzando la aplicación de apoyo! Haz clic en el enlace público (Running on public URL) que aparecerá a continuación.")

iface.launch(
    share=True,      # Crea un enlace público temporal (válido por 72 horas) para compartir.
    debug=False      # Poner en True si necesitas ver logs de error detallados en la consola.
)

🎨 Construyendo la interfaz de usuario de apoyo...
🚀 ¡Lanzando la aplicación de apoyo! Haz clic en el enlace público (Running on public URL) que aparecerá a continuación.
Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://46016dda7a78837011.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)




# **Conclusiones:**

* #### **Incluyan sus conclusiones de la actividad chatbot LLM + RAG:**



None

# **Fin de la actividad chatbot: LLM + RAG**

Revisar si queremos formato markdown

https://faiss.ai/