# **Procesamiento de Lenguaje Natural**

## Maestría en Inteligencia Artificial Aplicada
#### Tecnológico de Monterrey
#### Prof Luis Eduardo Falcón Morales

### **Adtividad en Equipos: sistema LLM + RAG**

* **Nombres y matrículas:**

  *   Emmanuel Merida Toledo **A01795858**
  *   Carlos Pano Hernandez **A01066264**
  *   Mireya Isabel Pérez Del Razo **A01795608**
  *   Scarlet Marie Wessin Romero **A01796242**

* **Número de Equipo:**


* ##### **El formato de este cuaderno de Jupyter es libre, pero debe incuir al menos las siguientes secciones:**

  * ##### **Introducción de la problemática a resolver.**
  * ##### **Sistema RAG + LLM**
  * ##### **El chatbot, incluyendo ejemplos de prueba.**
  * ##### **Conclusiones**

* ##### **Pueden importar los paquetes o librerías que requieran.**

* ##### **Pueden incluir las celdas y líneas de código que deseen.**

## **Introducción de la problemática a resolver**

## **Sistema RAG + LLM**

In [10]:
# Incluyan a continuación todas las celdas (de código o texto) que deseen...
!pip install faiss-cpu



In [11]:
import os
import openai
import glob
from sentence_transformers import SentenceTransformer
import faiss

In [12]:
# === Leer documentos desde carpeta ./docs/ ===
ruta_docs = "/content/drive/MyDrive/MNA/Procesamiento de Lenguaje Natural/Modulo 3/Semana 9/9.2 Actividad chatbot  RAG + LLM/docs/*.txt"
corpus = []

for archivo in glob.glob(ruta_docs):
    with open(archivo, "r", encoding="utf-8") as f:
        texto = f.read()
        partes = [texto[i:i+1000] for i in range(0, len(texto), 1000)]
        corpus.extend(partes)

print("Documentos encontrados:")
for archivo in glob.glob(ruta_docs):
    print(archivo)

Documentos encontrados:


In [13]:
# === Crear embeddings y FAISS ===
if not corpus:
    print("Warning: No text files found in the ./docs/ directory or the files are empty. The corpus is empty.")

if corpus:
    modelo = SentenceTransformer("distiluse-base-multilingual-cased-v1")
    embeddings = modelo.encode(corpus)
    if embeddings.shape[0] > 0:
        index = faiss.IndexFlatL2(embeddings[0].shape[0])
        index.add(embeddings)
    else:
        print("Warning: Embeddings could not be created from the corpus.")
else:
    print("Warning: Skipping embedding and FAISS creation due to empty corpus.")



In [14]:
def responder_con_rag(pregunta, top_k=3):
    emb_pregunta = modelo.encode([pregunta])
    distancias, indices = index.search(emb_pregunta, top_k)
    contexto = "\n\n".join([corpus[i] for i in indices[0]])

    prompt = f"""
Eres un experto en salud preventiva. Responde en español de forma clara y precisa
basándote en el siguiente contexto. Si la información no es suficiente, indica que no se puede responder con certeza.

Contexto:
{contexto}

Pregunta:
{pregunta}

Respuesta:
"""
    client = openai.OpenAI(api_key=os.environ.get("OPENAI_API_KEY", ""))

    respuesta = client.chat.completions.create(
        model="gpt-4",
        messages=[{"role": "user", "content": prompt}],
        temperature=0.3,
        max_tokens=700
    )

    return respuesta.choices[0].message.content

## **El chatbot, incluyendo ejemplos de prueba**

In [15]:
respuesta = responder_con_rag("¿Qué alimentos ayudan a prevenir la diabetes?")
print("\nRespuesta del chatbot:\n", respuesta)

NameError: name 'modelo' is not defined

In [46]:
respuesta = responder_con_rag("¿Cómo se puede prevenir la hipertensión arterial?")
print("\nRespuesta del chatbot:\n", respuesta)


Respuesta del chatbot:
 La hipertensión arterial se puede prevenir siguiendo varias recomendaciones. La Organización Mundial de la Salud sugiere reducir la ingesta de sal a menos de 5 gramos diarios, mantener una dieta rica en frutas y verduras, realizar actividad física regularmente, mantener un peso saludable, y evitar el consumo de alcohol y tabaco. Además, es esencial el diagnóstico temprano mediante controles periódicos de la presión arterial para prevenir complicaciones graves.


In [47]:
respuesta = responder_con_rag("¿Qué es una alimentación saludable?")
print("\nRespuesta del chatbot:\n", respuesta)


Respuesta del chatbot:
 Una alimentación saludable es aquella que incluye diariamente frutas y verduras, cereales integrales, legumbres, granos enteros y frutos secos, y evita alimentos altos en azúcar, grasa y sal. Se recomienda tomar agua simple como principal bebida y reducir el consumo de bebidas azucaradas. También se aconseja evitar el exceso de alimentos ultraprocesados como frituras, golosinas y comida rápida. Además, comer en horarios regulares y en porciones adecuadas contribuye al bienestar general. Este tipo de alimentación es clave para prevenir enfermedades como la obesidad, la diabetes y la hipertensión.


In [48]:
respuesta = responder_con_rag("¿Cuánto ejercicio debo hacer por semana para mantenerme sano?")
print("\nRespuesta del chatbot:\n", respuesta)


Respuesta del chatbot:
 Se recomienda realizar actividad física moderada durante al menos 30 minutos al día, cinco días a la semana.


In [49]:
respuesta = responder_con_rag("¿Qué hábitos diarios ayudan a prevenir enfermedades crónicas?")
print("\nRespuesta del chatbot:\n", respuesta)


Respuesta del chatbot:
 Los hábitos diarios que ayudan a prevenir enfermedades crónicas incluyen:

1. Mantener una alimentación saludable y equilibrada, rica en frutas, vegetales, legumbres, cereales integrales y frutos secos.
2. Evitar alimentos altos en azúcar, grasa y sal, así como el consumo excesivo de alimentos ultraprocesados como frituras, golosinas y comida rápida.
3. Reducir la ingesta de sal a menos de 5 gramos diarios.
4. Tomar agua simple como principal bebida y reducir el consumo de bebidas azucaradas.
5. Realizar actividad física con regularidad, preferentemente moderada durante al menos 30 minutos al día, cinco días a la semana.
6. Mantener un peso corporal saludable.
7. Evitar el consumo de alcohol y tabaco.
8. Comer en horarios regulares y en porciones adecuadas.
9. Realizar controles periódicos de la presión arterial para un diagnóstico temprano de hipertensión.

Estos hábitos deben ser promovidos desde la infancia para mantener una buena salud a lo largo de la vida

# **Conclusiones:**

* #### **Incluyan sus conclusiones de la actividad chatbot LLM + RAG:**



None

# **Fin de la actividad chatbot: LLM + RAG**