In [1]:
# Ejercicio Chat Bot

In [4]:
!pip install -q streamlit langchain langchain-openai langchain-community pypdf faiss-cpu openai tiktoken

In [3]:
%%writefile "app.py"
# Importamos las librer칤as necesarias para la aplicaci칩n
import streamlit as st  # Para crear la interfaz web de manera sencilla
import os  # Para interactuar con el sistema operativo (rutas de archivos, variables de entorno)

# --- IMPORTACIONES ESENCIALES Y ROBUSTAS ---
# Estas son las herramientas espec칤ficas de LangChain que usaremos
from langchain_community.document_loaders import PyPDFLoader  # Para leer el contenido de archivos PDF
from langchain_text_splitters import RecursiveCharacterTextSplitter  # Para dividir textos largos en fragmentos m치s peque침os y manejables
from langchain_openai import OpenAIEmbeddings, ChatOpenAI  # Para usar los modelos de OpenAI (embeddings para vectores y ChatOpenAI para el bot)
from langchain_community.vectorstores import FAISS  # Base de datos vectorial eficiente para buscar informaci칩n similar
from langchain_core.prompts import ChatPromptTemplate  # Para crear plantillas de prompts estructurados para el chat
from langchain_core.messages import AIMessage, HumanMessage  # Para representar los mensajes del bot (AI) y del usuario (Human) en el historial

# Configuramos la p치gina de Streamlit 
st.set_page_config(page_icon="游볟", page_title="Asistente Silver Economy")
st.title("游볟 Asistente Silver Economy (Funcional)")

# --- CONFIGURACI칍N DE LA API KEY DE OPENAI ---
# Verificamos si la clave ya est치 en las variables de entorno del sistema
if "OPENAI_API_KEY" in os.environ:
    openai_api_key = os.getenv("OPENAI_API_KEY")
else:
    # Si no est치, creamos un campo de entrada de contrase침a en la barra lateral para que el usuario la ingrese
    openai_api_key = st.sidebar.text_input("OpenAI API Key:", type="password")
    # Si el usuario a칰n no ha ingresado la clave, mostramos una advertencia y detenemos la ejecuci칩n
    if not openai_api_key:
        st.warning("Introduce tu API Key para continuar.")
        st.stop()
    # Una vez ingresada, la guardamos en las variables de entorno para que LangChain la use autom치ticamente
    os.environ["OPENAI_API_KEY"] = openai_api_key

# --- FUNCI칍N PARA CARGAR Y PROCESAR LOS DATOS ---
# Usamos @st.cache_resource para que esta funci칩n pesada solo se ejecute una vez y se guarde en memoria
@st.cache_resource
def iniciar_base_datos():
    # Definimos la ruta donde est치n los archivos PDF. "./Data" significa la carpeta 'Data' en el directorio actual.
    ruta_data = "./Data"
    # Verificamos que la carpeta exista para evitar errores
    if not os.path.exists(ruta_data):
        st.error("No se encuentra la carpeta 'Data'. Aseg칰rate de ejecutar esto desde la carpeta 'Tarea 4'.")
        st.stop()
    
    docs = []  # Lista para guardar todos los documentos cargados
    # Mostramos un spinner mientras se cargan los archivos para dar feedback al usuario
    with st.spinner("Cargando documentos..."):
        # Recorremos todos los archivos en la carpeta 'Data'
        for archivo in os.listdir(ruta_data):
            # Si el archivo es un PDF, lo cargamos
            if archivo.endswith(".pdf"):
                # Creamos la ruta completa al archivo
                ruta_completa = os.path.join(ruta_data, archivo)
                # Usamos PyPDFLoader para leer el PDF
                loader = PyPDFLoader(ruta_completa)
                # A침adimos el contenido del PDF a nuestra lista de documentos
                docs.extend(loader.load())
    
    # Dividimos los documentos en fragmentos (chunks) m치s peque침os
    # chunk_size=1000: cada fragmento tendr치 aprox. 1000 caracteres
    # chunk_overlap=200: los fragmentos se solapar치n en 200 caracteres para no perder contexto entre cortes
    text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
    splits = text_splitter.split_documents(docs)
    
    # Creamos la base de datos vectorial (FAISS) usando los embeddings de OpenAI
    # Esto convierte los fragmentos de texto en vectores num칠ricos para poder buscar por similitud sem치ntica
    return FAISS.from_documents(splits, OpenAIEmbeddings())

# --- INICIALIZACI칍N DEL ESTADO DE LA APLICACI칍N ---
# Verificamos si la base de datos vectorial ya est치 cargada en la sesi칩n
if "vectorstore" not in st.session_state:
    # Si no est치, llamamos a la funci칩n para cargarla
    st.session_state.vectorstore = iniciar_base_datos()
    # Creamos un 'retriever' (buscador) a partir de la base vectorial
    # search_kwargs={"k": 3} significa que buscar치 los 3 fragmentos m치s relevantes para cada pregunta
    st.session_state.retriever = st.session_state.vectorstore.as_retriever(search_kwargs={"k": 3})
    st.success("춰Sistema listo! Haz tu pregunta.")

# --- INICIALIZACI칍N DEL HISTORIAL DEL CHAT ---
# Si no existe el historial en la sesi칩n, creamos una lista vac칤a para guardarlo
if "chat_history" not in st.session_state:
    st.session_state.chat_history = []

# --- CONFIGURACI칍N DEL MOTOR DEL CHAT (MODELO DE LENGUAJE) ---
# Usamos el modelo GPT-3.5 Turbo con temperatura 0 para respuestas m치s precisas y menos creativas (ideal para RAG)
llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

# --- DEFINICI칍N DE LA PLANTILLA DEL PROMPT ---
# Esta plantilla le dice al modelo c칩mo debe comportarse y qu칠 formato usar
template = """Eres un asistente 칰til para personas mayores. Basate SOLO en el siguiente contexto para responder.
Si no lo sabes, di que no tienes esa informaci칩n en tus documentos.

Contexto:
{context}

Historial:
{chat_history}

Pregunta: {question}
Respuesta:"""

# Creamos el objeto PromptTemplate a partir del texto de la plantilla
prompt_template = ChatPromptTemplate.from_template(template)

# --- FUNCI칍N RAG MANUAL (Retrieval-Augmented Generation) ---
# Esta funci칩n orquesta todo el proceso de respuesta
def responder_pregunta(pregunta, historial):
    # 1. RECUPERACI칍N (Retrieval): Buscamos los documentos m치s relevantes para la pregunta en nuestra base vectorial
    docs_relevantes = st.session_state.retriever.invoke(pregunta)
    # Unimos el contenido de los documentos recuperados en un solo texto
    contexto_texto = "\n\n".join([d.page_content for d in docs_relevantes])
    
    # 2. FORMATEO DEL HISTORIAL: Convertimos la lista de mensajes en un texto simple para el prompt
    # Tomamos solo los 칰ltimos 4 mensajes para no sobrecargar el contexto
    historial_texto = "\n".join([f"{msg.type}: {msg.content}" for msg in historial[-4:]])
    
    # 3. GENERACI칍N DEL PROMPT: Rellenamos la plantilla con el contexto, historial y la pregunta actual
    prompt_final = prompt_template.format_messages(
        context=contexto_texto,
        chat_history=historial_texto,
        question=pregunta
    )
    
    # 4. LLAMADA AL MODELO: Enviamos el prompt completo al LLM y obtenemos su respuesta
    respuesta_llm = llm.invoke(prompt_final)
    # Devolvemos solo el contenido de texto de la respuesta
    return respuesta_llm.content

# --- INTERFAZ DE USUARIO (CHAT) ---
# Mostramos todos los mensajes que ya est치n en el historial
for msg in st.session_state.chat_history:
    # Determinamos si el mensaje es del asistente o del usuario para mostrarlo correctamente
    tipo = "assistant" if isinstance(msg, AIMessage) else "user"
    with st.chat_message(tipo):
        st.markdown(msg.content)

# Capturamos la nueva pregunta del usuario desde el campo de entrada
if user_query := st.chat_input("Escribe aqu칤..."):
    # Agregamos la pregunta del usuario al historial y la mostramos en el chat
    st.session_state.chat_history.append(HumanMessage(content=user_query))
    with st.chat_message("user"):
        st.markdown(user_query)
    
    # Generamos la respuesta del asistente y la mostramos
    with st.chat_message("assistant"):
        with st.spinner("Consultando documentos..."):
            # Llamamos a nuestra funci칩n RAG manual
            respuesta = responder_pregunta(user_query, st.session_state.chat_history)
            st.markdown(respuesta)
    
    # Agregamos la respuesta del asistente al historial para mantener la conversaci칩n
    st.session_state.chat_history.append(AIMessage(content=respuesta))

Writing app.py
