In [6]:
!pip install flask pyngrok
!pip install gradio langchain langchain-community langchain-openai chromadb pdfplumber pypdf faiss-cpu
!pip install sentence-transformers
!pip install gdown transformers accelerate



In [9]:
import os
import glob
import time
from langchain_community.document_loaders import PyPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.vectorstores import FAISS
from langchain.chat_models import ChatOpenAI
from langchain.chains import ConversationalRetrievalChain
from langchain.memory import ConversationBufferMemory
import gdown

# 🔹 Abrir el pdf y guardarlo en el colab
def descargar_pdf_drive(file_id, output_name="archivo.pdf"):
    url = f"https://drive.google.com/uc?id={file_id}"
    gdown.download(url, output_name, quiet=False)
    return output_name

# 🔹 Configurar embeddings
embedding_function = HuggingFaceEmbeddings(model_name="BAAI/bge-large-en-v1.5",
                                           model_kwargs={'device': 'cpu'},
                                           encode_kwargs={"normalize_embeddings": True})

def process_pdfs_in_directory(directory_path):
    """Carga y procesa todos los archivos PDF en un directorio, generando un vector store con FAISS."""

    pdf_files = glob.glob(os.path.join(directory_path, "*.pdf"))  # Obtener todos los PDFs

    if not pdf_files:
        print("❌ No se encontraron archivos PDF en el directorio.")
        return None

    print("🔄 Procesando archivos PDF... (esto puede tardar unos minutos)")

    all_docs = []
    for pdf_file in pdf_files:
        print(f"📄 Cargando: {pdf_file}")
        loader = PyPDFLoader(file_path=pdf_file)
        docs = loader.load_and_split(text_splitter=RecursiveCharacterTextSplitter(
            chunk_size=1000, chunk_overlap=200, length_function=len, is_separator_regex=False
        ))
        all_docs.extend(docs)
        time.sleep(0.5)  # Pequeña pausa para mostrar el procesamiento
    print("✅ El PDF en crudo",docs)
    print("✅ PDFs cargados y divididos en fragmentos.")

    # Guardar en FAISS
    db = FAISS.from_documents(documents=all_docs, embedding=embedding_function)
    print("✅ Base de datos vectorial creada con FAISS.")

    return db

# 🔹 Configurar el modelo LLM y la memoria para el chat
def get_chatbot_gemini(vector_store):
    llm = ChatOpenAI(
        # model="gemini-2.0-flash",
        model="gemini-2.5-pro-exp-03-25",
        openai_api_key="AIzaSyAkU96fPERFmhtEGwlAeegfxjdz8-yHg5w",
        openai_api_base="https://generativelanguage.googleapis.com/v1beta/openai/")
    memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)

    # Crear cadena de consulta con memoria (Conversational RAG)
    qa_chain = ConversationalRetrievalChain.from_llm(llm=llm, retriever=vector_store.as_retriever(), memory=memory)

    return qa_chain

# 🔹 Configurar el modelo LLM y la memoria para el chat
def get_chatbot_deepseek(vector_store):
    llm = ChatOpenAI(
        model="deepseek-reasoner",
        openai_api_key="sk-711d67dbcc5c4e7fa7c26d78b01e1b98",
        openai_api_base="https://api.deepseek.com/v1")
    memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)

    # Crear cadena de consulta con memoria (Conversational RAG)
    qa_chain = ConversationalRetrievalChain.from_llm(llm=llm, retriever=vector_store.as_retriever(), memory=memory)

    return qa_chain

# 🔹 Configurar el modelo LLM y la memoria para el chat
def get_chatbot_chatgpt(vector_store):
    llm = ChatOpenAI(model="gpt-4", openai_api_key="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")  # Usar OpenAI
    memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)

    # Crear cadena de consulta con memoria (Conversational RAG)
    qa_chain = ConversationalRetrievalChain.from_llm(llm=llm, retriever=vector_store.as_retriever(), memory=memory)

    return qa_chain


# 🏁 Ejecutar el procesamiento de PDFs y activar el chat
file_id = "1Zd-erxTgkSGwo294VWvxeEeHkGAodz6U"  # Archivo real https://drive.google.com/file/d/1Zd-erxTgkSGwo294VWvxeEeHkGAodz6U/view?usp=drive_link
ruta_pdf = descargar_pdf_drive(file_id, "./acuerdo_009/acuerdo_009.pdf")
vector_store = process_pdfs_in_directory("./acuerdo_009/")

SystemError: 0>EWrx() method: bad call flags

In [3]:
%mkdir ./acuerdo_009

In [8]:
from pyngrok import ngrok
ngrok.set_auth_token("25qMhFMYoklMtgCcJIbEDWpzbfM_7cEK6vZnHZmogeY6UnjU")

from huggingface_hub import login
login("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")



In [None]:
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

model_id = "raulgdp/Meta-Llama-3-8B-009"

tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    torch_dtype=torch.float16,
    device_map="auto"  # Usa GPU si está disponible
)
def chat_with_llm(pregunta):
    print("\n🤖 El chatbot está analizando una pregunta.\n")
    # Armar el prompt incluyendo el historial
    prompt = f"\nUsuario: {pregunta}\nAsistente:"

    inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
    outputs = model.generate(
        **inputs,
        max_new_tokens=256,
        do_sample=True,
        temperature=0.7,
        top_p=0.9,
        pad_token_id=tokenizer.eos_token_id
    )

    decoded = tokenizer.decode(outputs[0], skip_special_tokens=True)

    # Extraer solo la respuesta del modelo
    respuesta = decoded.split("Asistente:")[-1].strip()
    print(f"🤖 Respuesta: {respuesta}\n")

    time.sleep(5)
    return f"{respuesta}"

tokenizer_config.json:   0%|          | 0.00/53.1k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/17.2M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/342 [00:00<?, ?B/s]

adapter_config.json:   0%|          | 0.00/822 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/654 [00:00<?, ?B/s]

model.safetensors.index.json:   0%|          | 0.00/23.9k [00:00<?, ?B/s]

Fetching 4 files:   0%|          | 0/4 [00:00<?, ?it/s]

model-00003-of-00004.safetensors:   0%|          | 0.00/4.92G [00:00<?, ?B/s]

model-00002-of-00004.safetensors:   0%|          | 0.00/5.00G [00:00<?, ?B/s]

model-00004-of-00004.safetensors:   0%|          | 0.00/1.17G [00:00<?, ?B/s]

model-00001-of-00004.safetensors:   0%|          | 0.00/4.98G [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/4 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/187 [00:00<?, ?B/s]

adapter_model.safetensors:   0%|          | 0.00/13.6M [00:00<?, ?B/s]

In [None]:
from flask import Flask, jsonify, request
from pyngrok import ngrok
import threading
import time

# Instancia de Flask
app = Flask(__name__)

history = ""

# 🔹 Función para hacer preguntas
def chat_with_bot(chatbot, pregunta):
    print("\n🤖 El chatbot está analizando una pregunta.\n")
    prompt = f"\nUsuario: Según el Acuerdo, responde en español: {str(pregunta)}\nAsistente:"
    print(f"📝 Pregunta: {str(pregunta)} \n")
    response = chatbot.invoke({"question": f"{prompt}"})
    print(f"🤖 Respuesta: {response['answer']}\n")
    time.sleep(5)
    return f"{response['answer']}"

# Cargo el modelo
if vector_store:
    chatbot_gemini = get_chatbot_gemini(vector_store)
    chatbot_deepseek = get_chatbot_deepseek(vector_store)
    chatbot_chatgpt = get_chatbot_chatgpt(vector_store)
else:
    print("⚠️ No se pudo crear la base de datos vectorial.")
    exit(1)

# Define una ruta básica
@app.route("/gemini")
def gemini():
    pregunta = request.args.get("pregunta")
    respuesta = chat_with_bot(chatbot_gemini, pregunta)
    return jsonify({"respuesta": respuesta})

@app.route("/deepseek")
def deepseek():
    pregunta = request.args.get("pregunta")
    respuesta = chat_with_bot(chatbot_deepseek, pregunta)
    return jsonify({"respuesta": respuesta})

@app.route("/chatgpt")
def chatgpt():
    pregunta = request.args.get("pregunta")
    respuesta = chat_with_bot(chatbot_chatgpt, pregunta)
    return jsonify({"respuesta": respuesta})

@app.route("/llama")
def llama():
    pregunta = request.args.get("pregunta")
    respuesta = chat_with_llm(pregunta)
    return jsonify({"respuesta": respuesta})

# Función para correr Flask en segundo plano
def run_app():
    app.run(port=5000)

# Abre túnel ngrok al puerto 5000
public_url = ngrok.connect(5000)
print("Tu API está disponible en:", public_url)

# Ejecuta Flask en un hilo aparte para no bloquear el notebook
thread = threading.Thread(target=run_app)
thread.start()

try:
    while True:
        time.sleep(1)
except KeyboardInterrupt:
    print("Servidor detenido.")

  llm = ChatOpenAI(
  memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)


Tu API está disponible en: NgrokTunnel: "https://708f-34-87-9-28.ngrok-free.app" -> "http://localhost:5000"
 * Serving Flask app '__main__'
 * Debug mode: off


 * Running on http://127.0.0.1:5000
INFO:werkzeug:[33mPress CTRL+C to quit[0m



🤖 El chatbot está analizando una pregunta.

📝 Pregunta: ¿Qué es un bajo rendimiento académico? 

🤖 Respuesta: El texto proporcionado no define explícitamente qué es un "bajo rendimiento académico".

Menciona las consecuencias y los procedimientos a seguir cuando un estudiante incurre en bajo rendimiento académico (por ejemplo, en el ARTÍCULO 61° y en el Acuerdo 006 de 2023), pero no establece los criterios específicos que constituyen dicho bajo rendimiento.



INFO:werkzeug:127.0.0.1 - - [09/May/2025 23:37:23] "GET /gemini?pregunta=¿Qué+es+un+bajo+rendimiento+académico? HTTP/1.1" 200 -



🤖 El chatbot está analizando una pregunta.

📝 Pregunta: ¿Qué es un bajo rendimiento académico? 

🤖 Respuesta: Según los documentos proporcionados, el término "bajo rendimiento académico" no está explícitamente definido en los artículos y acuerdos citados. Sin embargo, se menciona como una situación que ocurre cuando un estudiante no cumple con los estándares académicos requeridos, lo cual genera alertas institucionales (primera vez), acompañamiento, y en casos extremos (tercera vez), la imposibilidad de continuar en el mismo programa. 

La normativa se enfoca en las consecuencias y procesos posteriores al bajo rendimiento (estrategias de apoyo, reingreso, etc.), pero **no especifica criterios cuantitativos** como promedios mínimos o número de asignaturas reprobadas para definirlo. Para conocer la definición exacta, sería necesario consultar otros artículos o reglamentos complementarios no incluidos en el contexto proporcionado.



INFO:werkzeug:127.0.0.1 - - [09/May/2025 23:38:18] "GET /deepseek?pregunta=¿Qué+es+un+bajo+rendimiento+académico? HTTP/1.1" 200 -



🤖 El chatbot está analizando una pregunta.

🤖 Respuesta: El plan de acción es un acuerdo entre el estudiante y el consejo académico que establece



INFO:werkzeug:127.0.0.1 - - [09/May/2025 23:39:08] "GET /llama?pregunta=¿Qué+es+un+bajo+rendimiento+académico? HTTP/1.1" 200 -



🤖 El chatbot está analizando una pregunta.

📝 Pregunta: Qué es debo hacer si necesito un certificado estudiantil? 

🤖 Respuesta: El Acuerdo proporcionado no detalla el procedimiento específico para solicitar un certificado estudiantil general.

El documento menciona:
*   La "División de Admisiones y Registro Académico" en el Artículo 74, pero en el contexto de la presentación de solicitudes de reingreso y traslado.
*   La "certificación final de las calificaciones" en el Parágrafo 3 del Artículo 44, en el contexto de los requisitos para optar por el grado.

Sin embargo, no se especifica el proceso para obtener un certificado estudiantil común durante el transcurso de los estudios.



INFO:werkzeug:127.0.0.1 - - [09/May/2025 23:41:05] "GET /gemini?pregunta=Qué+es+debo+hacer+si+necesito+un+certificado+estudiantil? HTTP/1.1" 200 -
