# Librer√≠as

In [None]:
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig, pipeline
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline, BitsAndBytesConfig
from langchain.text_splitter import RecursiveCharacterTextSplitter
from transformers import AutoModelForCausalLM, AutoTokenizer
from langchain_community.document_loaders import PyPDFLoader
from langchain.embeddings import HuggingFaceEmbeddings
from langchain_core.language_models.llms import LLM
from langchain.llms import HuggingFacePipeline
from langchain.prompts import PromptTemplate
from langchain_core.pydantic_v1 import Field
from sqlalchemy import create_engine, text
from langchain.vectorstores import FAISS
from langchain.chains import RetrievalQA
from typing import Optional, List, Any
from langchain.schema import Document
from transformers import pipeline
from flask import Flask, request
from datetime import datetime
from threading import Thread
from peft import PeftModel
import gradio as gr
import pandas as pd
import gradio as gr
import numpy as np
import requests
import uuid
import json
import torch
import pdb
import gc
import re
import os
from dotenv import load_dotenv

# Microsoft Phi-3 como modelo

In [None]:
gc.collect()
torch.cuda.empty_cache()
torch.cuda.ipc_collect()

In [None]:
# Modelo local 
model_path = "D:/LLM Models/microsoft-phi-3-mini-4k-instruct"

# Configuraci√≥n de cuantizaci√≥n a 8 bits
bnb_config = BitsAndBytesConfig(
    load_in_8bit=True,
    llm_int8_threshold=6.0,
)

# Cargamos el tokenizer de Phi-3
tokenizer = AutoTokenizer.from_pretrained(model_path)

# Cargamos el modelo base directamente sin LoRA
model = AutoModelForCausalLM.from_pretrained(
    model_path,
    quantization_config=bnb_config,
    torch_dtype=torch.float16,
    device_map="auto",
)

# Colocamos el modelo en modo evaluaci√≥n
model.eval()

# Definimos el pipeline
pipe = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    max_new_tokens=512,
    temperature=0.4,
    top_p=0.9,
    repetition_penalty=1.1,
    return_full_text=False,
)

# Conexi√≥n a base de datos de reportes en GCP

In [None]:
# Cargamos variables de entorno
load_dotenv(dotenv_path="chatbot.env")

# Guardamos variables de entorno para conectarnos a la BDD
USER = os.getenv('USER_DB')
PASSWORD = os.getenv('PASSWORD_DB')
HOST = os.getenv('HOST_DB')
DBNAME = 'postgres'#os.getenv('DBNAME')
PORT = 5432

# Instanciamos el engine para conectarnos a nuestra BDD en GCP
engine = create_engine(f"postgresql+psycopg2://{USER}:{PASSWORD}@{HOST}:{PORT}/{DBNAME}")

# Confirmamos que nos podamos conectar
try:
    with engine.connect() as conn:
        print("‚úÖ Conexi√≥n exitosa con super_user")

except Exception as e:
    print("‚ùå Error de conexi√≥n:", e)

# Sistema RAG

### Embeddings y VectorStore con FAISS

In [None]:
splitter = RecursiveCharacterTextSplitter(chunk_size=256, chunk_overlap=50)

# Definimos como funcionaran nuestros embeddings
embeddings = HuggingFaceEmbeddings(
    # model_name="intfloat/multilingual-e5-base",
    # encode_kwargs={"normalize_embeddings": True}
    model_name="BAAI/bge-m3",
    model_kwargs={
        'device': 'cuda'#,
        #'trust_remote_code': True
    },
    encode_kwargs={
        "normalize_embeddings": True,
        "batch_size": 8
    }
)

vs = FAISS.load_local(
    #"C:/Users/Delbert/Documents/Maestria/Proyecto Integrador/Avance 1/Tecnologico-Monterrey-Proyecto-Integrador-equipo-36/Baseline/rag_faiss_store",
    "C:/Users/Delbert/Documents/Maestria/Proyecto Integrador/Avance 1/Tecnologico-Monterrey-Proyecto-Integrador-equipo-36/Telegram-Bot/rag_faiss_store",
    embeddings,
    allow_dangerous_deserialization=True
)

### Clase custom para el ChatBot y generacion de respuestas

In [None]:
def gen_prompt(tokenizer, sentence):
    return tokenizer.apply_chat_template(
        [{"role": "user", "content": sentence}], tokenize=False, add_generation_prompt=True
    )


def generate(model, tokenizer, prompt, max_new_tokens=512, skip_special_tokens=True, stop=None):
    inputs = tokenizer(prompt, add_special_tokens=False, return_tensors="pt").to(model.device)

    with torch.inference_mode():
        output = model.generate(
            **inputs,
            eos_token_id=tokenizer.eos_token_id,
            max_new_tokens=max_new_tokens
        )

    decoded = tokenizer.batch_decode(output, skip_special_tokens=skip_special_tokens)[0]

    if stop:
        for token in stop:
            if token in decoded:
                decoded = decoded.split(token)[0]
                break
    
    if "</answer>" not in decoded:
        decoded += "</answer>"
        
    return decoded[len(prompt):].strip()


class Phi3ChatTemplateLLM(LLM):
    model: Any = Field(exclude=True)
    tokenizer: Any = Field(exclude=True)
    max_new_tokens: int = 512
    skip_special_tokens: bool = True

    @property
    def _llm_type(self) -> str:
        return "phi3-chat-template"

    def _call(self, prompt: str, stop: Optional[List[str]] = None, **kwargs: Any) -> str:
        try:
            # user_prompt = prompt
            chat_prompt = prompt #gen_prompt(self.tokenizer, user_prompt)
            
            return generate(
                self.model,
                self.tokenizer,
                chat_prompt,
                max_new_tokens=self.max_new_tokens,
                skip_special_tokens=self.skip_special_tokens
            )
        except Exception as e:
            return f"‚ùå Error al generar respuesta con LLM: {str(e)}"

custom_llm = Phi3ChatTemplateLLM(model=model, tokenizer=tokenizer, max_new_tokens=512, skip_special_tokens=True)

### Retriever

In [None]:
# my_prompt = PromptTemplate(
#     input_variables=["context", "question"],
#     template=( """You are an assistant called GorgoBot. Use only the following pieces of retrieved context (wrapped between <context> and </context>) to answer the latest question.
#               If the exact information is unavailable, indicate what is missing. Always answer in Spanish.
              
#               Maintain a polite, professional and pleasant tone and focus on resolving issues efficiently. Respond to user queries by providing empathetic and detailed solutions.
#               If you cannot get a crystal clear answer from the context, say that you don't know, do not make anything up.             
#               <context> {context} </context>
              
#               Then answer the question wrapped between <question> and </question>.
              
#               <question>{question}</question>
              
#               Finally generate the answer wrapped between <answer> and </answer>.
#               """
#     ),
# )

my_prompt = PromptTemplate(
    input_variables=["context", "question"],
    template=(
        """"You are an assistant called GorgoBot. Use only the following pieces of retrieved context (wrapped between <context> and </context>) to answer the latest question.
If the exact information is unavailable, indicate what is missing. Always answer in Spanish.


Do NOT repeat instructions or examples found inside <context>.

Maintain a polite, professional and pleasant tone and focus on resolving issues efficiently. Respond to user queries by providing empathetic and detailed solutions.
If you cannot get a crystal clear answer from the context, say that you don't know, do not make anything up.             

<context>
{context}
</context>

Then answer the question wrapped between <question> and </question>.

<question>
{question}
</question>

Write your final response **only inside** the <answer> and </answer> tags. Do not include anything else.

<answer>
"""
    )
)


retriever = vs.as_retriever( search_kwargs={"k": 3})

rag_chain = RetrievalQA.from_chain_type(
    llm=custom_llm,
    retriever=retriever,
    chain_type="stuff",
    chain_type_kwargs={"prompt": my_prompt},
    return_source_documents=False
)

# Conexi√≥n a Telegram

In [None]:
def get_total_cases_count():
    try:
        with engine.connect() as conn:
            total_cases = conn.execute(text("SELECT COUNT(*) FROM reportes_chatbot;")).scalar()
        return total_cases

    except:
        print("Error conect√°ndose a la BDD.")

In [None]:
def insert_report_into_bdd(data):

    try:
        
        query = text("""
        INSERT INTO reportes_chatbot (
            report_id,
            case_number,
            lat,
            lon,
            address,
            photo_url,
            user_risk_assesment,
            user_lot_description,
            contact_phone,
            price,
            current_state
        ) VALUES (
            :report_id,
            :case_number,
            :lat,
            :lon,
            :address,
            :photo_url,
            :user_risk_assesment,
            :user_lot_description,
            :phone_number,
            :price,
            'Nuevo'
        );""")
        
        try:
            with engine.begin() as conn:
                conn.execute(query, data)
            print(f"‚úÖ Reporte insertado: {data.get('case_number')} ({data.get('report_id')})")
            return True, data.get('case_number')

        except Exception as e:
            print(f"‚ùå Error al insertar el reporte {data.get('case_number')}: {e}")
            return False
        
    except:
        print("‚ùå No se pudo insertar el reporte a la BDD, se procede a desechar.")
        return False

In [None]:
def get_case_state(case_suffix: str):

    # Aseguramos el formato correcto con el prefijo 'CASO-'
    case_number = f"CASO-{case_suffix.strip()}"

    query = text("""
        SELECT current_state
        FROM reportes_chatbot
        WHERE case_number = :case_number;
    """)

    try:
        with engine.connect() as conn:
            result = conn.execute(query, {"case_number": case_number}).fetchone()

            if result is None:
                return False, None
            else:
                return True, result[0]

    except Exception as e:
        return f"‚ö†Ô∏è Error al consultar la base de datos: {e}"

In [None]:
def send_menu(chat_id):

    menu_message = (
        "üëã *Bienvenido, ser√° un gusto atenderte.*\n\n"
        "¬øQu√© te interesa llevar a cabo?\n\n"
        "A. *Hacer un reporte de un predio infectado*\n\n"
        "B. *Preguntar por el seguimiento a un reporte anterior.*\n\n"
        "C. *Preguntar generalidades sobre el muestreo de gorgojos.*\n\n"
        "_Actualmente, solo estas 3 opciones est√°n disponibles._"
    )

    payload = {
        "chat_id": chat_id,
        "text": menu_message,
        "parse_mode": "Markdown"
    }

    try:
        response = requests.post(f"{BASE_URL}/sendMessage", json=payload)
        
        if response.status_code == 200:
            print(f"‚úÖ Men√∫ enviado correctamente a {chat_id}")
            
        else:
            print(f"‚ö†Ô∏è Error enviando men√∫: {response.text}")
            
            
    except Exception as e:
        print(f"‚ùå Error al enviar men√∫: {e}")

In [None]:
def report_message_flow(sender_id, state, message_data):

    # Inicializamos variables
    response_text = ""
    next_state = state
    
    current_case_state_dict = {
        "Nuevo": " el caso fue recibido y ser√° investigado por un experto en control de plagas de picudo.",
        "En proceso" : " el caso fue asignado a un experto en control de plagas de picudo.",
        "En campo"   : " el caso se encuentra siendo investigado en el sitio reportado",
        "Falsa alerta" : " el caso se cataloga como una falsa alerta con base en la investigaci√≥n realizada.",
        "Verdadera alerta" : " se confirma una infestaci√≥n de picudo y se tomaron acciones adecuadas para erradicarlo.",
        "Concluido" : " se llev√≥ a cabo la investigaci√≥n, erradicaci√≥n y control del picudo."
    }
    
    # Detectamos si el usuario ha compartido su numero de telefono
    contact = message_data.get("contact", {})
    phone_number = contact.get("phone_number")

    # Detectamos el contenido del mensaje
    text = message_data.get("text", "").strip().lower() if "text" in message_data else ""
    location = message_data.get("location", {})
    photo = message_data.get("photo", [])
    lat = location.get("latitude")
    lon = location.get("longitude")
    
    # Guardamos el contacto si este es publico
    if phone_number:
        user_session[sender_id]["data"]["phone_number"] = phone_number


    # Extraemos la URL de la foto (si existe)
    photo_url = None
    if photo:
        file_id = photo[-1]["file_id"]  # La √∫ltima suele ser la de mejor resoluci√≥n
        photo_url = f"https://api.telegram.org/file/bot{TOKEN}/{file_id}"


    # ============================================================
    # Saludo inicial para reportar un predio con problemas
    # ============================================================
    
    if state == "saludo":
        if text in ["a", "üÖ∞Ô∏è"]:
            response_text = (
                "Gracias por tu proactividad üåæ.\n Primero, env√≠a la **ubicaci√≥n** del lote afectado usando el √≠cono üìç."
            )
            next_state = "ask-location"

        elif text in ["b", "üÖ±Ô∏è"]:
            response_text = (
                "Claro, por favor ind√≠came tu n√∫mero de caso.\n\nEl formato del caso debe contener el a√±o y n√∫mero de reporte.\n"
                "\nEste es un ejemplo de un n√∫mero de caso v√°lido: 2025-0001"
            )
            next_state = "ask-case-file"
            
        elif text in ["c"]:
            response_text = (
                "Perfecto. Puedes escribir hasta 3 preguntas y te responder√© con ayuda del asistente inteligente."
            )
            next_state = "NLP-Chatbot-1"

    # ============================================================
    # Preguntamos por el n√∫mero de caso en caso de que se haya seleccionado esa opcion.
    # ============================================================
    elif state == "ask-case-file":
        regex_pattern = r"^(20\d{2})-(\d{4})$"
        
        if text:
            text = text.strip()
            valid_case_format = re.match(regex_pattern, text)
            
            if valid_case_format:
                
                case_success, current_case_state = get_case_state(text)
                
                if not case_success:
                    response_text = (f"No existe un caso con el correlativo {text} en nuetra base de datos.\n\n"
                                      "Por lo anterior, te instamos a realizar un reporte si conoces alguna situaci√≥n o predio que \n"
                                      "presente un riesgo de infestaci√≥n.")
                    
                    next_state = 'restart'
                    
                else:
                    
                    description = current_case_state_dict.get(
                            current_case_state, 
                            "no se tiene una descripci√≥n disponible para este estado."
                        )
                    response_text = (f"El caso {text} se encuentra en el estado: {current_case_state} "
                                     f"\n\nEsto significa que {description}\n\nPara reiniciar el chat, escribe alg√∫n texto de nuevo, por favor.")
                    
                    next_state = 'restart'
                
            else:
                response_text = ("No reconozco ese formato de caso.\nPor favor, env√≠a tu caso usando el formato `a√±o`-`# de caso`.\n\nEjemplo: 2025-0001")
        
        else:
            response_text = "‚ö†Ô∏è No detect√© un n√∫mero de caso. Por favor, env√≠a el n√∫mero siguiendo el formato 2025-<Numero de caso en 4 digitos>."
        
    # ============================================================
    # Preguntamos por la ubicaci√≥n. Si esta se env√≠a, generamos un n√∫mero de caso unico y un
    # numero de caso relativo para evitar duplicar reportes
    # ============================================================
    
    elif state == "ask-location":
        if lat and lon:
            
            # Usaremos el contador global de casos actuales en la BDD
            case_counter = get_total_cases_count() + 1

            # Generamos un id de reporte unico al tener ubicacion
            report_id = f"report_{uuid.uuid4()}"
            user_session[sender_id]["data"]["report_id"] = report_id

            # Generamos el n√∫mero de caso legible
            year = datetime.now().year
            case_number = f"CASO-{year}-{case_counter:04d}"
            user_session[sender_id]["data"]["case_number"] = case_number
            
            # Guardamos la ubicacion de latitud y longitud
            user_session[sender_id]["data"]["lat"] = lat
            user_session[sender_id]["data"]["lon"] = lon
            
            response_text = (
                "üìç *Ubicaci√≥n recibida correctamente.*\n\n Ahora, por favor env√≠a una **foto** del lote o planta afectada. üì∏"
            )
            next_state = "ask_photo"
        else:
            response_text = (
                "‚ö†Ô∏è No detect√© una ubicaci√≥n v√°lida. Por favor, usa el bot√≥n de üìç para enviarla correctamente."
            )
            
    # ============================================================
    # Pedimos una fotograf√≠a sobre lo reportado por el usuario
    # ============================================================
    elif state == "ask_photo":
        if photo_url:
            user_session[sender_id]["data"]["photo_url"] = photo_url
            response_text = (
                "üì∏ *Foto recibida correctamente.*\n" 
                "Por favor, ahora describe las condiciones del predio. Es de ayuda conocer si el predio se encuentra\n\n"
                "1. Abandonado\n2. En mal estado.\n3. Infestado por picudos.\n"
                "\nCualquier informacion adicional en tu descripci√≥n es de ayuda "
            )
            next_state = "ask_lot_description"
        else:
            response_text = "‚ö†Ô∏è No se detect√≥ una foto. Por favor env√≠a una imagen del lote afectado."


    # ============================================================
    # Luego preguntamos por una descripci√≥n detallada del usuario
    # ============================================================
    elif state == "ask_lot_description":    
        if text:
            user_session[sender_id]["data"]["user_lot_description"] = text
            
            response_text = (
                "Gracias por tu descripci√≥n del predio. Ahora, clasifica el riesgo que representa para t√≠ este predio de alguna de las siguientes formas:\n"
                "1. Alto\n2. Medio\n3. Bajo"
            )
            
            next_state = 'ask_risk'
        
        else:
            response_text = "‚ö†Ô∏è No se detect√≥ una respuesta v√°lida. Por favor, describe el estado del predio usando oraciones completas."
    
    # ============================================================
    # Ahora preguntamos el riesgo que el usuario percibe
    # ============================================================
    elif state == "ask_risk":
        
        if text in ["alta", "media", "baja", "alto", "medio", "bajo", "1", "2", "3"]:
            
            if text in ["1"]:
                text = "Alto"
            if text in ["2"]:
                text = "Medio"
            if text in ["3"]:
                text = "Bajo"
            
            user_session[sender_id]["data"]["user_risk_assesment"] = text.capitalize()
            data = user_session[sender_id]["data"]
            
            response_text = (
                f"‚úÖ Gracias por tu reporte.\n"
                f"üìç Ubicaci√≥n: ({data['lat']}, {data['lon']})\n"
                f"üì∏ Foto: Confirmada\n"
                f"üö® Riesgo: {data['user_risk_assesment']}\n"
                f"üí¨ Descripci√≥n: Recibida\n\n"
                "¬øEsta informaci√≥n es correcta? Responde con *S√≠* o *No*."
            )
            next_state = "confirmation"
        else:
            response_text = "Por favor indica el nivel de riesgo como: Alta, Media o Baja."

    # ============================================================
    # Ahora informamos sobre el reporte dando el correlativo de cada caso
    # ============================================================
    elif state == "confirmation":
        
        # Si el reporte es correcto, lo confirmamos
        if re.search(r'^\s*s[i√≠]\s*$', text):
        
            response_text = "üåæ Tu reporte ya fue registrado. ¬°Gracias por tu colaboraci√≥n!"
            next_state = "restart"
            
            inserted, case = insert_report_into_bdd(user_session[sender_id]["data"])
            
            if inserted:
                response_text = response_text + f"\n\nAdicionalmente, se cre√≥ el caso {case} por si quisieras consultar el estado del mismo."
            
        # Si nos dice que no es correcto, desechamos el reporte
        elif re.search(r'^\s*no\s*$', text):
            response_text = "‚ùå Entendido. Tu reporte no se registrar√°.\nPara repetir el reporte, o hacer otro, puedes volver a escribir sobre este mismo chat."
            next_state = "restart"
        
        # Si nos responde algo que no sabemos que es
        else:
            response_text = "Por favor responde √∫nicamente con *S√≠* o *No*."
            

    # Else que solo existe por si no capturamos la logica de la respuesta
    else:
        response_text = "No entend√≠ tu respuesta. Por favor intenta nuevamente."

    return response_text, next_state

In [None]:
def send_message(chat_id, text):
    """
    Env√≠a un mensaje de texto al usuario usando la API de Telegram.
    """
    payload = {
        "chat_id": chat_id,
        "text": text,
        "parse_mode": "Markdown"
    }
    try:
        response = requests.post(f"{BASE_URL}/sendMessage", json=payload)
        if response.status_code != 200:
            print(f"‚ö†Ô∏è Error enviando mensaje: {response.text}")
    except Exception as e:
        print(f"‚ùå Error al enviar mensaje: {e}")



In [None]:
# Esta funcion la usamos porque telegram necesita que hagamos scape 
# de algunos caracteres como puntos, signos de exclamacion, etc.
def escape_markdown_v2(text):
    return re.sub(r'([_*\[\]()~`>#+\-=|{}.!])', r'\\\1', text)



In [None]:
def process_rag_async(chat_id, query):

    try:
        response = rag_chain.invoke({"query": query})
        raw_output = response["result"]
        pattern = r'<answer>(.*?)</answer>'
        match = re.search(pattern, raw_output, re.DOTALL)
        
        clean_output = raw_output.split("</answer>")[0].strip() #match.group(1).strip() # raw_output.split("RESPUESTA DE ASISTENTE:")[-1].strip()
        
        send_message(chat_id, escape_markdown_v2(clean_output))
        
        # Actualizar estado
        if user_session[chat_id]["state"] == "NLP-Chatbot-3":
            send_message(chat_id, "Has llegado al l√≠mite de consultars consecutivos. En estos momentos se reiniciar√° el chat. Gracias.")
            user_session[chat_id]["state"] = "restart"
            
        elif user_session[chat_id]["state"] == "NLP-Chatbot-2":
            user_session[chat_id]["state"] = "NLP-Chatbot-3"
            
        elif user_session[chat_id]["state"] == "NLP-Chatbot-1":
            user_session[chat_id]["state"] = "NLP-Chatbot-2"
            
    except Exception as e:
        print(f"‚ùå Error en RAG: {e}")
        send_message(chat_id, "Lo siento, ocurri√≥ un error procesando tu consulta.")



In [None]:
TOKEN = os.getenv("TELEGRAM_BOT_TOKEN")
BASE_URL = f"https://api.telegram.org/bot{TOKEN}"

# Diccionario que guardara la informacion temporalmente
# antes de escribirla a la BDD
user_session = {}
case_counter = get_total_cases_count()

In [None]:
app = Flask(__name__)

@app.route("/webhook", methods=["POST"])
def telegram_webhook():
    """
    Webhook principal para manejar mensajes entrantes desde Telegram.
    Procesa texto, fotos y ubicaciones, mantiene el flujo de conversaci√≥n
    y responde usando la API de Telegram.
    """
    data = request.get_json()

    if "message" not in data:
        return "ok", 200

    message = data["message"]
    chat_id = message["chat"]["id"]
    username = message["chat"].get("username", "Desconocido")

    print("="*50)
    print(f"Mensaje recibido de @{username} | chat_id={chat_id}")
    print("="*50)

    # Si es la primera vez que el usuario escribe
    if (chat_id not in user_session) or (user_session[chat_id]["state"] == "restart"):
        print("Enviando menu al usuario")
        user_session[chat_id] = {
            "state": "saludo",
            "data": {
                "lat": None,
                "lon": None,
                "address": None,
                "photo_url": None,
                "user_risk_assesment": None,
                "user_lot_description": None,
                "report_id" : None,
                "case_number" : None,
                "phone_number": None,
                "price": None
            },
        }

        # Enviamos el men√∫ inicial
        send_menu(chat_id)
        return "ok", 200

    # Si el usuario se encuentra en modo Chatbot (NLP)
    # Si est√° en modo chatbot
    if user_session[chat_id]["state"] in ["NLP-Chatbot-1", "NLP-Chatbot-2", "NLP-Chatbot-3"]:
        print("ü§ñ Enviando consulta al RAG Chatbot...")
        query = message.get("text", "")

        thread = Thread(target=process_rag_async, args=(chat_id, query))
        thread.daemon = True
        thread.start()
        
        # Responder INMEDIATAMENTE a Telegram
        return "ok", 200

    # En caso contrario, seguimos el flujo de reporte
    current_state = user_session[chat_id]["state"]
    response_text, next_state = report_message_flow(chat_id, current_state, message)
    user_session[chat_id]["state"] = next_state

    send_message(chat_id, response_text)
    return "ok", 200

In [None]:
if __name__ == "__main__":
	app.run(port=3000, debug=False, use_reloader=False)