In [None]:
import logging
import traceback
from langchain_chroma import Chroma
from langchain_huggingface import HuggingFaceEmbeddings
from langchain.prompts import PromptTemplate
from langchain_ollama import OllamaLLM
import datetime

# Configuraci√≥n del logger
logging.basicConfig(
    filename=f"/home/m/Escritorio/RAG/logs/{str(datetime.datetime.today().strftime('%Y-%m-%d'))}_query.log",  # Guardar logs en un archivo
    level=logging.DEBUG,  # Puedes cambiarlo a INFO en producci√≥n
    format="%(asctime)s - %(levelname)s - %(message)s",
    datefmt="%Y-%m-%d %H:%M:%S"
)

logging.debug("üß™ Query inicializada correctamente.")


# Ruta al directorio donde est√° la base vectorial
CHROMA_PATH = "db"

# Cargar embeddings
EMBEDDING_MODEL_NAME = "sentence-transformers/all-MiniLM-L6-v2"

def load_vector_store(persist_path):
    """Carga la base de datos vectorial desde disco."""
    try:
        logging.info(f"üß† Cargando base vectorial desde: {persist_path}")
        embeddings = HuggingFaceEmbeddings(model_name=EMBEDDING_MODEL_NAME)
        vectordb = Chroma(persist_directory=persist_path, embedding_function=embeddings)
        logging.info("‚úÖ Base vectorial cargada correctamente.")
        return vectordb
    except Exception as e:
        logging.error(f"‚ùå Error cargando la base vectorial: {e}")
        traceback.print_exc()
        return None

def query_llm(query, vectordb):
    """Consulta el modelo LLM local usando el contexto de los documentos m√°s relevantes."""
    try:
        # Realiza la b√∫squeda en la base de datos vectorial
        logging.info("üîç Buscando en la base vectorial...")
        results = vectordb.similarity_search(query, k=3)  # Tomar los 3 resultados m√°s relevantes
        if not results:
            logging.warning("‚ö†Ô∏è No se encontraron resultados relevantes.")
            return "Lo siento, no pude encontrar informaci√≥n relevante."

        # Concatenar los resultados m√°s relevantes
        context = "\n".join([result.page_content for result in results])
        logging.info("‚úÖ Resultados encontrados, creando prompt para LLM...")

        # Configuraci√≥n de Ollama (modelo local)
        llm = OllamaLLM(model="llama3")  # Puedes cambiarlo por otro modelo como llama3

        # Pregunta al modelo con el contexto
        prompt = f"Contexto:\n{context}\n\nPregunta: {query}\nRespuesta:"
        response = llm(prompt)
        
        return response
    except Exception as e:
        logging.error(f"‚ùå Error en la consulta LLM: {e}")
        traceback.print_exc()
        return "Hubo un error procesando tu consulta."




In [None]:
if __name__ == "__main__":
    logging.info("üöÄ Iniciando consulta...")

    # Cargar base vectorial
    vectordb = load_vector_store(CHROMA_PATH)
    if not vectordb:
        logging.warning("‚ö†Ô∏è No se pudo cargar la base vectorial. Finalizando.")
        exit()

In [None]:
# Ingresar consulta
query = input("Escribe tu consulta: ")
if not query.strip():
    logging.warning("‚ö†Ô∏è No se ingres√≥ ninguna consulta.")
    exit()

# Consultar al LLM
response = query_llm(query, vectordb)
logging.info(f"Pregunta al modelo:\n{query}")
logging.info(f"Respuesta del modelo:\n{response}")