In [2]:


import streamlit as st
from pymilvus import connections, db, CollectionSchema, FieldSchema, DataType, Collection, MilvusClient
import os
from dotenv import load_dotenv, find_dotenv


from langchain_community.chat_message_histories import StreamlitChatMessageHistory
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.runnables.history import RunnableWithMessageHistory
from langchain_openai import ChatOpenAI

# import Langchain modules
from langchain.agents import tool
from langchain_text_splitters import CharacterTextSplitter
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnableParallel, RunnablePassthrough
from langchain_core.output_parsers import StrOutputParser
from langchain_core.documents import Document
from langchain_community.document_loaders import TextLoader, PyPDFDirectoryLoader
from langchain_openai import ChatOpenAI, OpenAIEmbeddings
from langchain_milvus.vectorstores import Milvus

# Load docs
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.chains import ConversationalRetrievalChain

######################### VARIABLES DE ENTORNO #########################
QUERY = "Tratamiento del parkinson segun el documento aportado"

LLM_MODEL = "gpt-4o"
EMBEDDING_MODEL = "text-embedding-3-large"
DIMENSION_EMBEDDING = 3072

INPUT_FILE = "./colonoscopy.txt"
OUTPUT_FILE = f"{INPUT_FILE}_output.txt"
BD_NAME = "JOTI_1975"
COLLECTION_NAME = "Joti_Col"

URI_CONNECTION = "http://localhost:19530"
HOST = "localhost"
PORT = 19530



In [3]:

def getVectorStoreMilvus(dbName, collectionName, api_key_openAI):
    ######################### CONEXIÓN A MILVUS #########################

    uri = URI_CONNECTION

    client = MilvusClient(
        uri=uri,
        token="joaquin:chamorro"
    )

    connections.connect(alias="default", host=HOST, port=PORT)

    ######################### CREAR LA BASE DE DATOS EN MILVUS #########################

    db_name = dbName
    if db_name not in db.list_database():
        db.create_database(db_name, using="default")
        db.using_database(db_name, using="default")
    else:
        db.using_database(db_name, using="default")

    print(f"Conectado a la base de datos {db_name}")

    ######################### GUARDAR LOS VECTORES EN MILVUS - VECTORSTORE #########################
    #vector_store = Milvus()

    # Crear la función de embeddings de código abierto
    embeddings = OpenAIEmbeddings(model="text-embedding-3-large", api_key=api_key_openAI)

    index_params = {
        "index_type": "HNSW",
        "metric_type": "COSINE",
        "params": {"M": 8, "efConstruction": 64}
    }

    vector_store = Milvus(
        embeddings,
        collection_name=collectionName,
        connection_args={"uri": uri},
        enable_dynamic_field=True,
        primary_field="pk",
        text_field="text",
        vector_field="vector",
        index_params=index_params
    )
    print("Colección ya existe")

    print(f"Conexión a Milvus-VectorStore establecida.\nConectado a colleccion: {collectionName}\n")
    
    return vector_store




In [4]:

def get_conversation_chain(vectorstore):
    llm = ChatOpenAI(temperature=0, model="gpt-4o-mini")
    # llm = HuggingFaceHub(repo_id="google/flan-t5-xxl", model_kwargs={"temperature":0.5, "max_length":512})

    memory = ConversationBufferMemory(
        memory_key='chat_history', return_messages=True)
    conversation_chain = ConversationalRetrievalChain.from_llm(
        llm=llm,
        retriever=vectorstore.as_retriever(),
        memory=memory
    )
    return conversation_chain

In [5]:

######################### OBTENER API KEY DE OPENAI #########################
# Carga las variables de entorno desde un archivo .env
load_dotenv(find_dotenv(), override=True)

# Obtiene la API key de OpenAI desde las variables de entorno
api_key_openAI = os.environ.get("OPENAI_API_KEY")
print(api_key_openAI)



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


In [7]:

from langchain.chains import create_history_aware_retriever, create_retrieval_chain
from langchain.chains.combine_documents import create_stuff_documents_chain



llm = ChatOpenAI(model="gpt-4o", api_key=api_key_openAI)
vectorstore = getVectorStoreMilvus(BD_NAME, COLLECTION_NAME, api_key_openAI)

condense_question_system_template = (
    "Given a chat history and the latest user question "
    "which might reference context in the chat history, "
    "formulate a standalone question which can be understood "
    "without the chat history. Do NOT answer the question, "
    "just reformulate it if needed and otherwise return it as is."
)

condense_question_prompt = ChatPromptTemplate.from_messages(
    [
        ("system", condense_question_system_template),
        ("placeholder", "{chat_history}"),
        ("human", "{input}"),
    ]
)
history_aware_retriever = create_history_aware_retriever(
    llm, vectorstore.as_retriever(), condense_question_prompt
)

system_prompt = (
    "You are an assistant for question-answering tasks. "
    "Use the following pieces of retrieved context to answer "
    "the question. If you don't know the answer, say that you "
    "don't know. Use three sentences maximum and keep the "
    "answer concise."
    "\n\n"
    "{context}"
)

qa_prompt = ChatPromptTemplate.from_messages(
    [
        ("system", system_prompt),
        ("placeholder", "{chat_history}"),
        ("human", "{input}"),
    ]
)
qa_chain = create_stuff_documents_chain(llm, qa_prompt)

convo_qa_chain = create_retrieval_chain(history_aware_retriever, qa_chain)

convo_qa_chain.invoke(
    {
        "input": "What is the treatment for Parkinson's disease?",
        "chat_history": [],
    }
)

Conectado a la base de datos JOTI_1975
Colección ya existe
Conexión a Milvus-VectorStore establecida.
Conectado a colleccion: Joti_Col



{'input': "What is the treatment for Parkinson's disease?",
 'chat_history': [],
 'context': [Document(metadata={'pk': 451747228985388032, 'source': '../milvus/parkinson_gpt.txt', 'chunk': 6, 'Title': 'Parkinson', 'Capitulo': '30', 'author': 'Joaquin Chamorro'}, page_content='El PD es una enfermedad neurodegenerativa progresiva. No se ha demostrado que ningún medicamento detenga, ralentice, revierta o prevenga la progresión de la enfermedad, aunque varios han sido evaluados en ensayos clínicos con resultados en gran medida decepcionantes. Por lo tanto, las estrategias terapéuticas actuales se basan en medicamentos que mejoran los síntomas, con el objetivo de permitir que el paciente continúe funcionando de manera independiente durante el mayor tiempo posible. El tratamiento debe individualizarse según los síntomas del paciente y la etapa de la enfermedad. Decidir qué medicamentos usar y cuándo usarlos sigue siendo uno de los mayores desafíos en el tratamiento de pacientes con PD. Los m

In [8]:

convo_qa_chain.invoke(
    {
        "input": "What is the clinic for Parkinson's disease?",
        "chat_history": [],
    }
)

{'input': "What is the clinic for Parkinson's disease?",
 'chat_history': [],
 'context': [Document(metadata={'pk': 451747228985388028, 'source': '../milvus/parkinson_gpt.txt', 'chunk': 2, 'Title': 'Parkinson', 'Capitulo': '30', 'author': 'Joaquin Chamorro'}, page_content='Los síntomas motores clave de la PD resultan de la degeneración de las neuronas productoras de dopamina (DA) dentro de la pars compacta de la sustancia negra y las células productoras de norepinefrina (NE) del locus coeruleus en el tronco encefálico. Sin embargo, la PD es un trastorno clínico complejo que incluye varias manifestaciones no motoras, incluyendo disfunción autonómica (por ejemplo, estreñimiento, hipotensión ortostática), alteraciones del sueño (por ejemplo, trastorno del comportamiento del movimiento ocular rápido [REM]), y alteraciones en el estado de ánimo y la cognición. Subyacente a estos síntomas clínicos (muchos de los cuales pueden preceder a los signos motores) está la patología que involucra neu