In [17]:
import os
import dotenv
from langchain_community.utilities import SQLDatabase
from langchain_core.messages import SystemMessage, HumanMessage, AIMessage
from langchain_community.vectorstores import FAISS
from langchain_huggingface import HuggingFaceEmbeddings
from langchain.chat_models import init_chat_model
from langchain_community.tools.sql_database.tool import QuerySQLDatabaseTool
from langchain_community.docstore import InMemoryDocstore 
from langchain.chains import RetrievalQA
from langchain.prompts import (
    PromptTemplate,
    SystemMessagePromptTemplate,
    HumanMessagePromptTemplate,
    ChatPromptTemplate,
)
import faiss
import tqdm
import numpy as np

In [18]:
dotenv.load_dotenv()
mysql_url = "mysql+mysqlconnector://root:175003@localhost:3306/hospital"
db = SQLDatabase.from_uri(mysql_url)
llm = init_chat_model("llama3-70b-8192", model_provider="groq")

In [19]:
# # Initialize embeddings
# embeddings = HuggingFaceEmbeddings(
#     model_name="sentence-transformers/all-MiniLM-L6-v2",
#     model_kwargs={'device': 'cpu'},
#     encode_kwargs={
#         'normalize_embeddings': True,  
#         'batch_size': 128,             
#     }
# )

# # Vector store path
# VECTOR_STORE_PATH = "./vector_store.faiss"

In [20]:
query = """
    SELECT comment
    FROM reviews
    WHERE comment IS NOT NULL AND comment != ''
    ORDER BY created_at DESC
    LIMIT 100
    """
execute_query_tool = QuerySQLDatabaseTool(db=db)
results = execute_query_tool.invoke(query)

In [21]:
print("Results:", results)

Results: [('Hà Ánh Mai feed back about Nguyễn Quốc Dũng as: Thái độ của bác sĩ rất lạnh lùng và thiếu sự đồng cảm, làm tôi cảm thấy mình như một con số hơn là một con người cần được chữa trị.',), ('Nguyễn Văn B feed back about Nguyễn Quốc Dũng as: Thái độ làm việc tốt, nhưng quá nghiêm khắc, đôi lúc ngây khó chịu cho người bệnh, cần cải thiện thái độ hơn nữa',), ('Nguyễn Văn B feed back about Hoàng Thị Phượng as: Bác sĩ này rất là nhiệt tình và tốt bụng',), ('Nguyễn Văn D feed back about John Doe as: I had a wonderful experience with Dr. John Doe. He is a kind-hearted, hardworking, and dedicated person who always cares deeply for his patients and his work.',), ('Nguyễn Văn C feed back about John Doe as: I had a wonderful experience with Dr. A. Their professionalism and empathy made me feel at ease. I highly recommend them to anyone seeking quality medical care.',), ('Nguyễn Văn B feed back about John Doe as: Dr. A is incredibly attentive and compassionate. They took the time to listen 

In [22]:
def process_results(results_string: str) -> list:
    """Process the results string into a list of comments"""
    clean_str = results_string.strip('[]')
    rows = clean_str.split('), (')
    
    comments = []
    for row in rows:
        clean_row = row.strip("(')")
        clean_row = clean_row[:-2]
        if clean_row:
            comments.append(clean_row)
    
    return comments

In [23]:
comments = process_results(results)

In [24]:
print(comments)

['Hà Ánh Mai feed back about Nguyễn Quốc Dũng as: Thái độ của bác sĩ rất lạnh lùng và thiếu sự đồng cảm, làm tôi cảm thấy mình như một con số hơn là một con người cần được chữa trị.', 'Nguyễn Văn B feed back about Nguyễn Quốc Dũng as: Thái độ làm việc tốt, nhưng quá nghiêm khắc, đôi lúc ngây khó chịu cho người bệnh, cần cải thiện thái độ hơn nữa', 'Nguyễn Văn B feed back about Hoàng Thị Phượng as: Bác sĩ này rất là nhiệt tình và tốt bụng', 'Nguyễn Văn D feed back about John Doe as: I had a wonderful experience with Dr. John Doe. He is a kind-hearted, hardworking, and dedicated person who always cares deeply for his patients and his work.', 'Nguyễn Văn C feed back about John Doe as: I had a wonderful experience with Dr. A. Their professionalism and empathy made me feel at ease. I highly recommend them to anyone seeking quality medical care.', 'Nguyễn Văn B feed back about John Doe as: Dr. A is incredibly attentive and compassionate. They took the time to listen to my concerns and provid

In [25]:
# if not os.path.exists(VECTOR_STORE_PATH):
#     # Create embeddings for the comments
#     embedded_texts = embeddings.embed_documents(comments)
#     embeddings_array = np.array(embedded_texts, dtype=np.float32)
    
#     # Get dimension from embeddings
#     dimension = embeddings_array.shape[1]
    
#     # Create FAISS index
#     index = faiss.IndexFlatL2(dimension)
#     index.add(embeddings_array)
    
#     # Create vector store
#     vector_store = FAISS(
#         embedding_function=embeddings,
#         index=index,
#         docstore=InMemoryDocstore({i: doc for i, doc in enumerate(comments)}),
#         index_to_docstore_id={i: str(i) for i in range(len(comments))}
#     )
    
#     # Save the vector store
#     vector_store.save_local(VECTOR_STORE_PATH)
# else:
#     # Load existing vector store with allow_dangerous_deserialization=True
#     vector_store = FAISS.load_local(
#         VECTOR_STORE_PATH, 
#         embeddings, 
#         allow_dangerous_deserialization=True
#     )

In [26]:
review_template = """Answer the question about doctor reviews based on the following information. Be brief and accurate.
If you don't know an answer, say you don't know.
{context}
"""

review_system_prompt = SystemMessagePromptTemplate(
    prompt=PromptTemplate(input_variables=["context"], template=review_template)
)

review_human_prompt = HumanMessagePromptTemplate(
    prompt=PromptTemplate(input_variables=["question"], template="{question}")
)

review_prompt = ChatPromptTemplate(
    input_variables=["context", "question"],
    messages=[review_system_prompt, review_human_prompt]
)

In [27]:
from langchain.schema import Document
from langchain_community.retrievers import TFIDFRetriever 

documents = [Document(page_content=comment) for comment in comments]
retriever = TFIDFRetriever.from_documents(documents)

reviews_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=retriever,
    chain_type_kwargs={"prompt": review_prompt}
)

In [28]:
def get_review_response(messages: list) -> str:
    if not messages:
        return "Không có tin nhắn nào để xử lý."
    
    system_message = SystemMessage(content="""You are a helpful AI assistant that maintains conversation context 
                      and answers questions accurately 
                      and answer me using Vietnamese
                      and only answer the question based on the context retrieved by Database SQL.""")
    
    full_messages = [system_message] + messages
    
    conversation = "\n".join([msg.content for msg in full_messages])
    print(conversation)
    
    response_dict = reviews_chain.invoke(conversation)
    
    return response_dict.get('result', "Không có câu trả lời hợp lệ.")

In [29]:
history = [
    {"role": "user", "content": "Bác sĩ Nguyễn Quốc Dũng trong bệnh viện MEDCASE được bệnh nhân đánh giá như nào ?, trả lời chính xác dựa trên thông tin được lưu trong SQL"},
]
messages = []
for entry in history:
    if entry["role"] == "user":
        messages.append(HumanMessage(content=entry["content"]))
    else:
        messages.append(AIMessage(content=entry["content"]))
response = get_review_response(messages)
print("Response:", response)

You are a helpful AI assistant that maintains conversation context 
                      and answers questions accurately 
                      and answer me using Vietnamese
                      and only answer the question based on the context retrieved by Database SQL.
Bác sĩ Nguyễn Quốc Dũng trong bệnh viện MEDCASE được bệnh nhân đánh giá như nào ?, trả lời chính xác dựa trên thông tin được lưu trong SQL
Response: Theo thông tin được lưu trong SQL, bác sĩ Nguyễn Quốc Dũng được bệnh nhân đánh giá là: "Thái độ của bác sĩ rất lạnh lùng và thiếu sự đồng cảm, làm tôi cảm thấy mình như một con số hơn là một con người cần được chữa trị" và "Thái độ làm việc tốt, nhưng quá nghiêm khắc, đôi lúc ngây khó chịu cho người bệnh, cần cải thiện thái độ hơn nữa".


In [30]:
# question = "How many are there doctors in hospital ?"
# vector_response = reviews_chain.invoke(question)
# print(vector_response["result"])