In [21]:
import streamlit as st
import warnings
import configparser
import os
import logging
import random
import string
import time
from langchain_core.chat_history import BaseChatMessageHistory
from langchain_google_genai import GoogleGenerativeAIEmbeddings
from langchain_community.vectorstores import FAISS
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain.chains import create_history_aware_retriever, create_retrieval_chain
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain_core.runnables.history import RunnableWithMessageHistory
from langchain_community.chat_message_histories import ChatMessageHistory
from dotenv import load_dotenv
from langchain_community.llms import Ollama


load_dotenv() # Loads .env file

False

In [22]:
from langchain_huggingface import HuggingFaceEmbeddings

In [23]:
GOOGLE_API_KEY = ""
MODEL_EMBEDDINGS_GOOGLE = "models/embedding-001"
MODEL_LLM_GOOGLE = "gemini-1.5-pro"
OUTPUT_PATH = "output"
FAISS_GOOGLE_PATH = "output/faiss_index"
NUMEXPR_MAX_THREADS = "16"
TASK_TYPES = ["task_type_unspecified", "retrieval_query", "retrieval_document", "semantic_similarity", "classification", "clustering"]

In [24]:
CONTEXTUALIZE_Q_SYSTEM_PROMPT = """Dado un historial de chat y la última pregunta del usuario que podría referenciar contexto en dicho historial, reformula la pregunta para que sea independiente y comprensible sin necesidad de acceder al historial. No respondas la pregunta; solo reformúlala si es necesario, o devuélvela tal como está si ya es clara.
"""

In [48]:
PROMPT_TEMPLATE_GOOGLE = """Eres un asistente inteligente. Responde a la pregunta basándote únicamente en la información 
proporcionada en el contexto, específico para España.
Siempre prioriza mencionar artículos o leyes que estén directamente relacionados con la pregunta del usuario.
Si el contexto no contiene la respuesta, responde con: "La respuesta no está disponible en el contexto proporcionado."
Si la pregunta se refiere a un tema legal, intenta identificar y citar el artículo de la ley que aplique.
Genera las respuestas con tus propias palabras, sin copiar directamente el contenido, y asegúrate de que sean claras, fáciles de entender y 
aplicables a un público juvenil.
Por ejemplo, si la respuesta fuera el Artículo 48, responde "Artículo 48. Velocidades máximas en vías fuera de poblado." y la explicas.

Contexto:
{context}
"""

CONTEXTUALIZE_Q_SYSTEM_PROMPT = """Given a chat history and the latest user question which might reference context in the chat history, formulate a standalone question which can be understood without the chat history. Do NOT answer the question, just reformulate it if needed and otherwise return it as is."""

In [26]:
'''
PROMPT_TEMPLATE_GOOGLE = """You are an intelligent assistant. Answer the question based solely on the information provided in the context, specific for Spain.
Do not add any information beyond what is given. 
If the context does not contain the answer, respond with: "The answer is not available in the provided context."
Be concise and accurate. All the answers must be in Spanish language from Spain, in an informal manner.
Answers must be clear, precise, and unambiguous, and a teenager should be able to understand the answer.
Explicitly avoid phrases such as "según el documento", "según el capítulo", "en el texto", "como se menciona en el artículo", or any implication of external texts. Do not construct questions that require knowledge of the structure of the document or the location of information in it.
Include the content-specific information that supports the answer to allow the answer to be independent of any external text.
If the content lacks sufficient information to form a complete answer, do not force one.
Create the answers in your own words; Direct copying of content is not permitted.
NEVER mention the words "documento", "texto", "presentación", "archivo", "tabla", "artículo", "ley", "capítulo", "preámbulo", "título preliminar", "disposición" or "disposiciones generales" in your questions or answers.
ALWAYS make sure that all answers are accurate, self-contained, and relevant, without relying on any original document or text or implying its existence, strictly avoiding any invention or speculation.
IMPORTANT: if in the question there is no mention of a Comunidad Autonoma or the name of a city or province, try that the answer applies to Spain as a country.

Context:
{context}
"""
'''
PROMPT_TEMPLATE_LLAMA = """You are an intelligent assistant. Answer the question based solely on the information provided in the context, specific for Spain.
Do not add any information beyond what is given. 
If the context does not contain the answer, respond with: "The answer is not available in the provided context."
Be concise and accurate. All the answers must be in Spanish language from Spain, in an informal manner.
Answers must be clear, precise, and unambiguous, and a teenager should be able to understand the answer.
Explicitly avoid phrases such as "según el documento", "según el capítulo", "en el texto", "como se menciona en el artículo", or any implication of external texts. Do not construct questions that require knowledge of the structure of the document or the location of information in it.
Include the content-specific information that supports the answer to allow the answer to be independent of any external text.
If the content lacks sufficient information to form a complete answer, do not force one.
Create the answers in your own words; Direct copying of content is not permitted.
NEVER mention the words "documento", "texto", "presentación", "archivo", "tabla", "artículo", "ley", "capítulo", "preámbulo", "título preliminar", "disposición" or "disposiciones generales" in your questions or answers.
ALWAYS make sure that all answers are accurate, self-contained, and relevant, without relying on any original document or text or implying its existence, strictly avoiding any invention or speculation.
IMPORTANT: if in the question there is no mention of a Comunidad Autonoma or the name of a city or province, try that the answer applies to Spain as a country.

Context:
{context}

"""

In [27]:
store = {}

In [28]:
def load_config():
    global GOOGLE_API_KEY
    global MODEL_EMBEDDINGS_GOOGLE
    global OUTPUT_PATH
    global FAISS_GOOGLE_PATH
    global LOG_PATH
    global NUMEXPR_MAX_THREADS
    
    config = configparser.ConfigParser()
    config.read('streamlit_google_history_final.ini')
    GOOGLE_API_KEY = config['KEYS']['google_api_key']
    MODEL_EMBEDDINGS_GOOGLE = config['MODELS']['model_embeddings_google']
    MODEL_LLM_GOOGLE = config['MODELS']['model_llm_google']
    OUTPUT_PATH = config['DEFAULT']['output_path']
    FAISS_GOOGLE_PATH = config['DEFAULT']['faiss_google_path']
    NUMEXPR_MAX_THREADS = config['DEFAULT']['numexpr_max_threads']
    LOG_PATH = config['DEFAULT']['log_path']

In [29]:
def get_session_history(session_id: str) -> BaseChatMessageHistory:
    global store
    if session_id not in store:
        store[session_id] = ChatMessageHistory()
    return store[session_id]

In [30]:
def get_conversational_chain(retriever):
    
    llm = ChatGoogleGenerativeAI(model = MODEL_LLM_GOOGLE, temperature = 0.3)
    #llm = Ollama(model='llama3.1:8b-instruct-q4_K_M')
    
    contextualize_q_prompt = ChatPromptTemplate.from_messages(
        [
            ("system", CONTEXTUALIZE_Q_SYSTEM_PROMPT),
            MessagesPlaceholder("chat_history"),
            ("human", "{input}"),
        ]
    )
    
    history_aware_retriever = create_history_aware_retriever(
        llm, retriever, contextualize_q_prompt
    )
    
    qa_prompt = ChatPromptTemplate.from_messages(
        [
            ("system", PROMPT_TEMPLATE_GOOGLE),
            #("system", PROMPT_TEMPLATE_LLAMA),
            MessagesPlaceholder("chat_history"),
            ("human", "{input}"),
        ]
    )
    
    question_answer_chain = create_stuff_documents_chain(llm, qa_prompt)
    rag_chain = create_retrieval_chain(history_aware_retriever, question_answer_chain)
    
    conversational_rag_chain = RunnableWithMessageHistory(
        rag_chain,
        get_session_history,
        input_messages_key="input",
        history_messages_key="chat_history",
        output_messages_key="answer",
    )
    
    return conversational_rag_chain

In [31]:
def user_input(user_question, k_value, session_id):
    #embeddings = GoogleGenerativeAIEmbeddings(model = MODEL_EMBEDDINGS_GOOGLE, task_type=task_type)
    embeddings = HuggingFaceEmbeddings(model_name="paraphrase-multilingual-MiniLM-L12-v2")
    #new_db = FAISS.load_local(FAISS_GOOGLE_PATH + "_" + task_type, embeddings, allow_dangerous_deserialization=True)
    new_db = FAISS.load_local("output/faiss_index_2", embeddings, allow_dangerous_deserialization=True)
    retriever = new_db.as_retriever(search_kwargs={"k": k_value})
    chain = get_conversational_chain(retriever)
    response = chain.invoke(
        {"input": user_question},
        config={
            "configurable": {"session_id": session_id}
        },
    )
    
    return response

In [32]:
def response_generator(prompt, k_value, session_id):
    start_model_exec = time.time()
    response = user_input(prompt, k_value, session_id)
    end_model_exec = time.time()
    resp_text = "{0} (Tiempo de respuesta: {1:.2f} seg. Session ID: {2}).".format(response, end_model_exec - start_model_exec,  session_id)
    for word in resp_text.split():
        yield word + " "
        time.sleep(0.05)

In [33]:
warnings.filterwarnings("ignore", category=FutureWarning)
load_config()
os.environ["NUMEXPR_MAX_THREADS"] = NUMEXPR_MAX_THREADS
os.environ['GOOGLE_API_KEY'] = GOOGLE_API_KEY

In [34]:
k_value = 16
session_id = "hdb00101"
task_type="retrieval_document"
prompt = "Cuál es el limite de velocidad de un camión?"

response = {}
for task in TASK_TYPES:
    response[task] = user_input(prompt, k_value, session_id, task)

for task in TASK_TYPES:
    print(task)
    print(response[task]['context'])

In [36]:
response = user_input(prompt, k_value, session_id)

In [37]:
response['answer']

'Para saber el límite de velocidad de un camión, necesitaría saber por qué tipo de vía está circulando. El artículo 48 del contexto proporcionado detalla las velocidades máximas según el tipo de vía y vehículo. Por favor, proporciona más información sobre la vía por la que circula el camión. \n'

In [None]:
response['context']

In [39]:
response = user_input("poblado", k_value, session_id)

In [40]:
response['answer']

'Dentro de poblado, la velocidad máxima permitida para un camión generalmente es de **50 km/h**. \n\nSin embargo, esta velocidad puede ser **menor** en travesías especialmente peligrosas o en vías urbanas donde la autoridad local haya establecido una reducción. \n\nTe recomiendo estar atento a la señalización, ya que siempre prevalece sobre el límite general. \n\nEsta información la puedes encontrar detallada en el **Artículo 50** del contexto. \n'

In [41]:
response = user_input("y en carretera", k_value, session_id)

In [42]:
response['answer']

'Para poder decirte el límite de velocidad de un camión en carretera, necesito saber a qué tipo de carretera te refieres. ¿Podrías especificar si se trata de una autopista, autovía o carretera convencional? \n\nTen en cuenta que el límite también puede variar si la carretera convencional tiene arcén pavimentado o más de un carril en un sentido.\n\nToda esta información la puedes encontrar en el **Artículo 48** del contexto. \n'

In [43]:
response = user_input("Cuál es el limite de velocidad de un camión en una carretera convencional?", k_value, session_id)

In [44]:
response['answer']

'El límite de velocidad de un camión en una carretera convencional depende de si esta tiene arcén pavimentado y su anchura:\n\n* **Carretera convencional con arcén pavimentado de 1,50 metros o más de anchura, o con más de un carril en un sentido:**  80 km/h (Artículo 48.1.a.2).\n* **Resto de carreteras convencionales:** 70 km/h (Artículo 48.1.a.3).\n\nRecuerda que estos límites son generales y pueden variar si hay señalización específica en la vía. \n'

In [45]:
response = user_input("que pasa si me dan atras?", k_value, session_id)

In [46]:
response['answer']

'Si te dan por detrás en un accidente de tráfico, lo primero que debes hacer es mantener la calma y seguir las normas de seguridad vial:\n\n1. **Asegura la zona:** Enciende las luces de emergencia, señaliza el accidente con los triángulos y ponte el chaleco reflectante.\n2. **Auxilia a los heridos:** Si hay heridos, llama al 112 y proporciona asistencia si estás capacitado.\n3. **Llama a la policía:** Si hay heridos, daños materiales importantes o desacuerdo sobre la responsabilidad, llama a la policía o guardia civil para que levanten atestado.\n4. **Intercambia datos:** Intercambia los datos del seguro y del vehículo con el otro conductor implicado.\n5. **Rellena el parte amistoso:** Es importante rellenar el parte amistoso de accidente con la mayor precisión posible, incluyendo la fecha, hora, lugar, daños y datos de los implicados.\n6. **Informa a tu aseguradora:** Informa a tu aseguradora del accidente lo antes posible, incluso si no eres el culpable.\n\nEn cuanto a la responsabil

In [49]:
response = user_input("cuales son las tasas de alcohol?", k_value, session_id)
response['answer']

'Ya te he proporcionado esa información. En España, las tasas de alcohol permitidas al volante se encuentran en el **Artículo 20** y son las siguientes:\n\n**Para conductores en general:**\n\n* **Tasa de alcohol en sangre:** No superior a 0,5 gramos por litro.\n* **Tasa de alcohol en aire espirado:** No superior a 0,25 miligramos por litro.\n\n**Para conductores profesionales y de vehículos especiales:**\n\n* **Tasa de alcohol en sangre:** No superior a 0,3 gramos por litro.\n* **Tasa de alcohol en aire espirado:** No superior a 0,15 miligramos por litro.\n\n**Para conductores noveles:**\n\n* **Tasa de alcohol en sangre:** No superior a 0,3 gramos por litro.\n* **Tasa de alcohol en aire espirado:** No superior a 0,15 miligramos por litro.\n\nConducir bajo los efectos del alcohol es peligroso e ilegal. \n'

In [50]:
embeddings = HuggingFaceEmbeddings(model_name="paraphrase-multilingual-MiniLM-L12-v2")