__LLAMA BOT ALPHA PREVIEW__ \
__by:__ Guillermo Javier Auza Banegas\
__Motivation:__ Skill Evaluation \
__Company:__ LlamitAI \
__Date:__ Feb 2025

For this notebook to work, ollama must be serving an LLM model and an embedding model, in this case deepseek and nomic respectively \
\
First of all, libraries must be imported, in this case langchain and its variants: community, llm, etc.

In [1]:
from langchain_community.document_loaders import DirectoryLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter

from langchain_chroma import Chroma
from langchain_ollama import OllamaEmbeddings

from langchain_ollama.llms import OllamaLLM
from langchain_core.prompts import ChatPromptTemplate

Now, we define the functions that will be used during our code:

In [2]:
def load_documents(path="./docs/txt/"): # default path is a double folder with txt files
    loader = DirectoryLoader(path, glob="*.txt") # read all txt files in the path
    docs = loader.load()
    return docs

def chunk_splitter(docs): # argument previously split documents
    text_splitter = RecursiveCharacterTextSplitter( 
        chunk_size = 750, 
        chunk_overlap = 300,
        length_function = len,
        add_start_index = True,
        )
    chunks = text_splitter.split_documents(docs) # turn each document into chunks using parameters from text splitter
    return chunks

def format_docs(docs): # turn documents into a single string
    return "\n\n".join(doc.page_content for doc in docs)

After declaring the functions, we can start defining the models and getting the embeddings from the text:

In [3]:
documents = load_documents() # load documents
chunks = chunk_splitter(documents) # turn list of docs into list of chunks

embedding_model = OllamaEmbeddings(model="nomic-embed-text") # load a model for embedding text
vectorstore = Chroma.from_documents(documents = chunks, embedding = embedding_model) # store embeddings in a vector store

model = OllamaLLM( # Define our LLM model and its parameters in this case, deepseek r1 with 14b params
    model="deepseek-r1:14b",
    temperature = 0,
    max_tokens = None,
    timeout = None,
    max_retries = 1,
    )

Now, lets define a template for our propts and for this example, a predefined question or petition

In [4]:
template = """Responde a la peticion cubierto en llaves de manera simple y concisa.
Para esta tarea utiliza el contexto en sus llaves correspondientes.

<contexto>
contexto : {context}
</contexto>

<peticion>
peticion: {question}
</peticion>
"""

question = """¿Quiénes son los demandados?
¿Quiénes son los demandantes?
¿Quién es el juez encargado del caso?
¿Que tipo de proceso es este?
¿Cuando y donde sucedio la demanda?"""

Finally, lets define the chain of operations for the model so we can invoke a simplified a chain of operations for the model

In [5]:
docs = vectorstore.similarity_search(question) # Search for similiraty in the embeddings from the question and our vector store
context = format_docs(docs) # Setup the document chunk as a string for context

prompt = ChatPromptTemplate.from_template(template) # create the prompt from our template with pending context and petition
chain = prompt | model # establish the chain of operation from the propt to the model

response = chain.invoke({"context": context, "question": question}) # invoke the chain of operations with determined context and petition

Number of requested results 4 is greater than number of elements in index 3, updating n_results = 3


At last, we can print the models output

In [6]:
from IPython.display import display, Markdown
display(Markdown(response))

<think>
Bueno, tengo que responder a las preguntas de la petición utilizando el contexto proporcionado. Primero, identificaré quiénes son los demandados y los demandantes. En el contexto, veo que "DEMANDANTE: 1. BANCO DEL PUEBLO S.A." y "A: 1. RAFAEL PEREZ BLANCO CON C.I. 8765402-LP." así que estos son respectivamente los demandantes y los demandados.

Luego, para saber quién es el juez encargado del caso, buscaré en el contexto la información sobre el juez. Veo que "JUEZ PUBLICO CIVIL y COMERCIAL 3" y el nombre de M Sc DAEN Fausto Calle M., así que eso responderá a quién es el juez.

El tipo de proceso se menciona como "PROCESO: CIVIL EJECUTIVO", así que ese será el tipo de proceso.

Para cuando y donde sucedió la demanda, en el contexto hay fechas y lugares. La sentencia inicial fue el 20 de septiembre de 2024, pero la petición menciona el 15 de enero de 2025, así que probablemente se refiere a cuando se presentó la solicitud o notificación. El lugar es La Paz, Bolivia.

Ahora, organizaré las respuestas de manera clara y concisa utilizando las llaves correspondientes.
</think>

**Respuesta:**

- **Demandados:** Rafael Pérez Blanco con CI 8765402-LP.
- **Demandantes:** Banco del Pueblo S.A.
- **Juez encargado:** Juez Público Civil y Comercial 3°, M.Sc. DAEN Fausto Calle M.
- **Tipo de proceso:** Civil ejecutivo.
- **Cuándo y dónde:** La demanda se presentó el 15 de enero de 2025 en la ciudad de La Paz, Bolivia.