In [1]:
import os
from langchain.document_loaders import PyPDFLoader # investigate why this specific loader and if there aren't any better ones
from langchain.text_splitter import RecursiveCharacterTextSplitter

In [2]:
FOLDER_PATH = 'data/commented-penal-code'

In [3]:
FILES_PATH = []

for file in os.listdir(FOLDER_PATH):
    FILES_PATH.append(os.path.join(FOLDER_PATH, file))

In [4]:
loader = PyPDFLoader(file_path=FILES_PATH[1])

textSplitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,
    chunk_overlap=0,
)

documentData = loader.load_and_split(text_splitter=textSplitter)

In [7]:
# now we have to decide where to store the chunks and how we create the embeddings

## embeddings
# using custom embedding with langchain
from langchain.embeddings import HuggingFaceEmbeddings

embeddingsModelAllMini = HuggingFaceEmbeddings(model_name='sentence-transformers/all-MiniLM-L6-v2') 


In [8]:
embeddingsModelLabse = HuggingFaceEmbeddings(model_name='sentence-transformers/LaBSE') # supposedly better for multilingual tasks

.gitattributes: 100%|██████████| 391/391 [00:00<00:00, 1.56MB/s]
1_Pooling/config.json: 100%|██████████| 190/190 [00:00<00:00, 975kB/s]
2_Dense/config.json: 100%|██████████| 114/114 [00:00<00:00, 634kB/s]
pytorch_model.bin: 100%|██████████| 2.36M/2.36M [00:00<00:00, 11.3MB/s]
README.md: 100%|██████████| 2.19k/2.19k [00:00<00:00, 8.85MB/s]
config.json: 100%|██████████| 804/804 [00:00<00:00, 2.13MB/s]
config_sentence_transformers.json: 100%|██████████| 122/122 [00:00<00:00, 239kB/s]
pytorch_model.bin: 100%|██████████| 1.88G/1.88G [02:31<00:00, 12.4MB/s]
sentence_bert_config.json: 100%|██████████| 53.0/53.0 [00:00<00:00, 113kB/s]
special_tokens_map.json: 100%|██████████| 112/112 [00:00<00:00, 496kB/s]
tokenizer.json: 100%|██████████| 9.62M/9.62M [00:01<00:00, 8.30MB/s]
tokenizer_config.json: 100%|██████████| 411/411 [00:00<00:00, 2.00MB/s]
vocab.txt: 100%|██████████| 5.22M/5.22M [00:00<00:00, 6.41MB/s]
modules.json: 100%|██████████| 461/461 [00:00<00:00, 1.37MB/s]


### Mini

In [9]:
# where are we going to store the embeddings vectors now? 
from langchain.vectorstores import Chroma

# save to disk
vectorDatabaseMini = Chroma.from_documents(documentData, embeddingsModelAllMini, persist_directory='db/chroma_db/mini')

In [10]:
# query using the already saved in notebook vectorDatabaseMini
vectorDatabaseMini.similarity_search('homicidio culposo')

[Document(page_content='que no implica la aplicación retroactiva de la ley el decomiso de los bienes menciona\xad\ndos, respecto de hechos cometidos con anterioridad a su vigencia, si han servido para \ncometer el delito. Por las mismas razones, tampoco constituirá aplicación analógica, \n(495) I\'WERIK, op. cit., p. 312. \n(496) :-.Jl);\\\'EZ, "Manual. .. ", p. 314. CCrim. 1" Corrientes, 197111 2/23, "Vallejos, Pahlo S.", lA, \n13-713. En un rallo sohre homicidio culposo, donde se condenó a los propietarios de tres pe\xad\nrros que mataron a una niña, se decidió que no correspondía el decomiso de los animales por \ntratarse de un delito culposo (ver IPI3A LIOI, p. 51,1\'.159). \n(497) ¿\\I\'FAnm¡¡, Al.A(;IA y Sl.OK.·\\R op. CiL, p. 943.lJna interpretación similar sostiene FEDEnlK, op. \ncit., p. 314, destacando que en el delito culposo no hay instrumentos ya que la cosa que utiliza \nel autor no es el medio para realizar el resultado, sino que éste deviene de una falta de previ\xad', 

In [11]:
# load from disk
vectorDatabaseMiniFromDbFolder = Chroma(persist_directory='db/chroma_db/mini', embedding_function=embeddingsModelAllMini)

In [12]:
# query using the one from disk now 
vectorDatabaseMiniFromDbFolder.similarity_search('homicidio culposo')

[Document(page_content='que no implica la aplicación retroactiva de la ley el decomiso de los bienes menciona\xad\ndos, respecto de hechos cometidos con anterioridad a su vigencia, si han servido para \ncometer el delito. Por las mismas razones, tampoco constituirá aplicación analógica, \n(495) I\'WERIK, op. cit., p. 312. \n(496) :-.Jl);\\\'EZ, "Manual. .. ", p. 314. CCrim. 1" Corrientes, 197111 2/23, "Vallejos, Pahlo S.", lA, \n13-713. En un rallo sohre homicidio culposo, donde se condenó a los propietarios de tres pe\xad\nrros que mataron a una niña, se decidió que no correspondía el decomiso de los animales por \ntratarse de un delito culposo (ver IPI3A LIOI, p. 51,1\'.159). \n(497) ¿\\I\'FAnm¡¡, Al.A(;IA y Sl.OK.·\\R op. CiL, p. 943.lJna interpretación similar sostiene FEDEnlK, op. \ncit., p. 314, destacando que en el delito culposo no hay instrumentos ya que la cosa que utiliza \nel autor no es el medio para realizar el resultado, sino que éste deviene de una falta de previ\xad', 

### LaBSE

In [13]:
# save to disk
vectorDatabaseLaBSE = Chroma.from_documents(documentData, embeddingsModelLabse, persist_directory='db/chroma_db/LaBSE')

In [14]:
# query using the already saved in notebook vectorDatabaseLaBSE
vectorDatabaseLaBSE.similarity_search('homicidio culposo')

[Document(page_content='613 Art.55 \n-art. 170. segunda parte del Cód. Penal: texto anterior a la ley 25.742- (reconociéndo\xad\nse en el caso que. si bien es dudosa la presencia del concurso ideal entre delitos perma\xad\nnentes e instantáneos. "tal concurrencia se admite ... cuando la conducta del delito \ninstantáneo -matar- coincide con el momento en que comienza la acción típica del \ndelito permanente -priFar de la Jib erra d-sin que ello resulte de una nueva resolu\xad\nción criminal\') 227; la tentati\\\'a de robo calificado (por el resultado "homicidio" \n-art. 165-) y el homicidio simple (art. 79) 228; el homicidio simple y el aborto (en el \ncaso, el imputado mató a su concubina que se hallaba en el sexto mes de gestación del \nhijo de ambos) ~29; el homicidio -simple- y la tentativa de homicidio (en el caso. el \nimputado disparó reiteradamente un arma de fuego contra dos personas hiriendo a \nuna y matando a otra) 2:\\0; el homicidio culposo y las lesiones culposas (en el 

In [15]:
# load from disk
vectorDatabaseLaBSEFromDbFolder = Chroma(persist_directory='db/chroma_db/LaBSE', embedding_function=embeddingsModelLabse)

In [16]:
# query using the one from disk now 
vectorDatabaseLaBSEFromDbFolder.similarity_search('homicidio culposo')

[Document(page_content='613 Art.55 \n-art. 170. segunda parte del Cód. Penal: texto anterior a la ley 25.742- (reconociéndo\xad\nse en el caso que. si bien es dudosa la presencia del concurso ideal entre delitos perma\xad\nnentes e instantáneos. "tal concurrencia se admite ... cuando la conducta del delito \ninstantáneo -matar- coincide con el momento en que comienza la acción típica del \ndelito permanente -priFar de la Jib erra d-sin que ello resulte de una nueva resolu\xad\nción criminal\') 227; la tentati\\\'a de robo calificado (por el resultado "homicidio" \n-art. 165-) y el homicidio simple (art. 79) 228; el homicidio simple y el aborto (en el \ncaso, el imputado mató a su concubina que se hallaba en el sexto mes de gestación del \nhijo de ambos) ~29; el homicidio -simple- y la tentativa de homicidio (en el caso. el \nimputado disparó reiteradamente un arma de fuego contra dos personas hiriendo a \nuna y matando a otra) 2:\\0; el homicidio culposo y las lesiones culposas (en el 

## Using a custom LLM with langchain

In [1]:
from langchain.llms import HuggingFacePipeline

model_id = "projecte-aina/aguila-7b"

In [2]:
## LIKE THIS IT WILL DOWNLOAD THE ENTIRE MODEL WHICH CAN BE MORE THAN 15 GB --> explore another way to do it
llm = HuggingFacePipeline.from_model_id(
    model_id=model_id,
    task='text-generation',
)

  from .autonotebook import tqdm as notebook_tqdm


KeyboardInterrupt: 

In [3]:
import os 
from dotenv import load_dotenv
load_dotenv()

True

In [4]:
from langchain import HuggingFaceHub
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate

llm = HuggingFaceHub(
    repo_id=model_id,
    model_kwargs={"temperature": 0,
    "max_length": 64,
    },
)

llm

  from .autonotebook import tqdm as notebook_tqdm


HuggingFaceHub(client=InferenceAPI(api_url='https://api-inference.huggingface.co/pipeline/text-generation/projecte-aina/aguila-7b', task='text-generation', options={'wait_for_model': True, 'use_gpu': False}), repo_id='projecte-aina/aguila-7b', model_kwargs={'temperature': 0, 'max_length': 64})

In [5]:
question = "Who won the FIFA World Cup in the year 1994? "

template = """Question: {question}

Answer: Let's think step by step."""

prompt = PromptTemplate(template=template, input_variables=["question"])

In [6]:
llm_chain = LLMChain(prompt=prompt, llm=llm)

print(llm_chain.run(question))

KeyboardInterrupt: 

In [5]:
import torch
from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM

input_text = "El mercat del barri és fantàstic, hi pots trobar"

model_id  = "projecte-aina/aguila-7b"
tokenizer = AutoTokenizer.from_pretrained(model_id)
generator = pipeline(
    "text-generation",
    model=model_id,
    tokenizer=tokenizer,
    torch_dtype=torch.float16,
    trust_remote_code=True,
    device_map="auto",
)
generation = generator(
    input_text,
    do_sample=True,
    top_k=10,
    eos_token_id=tokenizer.eos_token_id,
)

print(f"Result: {generation[0]['generated_text']}")

Loading checkpoint shards: 100%|██████████| 15/15 [00:09<00:00,  1.59it/s]


Result: El mercat del barri és fantàstic, hi pots trobar de tot, i els preus també són fantàstics


In [11]:
generation = generator(
    "Quien fue el ultimo presidente de los Estados Unidos?",
    do_sample=True,
    top_k=10,
    temperature=0.1,
    eos_token_id=tokenizer.eos_token_id,
)

In [12]:
generation

[{'generated_text': 'Quien fue el ultimo presidente de los Estados Unidos? \n\n¿Quien fue el ultimo presidente de los'}]

In [3]:
# Use a pipeline as a high-level helper
from transformers import pipeline

pipe = pipeline("text-generation", model="projecte-aina/aguila-7b", trust_remote_code=True)

Downloading shards:   0%|          | 0/15 [00:00<?, ?it/s]

Downloading shards:   7%|▋         | 1/15 [00:00<00:08,  1.65it/s]


KeyboardInterrupt: 


[A

In [4]:
import requests

data = {
    "message": "What is the highest grade in bouldering?",
    "chat_history": "",
}

In [5]:
requests.post("http://127.0.0.1:8000/chain", json=data).text

'What is the highest difficulty level in bouldering?The highest grade in bouldering is typically referred to as V17. (Source: Wikipedia, page 6/11)'

In [6]:
data = {
    "message": "What was my previous question",
    "chat_history": "",
}

requests.post("http://127.0.0.1:8000/chain", json=data).text

'What was your previous question?Your previous question was "What is the highest grade in bouldering?"'