Load model

In [1]:
from torch import cuda, bfloat16
import transformers

model_id = 'meta-llama/Llama-2-13b-chat-hf' #'meta-llama/Llama-2-70b-chat-hf'

device = f'cuda:{cuda.current_device()}' if cuda.is_available() else 'cpu'

# set quantization configuration to load large model with less GPU memory
# this requires the `bitsandbytes` library
bnb_config = transformers.BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type='nf4',
    bnb_4bit_use_double_quant=True,
    bnb_4bit_compute_dtype=bfloat16
)

# begin initializing HF items, need auth token for these
hf_auth = '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'
model_config = transformers.AutoConfig.from_pretrained(
    model_id,
    use_auth_token=hf_auth,
    cache_dir="./hub"
)

model = transformers.AutoModelForCausalLM.from_pretrained(
    model_id,
    trust_remote_code=True,
    config=model_config,
    quantization_config=bnb_config,
    device_map='auto',
    use_auth_token=hf_auth,
    cache_dir="./hub"
)
model.eval()
print(f"Model loaded on {device}")

  from .autonotebook import tqdm as notebook_tqdm
Loading checkpoint shards: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████| 3/3 [03:17<00:00, 65.82s/it]

Model loaded on cuda:0





Load tokenizer

In [2]:
tokenizer = transformers.AutoTokenizer.from_pretrained(
    model_id,
    use_auth_token=hf_auth,
    cache_dir="./hub"
)



Generate text

In [3]:
generate_text = transformers.pipeline(
    model=model, tokenizer=tokenizer,
    return_full_text=True,  # langchain expects the full text
    task='text-generation',
    # we pass model parameters here too
    #stopping_criteria=stopping_criteria,  # without this model rambles during chat
    temperature=0.0,  # 'randomness' of outputs, 0.0 is the min and 1.0 the max
    max_new_tokens=512,  # mex number of tokens to generate in the output
    repetition_penalty=1.1  # without this output begins repeating
)

Implement LangChain

In [4]:
from langchain.llms import HuggingFacePipeline

llm = HuggingFacePipeline(pipeline=generate_text)

In [5]:
print(llm(prompt="Explicame la diferencia entre fusion nuclear y fision nuclear."))



La fusión nuclear es un proceso mediante el cual dos núcleos atómicos se unen para formar un núcleo más grande, liberando energía en el proceso. La fisión nuclear, por otro lado, es un proceso en el que un núcleo atómico se divide en dos o más núcleos más pequeños, también liberando energía.

La principal diferencia entre la fusión nuclear y la fisión nuclear es que la primera produce una reacción exotérmica (caliente) mientras que la segunda produce una reacción endotérmica (fría). Además, la fusión nuclear requiere temperaturas extremadamente altas (de varios millones de grados Celsius) para activar la reacción, mientras que la fisión nuclear puede ocurrir a temperaturas más bajas.

Otra diferencia importante es que la fusión nuclear produce una cantidad significativa de neutrones, lo que hace que sea difícil controlar la reacción, mientras que la fisión nuclear produce muy few neutrones.

En cuanto a su potencial energético, la fusión nuclear tiene el potencial de producir una can

## Probando con formato de subtítulos

In [220]:
from langchain.document_loaders import TextLoader

loader = TextLoader("./diari/F-285.srt")
documents = loader.load()

Borrar identificador de speakers

In [221]:
for doc in documents:
    doc.page_content = doc.page_content.replace("[SPEAKER_00]: ", "")
    doc.page_content = doc.page_content.replace("[SPEAKER_01]: ", "")
    doc.page_content = doc.page_content.replace("[SPEAKER_02]: ", "")
    # print(doc.page_content)

In [222]:
from langchain.embeddings import HuggingFaceEmbeddings

embeddings = HuggingFaceEmbeddings()

In [223]:
from langchain.chains import RetrievalQA
from langchain.document_loaders import TextLoader
from langchain.text_splitter import CharacterTextSplitter
from langchain.vectorstores import Chroma

text_splitter = CharacterTextSplitter(chunk_size=1500, chunk_overlap=0)
texts = text_splitter.split_documents(documents)

docsearch = Chroma.from_documents(texts, embeddings)

In [224]:
qa = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=docsearch.as_retriever())

In [154]:
query = "¿Cual es la fecha de nacimiento de la persona que está siendo entrevistada? Justifica tu respuesta"
qa.run(query)

' La fecha de nacimiento de la persona que está siendo entrevistada es el 19 de septiembre de 1982. Se puede inferir esto a partir de la información proporcionada en la entrevista, específicamente en la pregunta 8, donde se dice que la entrevistada nació en México el 19 de septiembre de 1982.'

In [225]:
query = "¿Cual es el nombre de la persona que está siendo entrevistada? Justifica tu respuesta"
qa.run(query)

' Based on the transcript, the name of the person being interviewed is Estefanía. This can be inferred from the dialogue in lines 121-122, where she introduces herself as "Estefanía" and from the subsequent references to her by that name throughout the transcript.'

Probando custom prompt

In [156]:
from langchain.prompts import PromptTemplate

prompt_template = """Use the following pieces of context, coming from an interview, to answer the question at the end. If you don't know the answer, just say that you don't know, don't try to make up an answer.

{context}

Question: {question}
Answer in Spanish:"""
PROMPT = PromptTemplate(
    template=prompt_template, input_variables=["context", "question"]
)

In [157]:
query = "¿Cual es el nombre de la persona que está siendo entrevistada?"
qa.run(query)

' El nombre de la persona que está siendo entrevistada es Estefanía.'

In [158]:
query = "¿Cuál es la fecha de nacimiento de la persona que está siendo entrevistada?"
qa.run(query)

' La fecha de nacimiento de la persona que está siendo entrevistada es el 19 de septiembre de 1982.'

## Probando con diálogos generados de la transcripción

In [194]:
from langchain.embeddings import HuggingFaceEmbeddings

embeddings = HuggingFaceEmbeddings()

In [195]:
with open("./diari/F-285.srt", "r", encoding="utf-8") as f:
    text = f.read()
lines = [part.split("]: ")[-1] for num, part in enumerate(text.split("\n\n"))]
lines[:3]

['Gracias.',
 'Gracias a ti, Estefanía.',
 'Entonces, como te compartía, vamos a aperturar un expediente.']

Diálogos con contexto de dos líneas

In [232]:
dialogues = []
i = 0
prev = None
prevText = ""
curr = ""
while i < len(lines):
    curr_type = "question" if "¿" in lines[i] or "?" in lines[i] else "text"
    # if current line has a question
    if curr_type == "question":
        # if the prev line had only text
        if prev == "text":
            dialogues.append(curr)
            curr = ""
    # add current text to curr
    curr = curr + " " + lines[i]

    # set prev
    prev = curr_type
    
    # increment i
    i = i + 1

In [238]:
for d in dialogues[:10]:
    print(d, "\n")

 Gracias. Gracias a ti, Estefanía. Entonces, como te compartía, vamos a aperturar un expediente. donde se te van a tomar datos personales los cuales se quedan resguardados de manera confidencial aquí en la unidad y también que me compartas que te traía acá con nosotros yo voy a iniciar a aplicar esta entrevista si tú tienes alguna duda me lo puedes comentar en cualquier momento aparte de lo que te referí respecto a nuestros servicios estos tampoco se te van a cobrar no gracias a ti me interesa saber si traes alguna lesión o alguna emergencia médica 

 ¿Te encuentras embarazada en este momento? No. 

 ¿Cuál es tu fecha de nacimiento? 19 de septiembre del 82. 

 ¿Te identificas como femenina, mujer? Sí. Gracias. 

 ¿Tu nacionalidad? ¿Dónde es que tú naciste? Nací en México, soy mexicana. 

 Y bueno, nací... ¿En qué estado? Nací en la Ciudad de México hace un día que no estaba de vacaciones. 

 ¿Por la suerte? Sí. Toda mi vida he vivido aquí. Radicas entonces entidad federativa Jalisco. S

In [239]:
docsearch = Chroma.from_texts(dialogues, embedding=embeddings)

Prueba sin prompt

In [240]:
qa = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=docsearch.as_retriever())

In [241]:
query = "¿Cual es la fecha de nacimiento de la persona que está siendo entrevistada? Justifica tu respuesta"
qa.run(query)

' La fecha de nacimiento de la persona que está siendo entrevistada es el 19 de septiembre del 82, ya que se mencionó en la conversación anterior.'

In [242]:
query = "¿Cual es el nombre de la persona que está siendo entrevistada? Justifica tu respuesta"
qa.run(query)

' Based on the information provided, the name of the person being interviewed is not explicitly stated. However, based on the context, it can be inferred that the person being interviewed is the one who is asking the questions and is seeking employment, as they mention their "pareja" (partner) and refer to themselves in the first person. Therefore, the name of the person being interviewed is not known.'

Prueba con custom prompt

In [243]:
chain_type_kwargs = {"prompt": PROMPT}
qa = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=docsearch.as_retriever(), chain_type_kwargs=chain_type_kwargs)

In [244]:
query = "¿Cual es la fecha de nacimiento de la persona que está siendo entrevistada? Justifica tu respuesta"
qa.run(query)

'\n\nLa fecha de nacimiento de la persona que está siendo entrevistada es el 19 de septiembre del 82, ya que ella misma lo ha mencionado en la entrevista.'

In [245]:
query = "¿Cual es el nombre de la persona que está siendo entrevistada? Justifica tu respuesta"
qa.run(query)

'\n\nBased on the information provided in the interview, the name of the person being interviewed is not explicitly stated. However, based on the context, it can be inferred that the person being interviewed is the one who is asking for the job, as they are the ones conducting the interview and asking questions. Therefore, the name of the person being interviewed is not known.'