<img src="../imgs/Adevinta-ULPGC-logo.jpg" width="530px" align="right">

# **Generative Pretrained Transformer (GPT)**

Consituyen una serie de modelos del lenguaje desarrollados por OpenAI. Estos modelos son conocidos por su capacidad para generar texto, responder preguntas, traducir idiomas, resumir documentos y realizar una variedad de otras tareas lingüísticas. La arquitectura de GPT se basa en el concepto de *Transformer* usando solo la parte *decoder* de la arquitectura original.

Estudiaremos el <a href="https://openai.com/research/gpt-2-1-5b-release">modelo GPT-2, que es un modelo de lenguaje desarrollado por OpenAI en 2019</a>. Es la segunda versión de la serie de modelos GPT y representa un avance significativo respecto a su predecesor, GPT-1, tanto en términos de tamaño como de capacidad. GPT-2 fue diseñado para predecir la siguiente palabra en una secuencia de texto, basándose en todas las palabras anteriores dentro de esa secuencia, lo que le permite generar texto <a href="https://openai.com/research/better-language-models">coherente y sorprendentemente humano a partir de un prompt dado</a>.

Usaremos el código creado por Andrej Karpathy en su <a href="https://github.com/karpathy/nanoGPT">repositorio de GitHub</a>. Este código es una versión simplificada de GPT-2 que se puede ejecutar en una sola GPU o, incluso, en una CPU y se ha adaptado para ser más fácil de entender y modificar.

Tenemos también un <a href="https://www.youtube.com/embed/kCc8FmEb1nY">tutorial en vídeo</a> en el que se explica cómo funciona el modelo GPT-2 y cómo se ha implementado en el código de Karpathy.

<div align="center">
    <img src="./imgs/gpt_model.png" width="400px">
</div>


In [32]:
from ctransformers import AutoModelForCausalLM

llm = AutoModelForCausalLM.from_pretrained("TheBloke/Mistral-7B-Instruct-v0.1-GGUF", model_file="mistral-7b-instruct-v0.1.Q5_K_M.gguf", model_type="mistral", gpu_layers=50)

Fetching 1 files:   0%|          | 0/1 [00:00<?, ?it/s]

Fetching 1 files:   0%|          | 0/1 [00:00<?, ?it/s]

In [33]:
print(llm("¿Si tengo 15 manzanas y me como 3, cuántas me quedan?"))


A: 12


<img src="./imgs/LMStudio.png" width="300">

Descarga e instala LM Studio desde [aquí](https://lmstudio.ai/).

In [35]:
# Example: reuse your existing OpenAI setup
from openai import OpenAI

# Point to the local server
client = OpenAI(base_url="http://localhost:1234/v1", api_key="lm-studio")

completion = client.chat.completions.create(
  model="mistral-7b-instruct-v0.2.Q4_K_S.gguf",
  messages=[
    {"role": "system", "content": "Eres un aistente amable y educado. Responde siempre en español a lo que se te pregunte."},
    {"role": "user", "content": "¿Cómo puedo mejorar mi concentración en el trabajo? Responde en español"}
  ],
  temperature=0.7,
)

print(completion.choices[0].message.content)

 Para mejorar tu concentración en el trabajo, considera las siguientes recomendaciones:

1. Elimina distracciones: Identifica los factores que te desvían de tu trabajo y eliminalos. Esto puede incluir notificaciones de teléfono, correo electrónico, o sitios web no relacionados con tu trabajo.

2. Establece un entorno favorable: Crear un ambiente tranquilo y distraído que te permita concentrarte mejor. Puede incluir una buena iluminación, una temperatura cómoda, y un ruido blanco o música suave en el fondo.

3. Toma cuidados de tu salud: Asegúrate de mantenerte hígado y bien alimentado para que tus niveles de energía y concentración se mantengan altos. También considera la posibilidad de hacer pequeñas pausas para realizar ejercicios físicos o practicar relajación.

4. Utiliza herramientas y técnicas: Hay varias técnicas que pueden ayudarte a mejorar tu concentración, como el método del cuadro de 2x2 (elimina cuatro distracciones y se centra en una tarea), la tecnología del pomodoro (tr

In [1]:
from huggingface_hub import notebook_login

# Autenticación en un entorno de notebook
notebook_login()

VBox(children=(HTML(value='<center> <img\nsrc=https://huggingface.co/front/assets/huggingface_logo-noborder.sv…

In [None]:
from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("TheBloke/Mistral-7B-Instruct-v0.2-GGUF/mistral-7b-instruct-v0.2.Q4_K_S")
tokenizer = AutoTokenizer.from_pretrained("TheBloke/Mistral-7B-Instruct-v0.2-GGUF")


In [None]:
messages = [
    {"role": "user", "content": "What is your favourite condiment?"},
    {"role": "assistant", "content": "Well, I'm quite partial to a good squeeze of fresh lemon juice. It adds just the right amount of zesty flavour to whatever I'm cooking up in the kitchen!"},
    {"role": "user", "content": "Do you have mayonnaise recipes?"}
]

encodeds = tokenizer.apply_chat_template(messages, return_tensors="pt")

print(encodeds)

device = "mps" # the device to load the model onto
model_inputs = encodeds.to(device)
model.to(device)

generated_ids = model.generate(model_inputs, max_new_tokens=10, do_sample=False)

decoded = tokenizer.batch_decode(generated_ids)
print(decoded[0])
