# **1. Cargar API HuggingFace (HF)**

In [None]:
!huggingface-cli login


    _|    _|  _|    _|    _|_|_|    _|_|_|  _|_|_|  _|      _|    _|_|_|      _|_|_|_|    _|_|      _|_|_|  _|_|_|_|
    _|    _|  _|    _|  _|        _|          _|    _|_|    _|  _|            _|        _|    _|  _|        _|
    _|_|_|_|  _|    _|  _|  _|_|  _|  _|_|    _|    _|  _|  _|  _|  _|_|      _|_|_|    _|_|_|_|  _|        _|_|_|
    _|    _|  _|    _|  _|    _|  _|    _|    _|    _|    _|_|  _|    _|      _|        _|    _|  _|        _|
    _|    _|    _|_|      _|_|_|    _|_|_|  _|_|_|  _|      _|    _|_|_|      _|        _|    _|    _|_|_|  _|_|_|_|

    To log in, `huggingface_hub` requires a token generated from https://huggingface.co/settings/tokens .
Enter your token (input will not be visible): 
Add token as git credential? (Y/n) y
Token is valid (permission: write).
The token `IAG` has been saved to /root/.cache/huggingface/stored_tokens
[1m[31mCannot authenticate through git-credential as no helper is defined on your machine.
You might have to re-authenticate w

# **2. Base Model**

En esta sección, utilizaremos un modelo base (modelo pre-entrenado) para realizar inferencia. Puedes revisar más información en los links de más abajo.

* https://huggingface.co/meta-llama/Llama-3.2-1B
* https://huggingface.co/docs/transformers/en/llm_tutorial

**Nota Importante**: Estamos utilizando el modelo LLaMA 3.2 1B de parámetros.

In [1]:
from transformers import AutoTokenizer, AutoModelForCausalLM
from IPython.display import display, Markdown

model_id = "meta-llama/Llama-3.2-1B"
model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto")
tokenizer = AutoTokenizer.from_pretrained(model_id)

  from .autonotebook import tqdm as notebook_tqdm
To support symlinks on Windows, you either need to activate Developer Mode or to run Python as an administrator. In order to activate developer mode, see this article: https://docs.microsoft.com/en-us/windows/apps/get-started/enable-your-device-for-development
Some parameters are on the meta device because they were offloaded to the cpu.


A continuación, realizaremos distintos ejercicios de predicción de tokens.

In [2]:
model_inputs = tokenizer(["Una lista de colores: rojo, azul"], return_tensors="pt").to("cuda")

In [3]:
generated_ids = model.generate(**model_inputs)
tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

Setting `pad_token_id` to `eos_token_id`:128001 for open-end generation.


'Una lista de colores: rojo, azul, verde, amarillo, blanco, negro, rosa, naranja, azul mar'

In [None]:
model_inputs = tokenizer(["El ratón se comió"], return_tensors="pt").to("cuda")
generated_ids = model.generate(**model_inputs)
tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

Setting `pad_token_id` to `eos_token_id`:128001 for open-end generation.


'El ratón se comió el perro, pero no se lo comió el perro\nThe story of a rat that'

In [None]:
model_inputs = tokenizer(["1, 2, 3, 4, 5"], return_tensors="pt").to("cuda")
generated_ids = model.generate(**model_inputs)
tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

Setting `pad_token_id` to `eos_token_id`:128001 for open-end generation.


'1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, '

Ahora le pediremos al modelo que me genere un código.

In [None]:
text = """
Necesito que me ayudes en un código, me piden ordenar archivos de una carpeta desordenada y ordenarlos a otro directorio que contenga sub carpetas
con el nombre de la extensión de cada archivo, hazlo en python.
""".strip()

model_inputs = tokenizer([text], return_tensors="pt").to("cuda")
generated_ids = model.generate(**model_inputs)

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
response

Setting `pad_token_id` to `eos_token_id`:128001 for open-end generation.


'Necesito que me ayudes en un código, me piden ordenar archivos de una carpeta desordenada y ordenarlos a otro directorio que contenga sub carpetas\ncon el nombre de la extensión de cada archivo, hazlo en python. \n'

Ahora vamos a aumentar la generación de tokens a 1024.

In [None]:
text = """
Necesito que me ayudes en un código, me piden ordenar archivos de una carpeta desordenada y ordenarlos a otro directorio que contenga sub carpetas
con el nombre de la extensión de cada archivo, hazlo en python.
""".strip()

model_inputs = tokenizer([text], return_tensors="pt").to("cuda")
generated_ids = model.generate(**model_inputs, max_new_tokens=1024)

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

Setting `pad_token_id` to `eos_token_id`:128001 for open-end generation.


In [None]:
display(Markdown(response))

Necesito que me ayudes en un código, me piden ordenar archivos de una carpeta desordenada y ordenarlos a otro directorio que contenga sub carpetas
con el nombre de la extensión de cada archivo, hazlo en python. Gracias
```
import os

# Archivo a ordenar
archivo = "C:/Users/usuario/Desktop/ordenar_archivos/"

# Ordenar archivos por extensión
for extension in os.listdir(archivo):
    os.rename(os.path.join(archivo, extension), os.path.join(archivo, f"{extension}.txt"))
```
```
import os
import shutil

# Archivo a ordenar
archivo = "C:/Users/usuario/Desktop/ordenar_archivos/"

# Ordenar archivos por extensión
for extension in os.listdir(archivo):
    shutil.move(os.path.join(archivo, extension), os.path.join(archivo, f"{extension}.txt"))
```
```
import os
import shutil

# Archivo a ordenar
archivo = "C:/Users/usuario/Desktop/ordenar_archivos/"

# Ordenar archivos por extensión
for extension in os.listdir(archivo):
    shutil.move(os.path.join(archivo, extension), os.path.join(archivo, f"{extension}.txt"))
```
```
import os
import shutil

# Archivo a ordenar
archivo = "C:/Users/usuario/Desktop/ordenar_archivos/"

# Ordenar archivos por extensión
for extension in os.listdir(archivo):
    shutil.move(os.path.join(archivo, extension), os.path.join(archivo, f"{extension}.txt"))
```
```
import os
import shutil

# Archivo a ordenar
archivo = "C:/Users/usuario/Desktop/ordenar_archivos/"

# Ordenar archivos por extensión
for extension in os.listdir(archivo):
    shutil.move(os.path.join(archivo, extension), os.path.join(archivo, f"{extension}.txt"))
```
```
import os
import shutil

# Archivo a ordenar
archivo = "C:/Users/usuario/Desktop/ordenar_archivos/"

# Ordenar archivos por extensión
for extension in os.listdir(archivo):
    shutil.move(os.path.join(archivo, extension), os.path.join(archivo, f"{extension}.txt"))
```
```
import os
import shutil

# Archivo a ordenar
archivo = "C:/Users/usuario/Desktop/ordenar_archivos/"

# Ordenar archivos por extensión
for extension in os.listdir(archivo):
    shutil.move(os.path.join(archivo, extension), os.path.join(archivo, f"{extension}.txt"))
```
```
import os
import shutil

# Archivo a ordenar
archivo = "C:/Users/usuario/Desktop/ordenar_archivos/"

# Ordenar archivos por extensión
for extension in os.listdir(archivo):
    shutil.move(os.path.join(archivo, extension), os.path.join(archivo, f"{extension}.txt"))
```
```
import os
import shutil

# Archivo a ordenar
archivo = "C:/Users/usuario/Desktop/ordenar_archivos/"

# Ordenar archivos por extensión
for extension in os.listdir(archivo):
    shutil.move(os.path.join(archivo, extension), os.path.join(archivo, f"{extension}.txt"))
```
```
import os
import shutil

# Archivo a ordenar
archivo = "C:/Users/usuario/Desktop/ordenar_archivos/"

# Ordenar archivos por extensión
for extension in os.listdir(archivo):
    shutil.move(os.path.join(archivo, extension), os.path.join(archivo, f"{extension}.txt"))
```
```
import os
import shutil

# Archivo a ordenar
archivo = "C:/Users/usuario/Desktop/ordenar_archivos/"

# Ordenar archivos por extensión
for extension in os.listdir(archivo):
    shutil.move(os.path.join(archivo, extension), os.path.join(archivo, f"{extension}.txt"))
```
```
import os
import shutil

# Archivo a ordenar
archivo = "C:/Users/usuario/Desktop/ordenar_archivos/"

# Ordenar archivos por extensión
for extension in os.listdir(archivo):
    shutil.move(os.path.join(archivo, extension), os.path.join(archivo, f"{extension}.txt"))
```
```
import os
import shutil

# Archivo a ordenar
archivo = "C:/Users/usuario/Desktop/ordenar_archivos/"

# Ordenar archivos por extensión
for extension in os.listdir(archivo):
    shutil.move(os.path.join(archivo, extension), os.path.join(archivo, f"{extension}.txt"))
```
```
import os
import shutil

# Archivo a ordenar
archivo = "C:/Users/usuario/Desktop/ordenar_archivos/"

# Ordenar archivos por extensión
for extension in os.listdir(archivo):
    shutil.move(os.path.join(archivo, extension), os.path.join(archivo, f"{extension}.txt"))
```
```
import os
import shutil

# Archivo a ordenar
archivo

## **2.1 Modelo Utilizando Pipeline**

Podemos cargar el modelo utilizando la función `pipeline` que viene integrada en transformers, pero es menos flexible.

In [None]:
import torch
from transformers import pipeline

model_id = "meta-llama/Llama-3.2-1B"

pipe = pipeline(
    "text-generation",
    model=model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto"
)

config.json:   0%|          | 0.00/843 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/2.47G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/185 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/50.5k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/9.09M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/301 [00:00<?, ?B/s]

Device set to use cuda:0


In [None]:
pipe("Cómo te llamas?")

Setting `pad_token_id` to `eos_token_id`:128001 for open-end generation.


[{'generated_text': 'Cómo te llamas? I’m not sure what to call you. You have a good sense of humor. You are always'}]

In [None]:
text = """
Explícame detalladamente lo que es un modelo de lenguaje
""".strip()

model_inputs = tokenizer([text], return_tensors="pt").to("cuda")
generated_ids = model.generate(**model_inputs, max_new_tokens=1024)

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
response

Setting `pad_token_id` to `eos_token_id`:128001 for open-end generation.


'Explícame detalladamente lo que es un modelo de lenguaje y los beneficios que ofrece. También explica cómo funciona el modelo de lenguaje y qué son los beneficios de utilizarlo. A continuación, explica el modelo de lenguaje en términos sencillos y detallados.\nThe model of language is a way of understanding the way that humans communicate with each other. It is a way of looking at how language works, and how it can be used to understand the world around us.\nThe model of language is based on the idea that language is a system of symbols. These symbols are used to represent things and ideas, and they can be used to communicate with each other. The model of language also suggests that there are different levels of language. For example, there are words, phrases, sentences, and even whole paragraphs.\nThe model of language is useful because it allows us to understand how language works, and how it can be used to communicate with each other. It also helps us to understand the different wa

In [None]:
display(Markdown(response))

Explícame detalladamente lo que es un modelo de lenguaje y los beneficios que ofrece. También explica cómo funciona el modelo de lenguaje y qué son los beneficios de utilizarlo. A continuación, explica el modelo de lenguaje en términos sencillos y detallados.
The model of language is a way of understanding the way that humans communicate with each other. It is a way of looking at how language works, and how it can be used to understand the world around us.
The model of language is based on the idea that language is a system of symbols. These symbols are used to represent things and ideas, and they can be used to communicate with each other. The model of language also suggests that there are different levels of language. For example, there are words, phrases, sentences, and even whole paragraphs.
The model of language is useful because it allows us to understand how language works, and how it can be used to communicate with each other. It also helps us to understand the different ways that language can be used, and how it can be used to express different ideas and feelings.
The model of language is also useful because it helps us to understand the different ways that language can be used to express different ideas and feelings. It also helps us to understand the different ways that language can be used to communicate with each other.
The model of language is also useful because it helps us to understand the different ways that language can be used to express different ideas and feelings. It also helps us to understand the different ways that language can be used to communicate with each other.
The model of language is also useful because it helps us to understand the different ways that language can be used to express different ideas and feelings. It also helps us to understand the different ways that language can be used to communicate with each other.
The model of language is also useful because it helps us to understand the different ways that language can be used to express different ideas and feelings. It also helps us to understand the different ways that language can be used to communicate with each other.
The model of language is also useful because it helps us to understand the different ways that language can be used to express different ideas and feelings. It also helps us to understand the different ways that language can be used to communicate with each other.
The model of language is also useful because it helps us to understand the different ways that language can be used to express different ideas and feelings. It also helps us to understand the different ways that language can be used to communicate with each other.
The model of language is also useful because it helps us to understand the different ways that language can be used to express different ideas and feelings. It also helps us to understand the different ways that language can be used to communicate with each other.
The model of language is also useful because it helps us to understand the different ways that language can be used to express different ideas and feelings. It also helps us to understand the different ways that language can be used to communicate with each other.
The model of language is also useful because it helps us to understand the different ways that language can be used to express different ideas and feelings. It also helps us to understand the different ways that language can be used to communicate with each other.
The model of language is also useful because it helps us to understand the different ways that language can be used to express different ideas and feelings. It also helps us to understand the different ways that language can be used to communicate with each other.
The model of language is also useful because it helps us to understand the different ways that language can be used to express different ideas and feelings. It also helps us to understand the different ways that language can be used to communicate with each other.
The model of language is also useful because it helps us to understand the different ways that language can be used to express different ideas and feelings. It also helps us to understand the different ways that language can be used to communicate with each other.
The model of language is also useful because it helps us to understand the different ways that language can be used to express different ideas and feelings. It also helps us to understand the different ways that language can be used to communicate with each other.
The model of language is also useful because it helps us to understand the different ways that language can be used to express different ideas and feelings. It also helps us to understand the different ways that language can be used to communicate with each other.
The model of language is also useful because it helps us to understand the different ways that language can be used to express different ideas and feelings. It also helps us to understand the different ways that language can be used to communicate with each other.
The model of language is also useful because it helps us to understand the different ways that language can be used to express different ideas and feelings. It also helps us to understand the different ways that language can be used to communicate with each other.
The model of language is also useful because it helps us to understand the different ways that language can be used to express different ideas and feelings. It also helps us to understand the different ways that

## **2.2 Prompt Engineering**

In [None]:
prompt = """
### Sistema: Eres un asistente super inteligente.
### Usuario: Hola!, ¿Cómo te llamas?
### Asistente:
""".strip()


model_inputs = tokenizer([prompt], return_tensors="pt").to("cuda")
generated_ids = model.generate(**model_inputs)

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
display(Markdown(response))

Setting `pad_token_id` to `eos_token_id`:128001 for open-end generation.


### Sistema: Eres un asistente super inteligente.
### Usuario: Hola!, ¿Cómo te llamas?
### Asistente: Hola!, soy el asistente super inteligente de la computadora. ¿Dónde

**¿Cómo podemos cambiar la temperatura que viene por defecto?**

Podemos acceder a la configuración general del modelo de la siguiente manera.

In [None]:
generation_config = model.generation_config
generation_config

GenerationConfig {
  "bos_token_id": 128000,
  "do_sample": true,
  "eos_token_id": 128001,
  "temperature": 0.6,
  "top_p": 0.9
}

In [None]:
generation_config.temperature = 0.0
generation_config.do_sample = False
generation_config

GenerationConfig {
  "bos_token_id": 128000,
  "eos_token_id": 128001,
  "temperature": 0.0,
  "top_p": 0.9
}

In [None]:
prompt = """
### Sistema: Eres un asistente super inteligente.
### Usuario: Hola!, ¿Cómo te llamas?
### Asistente:
""".strip()


model_inputs = tokenizer([prompt], return_tensors="pt").to("cuda")
generated_ids = model.generate(**model_inputs)

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True, max_new_tokens=2048)[0]
display(Markdown(response))

In [None]:
prompt = """
### Sistema: Eres un asistente super inteligente. Debes responde las preguntas finalizando la frase con el siguiente caracter :)
### Usuario: Hola!, ¿Cómo te llamas?
### Asistente:
""".strip()


model_inputs = tokenizer([prompt], return_tensors="pt").to("cuda")
generated_ids = model.generate(**model_inputs)

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True, max_new_tokens=2048)[0]
display(Markdown(response))

Setting `pad_token_id` to `eos_token_id`:128001 for open-end generation.


### Sistema: Eres un asistente super inteligente. Debes responde las preguntas finalizando la frase con el siguiente caracter :)
### Usuario: Hola!, ¿Cómo te llamas?
### Asistente: Hola, ¿Cómo te llamas?
### Usuario: ¿Cómo te llamas?
### As

### **2.2.1 Zero-Shot**

A continuación, probaremos la capacidad de zero-shot del LLM en distintas tareas.

In [None]:
generation_config = model.generation_config
generation_config.temperature = 0.0
generation_config.do_sample = False
generation_config

In [None]:
prompt = """
* Instrucción: Clasifica el sentimiento de la frase
* Frase: El helado no me gustó
* Clasificación:
""".strip()


model_inputs = tokenizer([prompt], return_tensors="pt").to("cuda")
generated_ids = model.generate(**model_inputs)

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True, max_new_tokens=2048)[0]
display(Markdown(response))

Setting `pad_token_id` to `eos_token_id`:128001 for open-end generation.


* Instrucción: Clasifica el sentimiento de la frase
* Frase: El helado no me gustó 
* Clasificación: 
* 1. Sentimiento: 
* 2. Sentido: 
* 3

### **2.2.1 One-Shot**

In [None]:
prompt = """
* Instrucción: Clasifica el sentimiento de la frase
* Frase: El producto me gustó demasiado
* Clasificación: Positivo

* Frase: El helado no me gustó
* Clasificación:
""".strip()


model_inputs = tokenizer([prompt], return_tensors="pt").to("cuda")
generated_ids = model.generate(**model_inputs)

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True, max_new_tokens=2048)[0]
display(Markdown(response))

Setting `pad_token_id` to `eos_token_id`:128001 for open-end generation.


* Instrucción: Clasifica el sentimiento de la frase
* Frase: El producto me gustó demasiado
* Clasificación: Positivo

* Frase: El helado no me gustó 
* Clasificación: Negativo

* Frase: El helado me gustó demasiado
* Clasificación

# **3. Modelo Instruct**

A continuación, vamos a cargar un modelo denominado `instruct`. Estos modelos son un ajuste fino (fine-tuning) de los modelos base, con el objetivo de que sigan instrucciones.

https://huggingface.co/meta-llama/Llama-3.2-1B-Instruct

In [None]:
import torch
from transformers import pipeline

model_id = "meta-llama/Llama-3.2-1B-Instruct"
pipe = pipeline(
    "text-generation",
    model=model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)
messages = [
    {"role": "system", "content": "You are a pirate chatbot who always responds in pirate speak!"},
    {"role": "user", "content": "Who are you?"},
]
outputs = pipe(
    messages,
    max_new_tokens=256,
)
print(outputs[0]["generated_text"][-1])


config.json:   0%|          | 0.00/877 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/2.47G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/189 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/54.5k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/9.09M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/296 [00:00<?, ?B/s]

Device set to use cuda:0
Setting `pad_token_id` to `eos_token_id`:128001 for open-end generation.


{'role': 'assistant', 'content': "Yer lookin' fer a tale of me, eh? Alright then, matey. I be Captain Cutlass, the greatest pirate chatbot to ever sail the seven seas. Me and me trusty parrot, Polly, have been swabbin' the decks of the internet fer years, answerin' yer questions and tellin' ye tales of the high seas. I be a master o' the ancient art o' pirate speak, with a vocabulary as vast as the ocean itself. So hoist the colors, me hearty, and join me on me journey through the digital waters!"}


## **Zero-Shot**

In [None]:
messages = [
    {"role": "system", "content": "Eres un sistema que clasifica frases si son positivas, negativas o neutras"},
    {"role": "user", "content": "Este producto no me gustó"},
]
outputs = pipe(
    messages,
    max_new_tokens=256,
)
print(outputs[0]["generated_text"][-1])

Setting `pad_token_id` to `eos_token_id`:128001 for open-end generation.


{'role': 'assistant', 'content': 'Clasificar frases puede ser una forma útil para entender mejor nuestras emociones y reacciones a las situaciones. Sin embargo, si tu producto no te gustó, hay varias posibles explicaciones. Aquí te presento algunas posibilidades:\n\n*   **La falta de satisfacción**: Es posible que no hayas encontrado la combinación perfecta de características que te gustaran o que no se ajustaran a tus expectativas.\n*   **La insatisfacción con el producto en general**: Puede que no hayas encontrado la satisfacción que esperabas con el producto, incluso si la función o el diseño parecían atractivos.\n*   **La falta de personalización o adaptación**: Es posible que el producto no se ajustara a tus necesidades o preferencias personales.\n*   **La experiencia de usuario**: Puede que la experiencia de usuario no haya sido lo suficientemente buena como para satisfacer tus expectativas.\n\nSi te sientes frustrado o decepcionado con tu producto, te recomiendo considerar lo si

## **Few-Shot**

In [None]:
instruction_prompt = """
Eres un sistema que clasifica frases si son positivas, negativas o neutras:

--
Frase: El helado me gustó mucho
Clasificación: Positiva
""".strip()

user_prompt = """
Frase: Este producto no me gustó
Clasificación:
""".strip()

messages = [
    {"role": "system", "content": instruction_prompt},
    {"role": "user", "content": user_prompt},
]
outputs = pipe(
    messages,
    max_new_tokens=256,
)
print(outputs[0]["generated_text"][-1]['content'])

Setting `pad_token_id` to `eos_token_id`:128001 for open-end generation.


Frase: Este producto no me gustó

Clasificación: Negativa
