# Introducción a los Modelos de Lenguaje

---

## Configuración Inicial

Antes de comenzar, necesitamos configurar nuestro entorno en Google Colab:

1. Asegúrate de activar la GPU:
   - Ve a **Entorno de ejecución > Cambiar tipo de entorno de ejecución > Acelerador de Hardware > GPU > Tipo de GPU > T4**

2. Instala las bibliotecas necesarias:


In [1]:
# @title Instalación de Dependencias { display-mode: "form" }
# @markdown Ejecutá esta celda para instalar las bibliotecas necesarias
!pip install transformers>=4.40.1 accelerate>=0.27.2

###Carga del Modelo
Vamos a usar un modelo que funciona bien con texto en español:

In [2]:
from transformers import AutoModelForCausalLM, AutoTokenizer

# Cargamos Phi-3, un modelo que entiende español
model = AutoModelForCausalLM.from_pretrained(
    "microsoft/Phi-3-mini-4k-instruct",
    device_map="cuda",
    torch_dtype="auto",
    trust_remote_code=False,
)
tokenizer = AutoTokenizer.from_pretrained("microsoft/Phi-3-mini-4k-instruct")

# Creamos un pipeline para facilitar el uso
from transformers import pipeline

generador = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    return_full_text=False,
    max_new_tokens=500,
    do_sample=False
)

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json:   0%|          | 0.00/967 [00:00<?, ?B/s]

model.safetensors.index.json: 0.00B [00:00, ?B/s]

Fetching 2 files:   0%|          | 0/2 [00:00<?, ?it/s]

model-00001-of-00002.safetensors:   0%|          | 0.00/4.97G [00:00<?, ?B/s]

model-00002-of-00002.safetensors:   0%|          | 0.00/2.67G [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/181 [00:00<?, ?B/s]

tokenizer_config.json: 0.00B [00:00, ?B/s]

tokenizer.model:   0%|          | 0.00/500k [00:00<?, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

added_tokens.json:   0%|          | 0.00/306 [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/599 [00:00<?, ?B/s]

Device set to use cuda
The following generation flags are not valid and may be ignored: ['temperature']. Set `TRANSFORMERS_VERBOSITY=info` for more details.


In [3]:
mensaje = [
    {"role": "user", "content": "Escribí un párrafo corto sobre el dulce de leche y su importancia en la cultura argentina."}
]

# Generamos la respuesta
salida = generador(mensaje)
print(salida[0]["generated_text"])

The following generation flags are not valid and may be ignored: ['temperature']. Set `TRANSFORMERS_VERBOSITY=info` for more details.


 El dulce de leche, conocido también como "manjar" en Argentina, es una delicia que ha trascendido fronteras y generaciones. Este dulce, con su sabor rico y sedoso, se elabora a partir de la cocción prolongada de leche condensada, lo que le confiere su característico color amarillo dorado y su textura cremosa. No solo es un postre popular en reuniones familiares y fiestas, sino que también se utiliza en una variedad de platos argentinos, desde los tradicionales empanadas hasta los famosos locos de leche. La importancia del dulce de leche en la cultura argentina es incuestionable, ya que representa un símbolo de la identidad culinaria del país y es un elemento esencial en la gastronomía argentina.


### Explicaciones Teóricas

#### ¿Qué es Phi-3?
Phi-3 es un modelo de lenguaje desarrollado por Microsoft que:

* Entiende y genera texto en múltiples idiomas
* Puede mantener conversaciones naturales
* Es capaz de realizar tareas como escritura creativa, responder preguntas y más
* Tiene un buen entendimiento del contexto cultural

#### ¿Cómo funciona?
* **Entrada de texto:** Le das una instrucción o pregunta en español
* **Procesamiento:** El modelo analiza el texto usando su conocimiento previo
* **Generación:** Crea una respuesta coherente y contextualmente apropiada

###Ejercicios

**Escribí una receta de mate paso a paso**



In [6]:
mensaje = [
    {"role": "user", "content": "Escribí una receta de pizza al molde paso a paso"}
]

# Generamos la respuesta
salida = generador(mensaje)
print(salida[0]["generated_text"])

The following generation flags are not valid and may be ignored: ['temperature']. Set `TRANSFORMERS_VERBOSITY=info` for more details.


 **Receta de Pizza al Molde:**


Ingredientes:

- 1 paquete de masa para pizza (aproximadamente 500 gramos)

- 100 gramos de queso mozzarella rallado

- 100 gramos de pepperoni

- 100 gramos de champiñones cortados

- 1 cebolla pequeña picada

- 2 cucharadas de aceite de oliva

- 1 cucharadita de orégano seco

- Sal y pimienta al gusto


Pasos:

1. Precalienta el horno a 220°C (428°F).

2. Extiende la masa para pizza sobre un molde para hornear previamente engrasado.

3. Espolvorea la masa con un poco de aceite de oliva y espolvorea con orégano.

4. Distribuye el queso mozzarella uniformemente sobre la masa.

5. Coloca el pepperoni y los champiñones en capas sobre el queso.

6. Añade la cebolla picada encima de los demás ingredientes.

7. Salpimienta al gusto.

8. Hornea en el horno precalentado durante 15-20 minutos o hasta que la masa esté dorada y el queso esté derretido.

9. Sácala del horno y deja enfriar durante unos minutos antes de servir.


In [7]:
mensaje = [
    {"role": "user", "content": "Escribí una receta de pizza napolitana paso a paso"}
]

# Generamos la respuesta
salida = generador(mensaje)
print(salida[0]["generated_text"])

The following generation flags are not valid and may be ignored: ['temperature']. Set `TRANSFORMERS_VERBOSITY=info` for more details.


 **Receta de Pizza Napolitana:**


Ingredientes:

- 500g de masa de pizza

- 200g de mozzarella rallada

- 100g de pepperoni

- 100g de champiñones finamente picados

- 100g de tomates frescos cortados en cubos

- Aceite de oliva

- Sal al gusto

- Pizarrón o bandeja para horno


Pasos:

1. Precalienta el horno a 250°C (482°F).

2. Extiende la masa de pizza sobre un pizarrón o una bandeja para horno, formando un círculo de aproximadamente 20 cm de diámetro.

3. Añade una capa uniforme de tomates frescos cortados en cubos sobre la masa.

4. Esparce una capa de champiñones finamente picados sobre los tomates.

5. Rocía generosamente aceite de oliva sobre la masa.

6. Espolvorea sal al gusto.

7. Distribuye la mozzarella rallada y el pepperoni sobre la pizza.

8. Hornea en el horno precalentado durante 10-12 minutos o hasta que la base esté dorada y la mozzarella esté fundida.

9. Sácala del horno y deja que se enfríe durante unos minutos antes de cortar y servir.


Disfruta de tu pizza n

# Explicá la diferencia entre una pizza al molde y una pizza a la piedra



In [8]:
mensaje = [
    {"role": "user", "content": "Explicá la diferencia entre una pizza al molde y una pizza a la piedra"}
]

# Generamos la respuesta
salida = generador(mensaje)
print(salida[0]["generated_text"])

The following generation flags are not valid and may be ignored: ['temperature']. Set `TRANSFORMERS_VERBOSITY=info` for more details.


 La principal diferencia entre una pizza al molde y una pizza a la piedra radica en la superficie de cocción y el resultado final en cuanto a textura y sabor.


Una pizza al molde es cocinada en un horno de pizza con una superficie de cocción plana y a menudo con un fondo de metal o cerámica. Este tipo de pizza se cocina rápidamente y es ideal para aquellos que buscan una pizza rápida y sencilla. La superficie de cocción plana permite una distribución uniforme del calor, lo que resulta en una corteza bien cocida y un centro de queso y salsa que puede ser más líquido si se desea.


Por otro lado, una pizza a la piedra se cocina en un horno de pizza con una piedra de cocción de cerámica o de piedra caliza. La piedra absorbe y retiene el calor, lo que permite una cocción más lenta y uniforme. Esto resulta en una corteza más crujiente y un centro de queso y salsa que puede ser más firme y menos líquido. La piedra también contribuye a un sabor más rico y complejo debido a la reacción químic

In [11]:
mensaje = [
    {"role": "user", "content": "Escribí un diálogo usando modismos porteños"}
]

# Generamos la respuesta
salida = generador(mensaje)
print(salida[0]["generated_text"])

The following generation flags are not valid and may be ignored: ['temperature']. Set `TRANSFORMERS_VERBOSITY=info` for more details.


 **Personaje 1:** ¡Ahí viene el tango, mi amigo! ¿Qué te parece si nos pongamos a bailar?

**Personaje 2:** ¡Claro que sí! Pero antes, ¿has visto ese nuevo restaurante en la calle Corrientes? Dicen que la comida es un milagro.

**Personaje 1:** ¡Vamos a ver! Aunque no se me ocurre que la comida sea milagroso, sí que es un lugar que vale la pena visitar.

**Personaje 2:** Exacto, y después de cenar, podríamos ir a ver una obra de teatro en el Teatro Colón.

**Personaje 1:** ¡Eso suena genial! Y si terminamos temprano, podríamos ir a tomar un mate en la esquina.

**Personaje 2:** ¡Perfecto! Aunque no me acostumbro a ello, me gusta probar cosas nuevas.

**Personaje 1:** No te preocupes, te lo explicaré. El mate es una bebida tradicional que se toma con una bombilla y un bombillazo.

**Personaje 2:** ¡Vaya! Me parece que estoy listo para aprender.

**Personaje 1:** ¡Genial! Y no olvides que en Buenos Aires, siempre hay algo que hacer.


In [4]:
prompt = "Escribí una receta de mate paso a paso"

# Ejercicio de cultura
prompt = "Explicá la diferencia entre el asado argentino y otros tipos de BBQ"

# Ejercicio de lenguaje local
prompt = "Escribí un diálogo usando modismos porteños"

### Tips para usar el modelo en español

* Usá instrucciones claras y específicas
* Incluí contexto cultural cuando sea relevante
* Pedile ejemplos relacionados con Argentina para mejor comprensión
* Experimentá con diferentes formas de hacer preguntas