# Introducción a los Modelos de Lenguaje

---

## Configuración Inicial

Antes de comenzar, necesitamos configurar nuestro entorno en Google Colab:

1. Asegúrate de activar la GPU:
   - Ve a **Entorno de ejecución > Cambiar tipo de entorno de ejecución > Acelerador de Hardware > GPU > Tipo de GPU > T4**

2. Instala las bibliotecas necesarias:


In [1]:
# @title Instalación de Dependencias { display-mode: "form" }
# @markdown Ejecutá esta celda para instalar las bibliotecas necesarias
!pip install transformers>=4.40.1 accelerate>=0.27.2

###Carga del Modelo
Vamos a usar un modelo que funciona bien con texto en español:

In [2]:
from transformers import AutoModelForCausalLM, AutoTokenizer

# Cargamos Phi-3, un modelo que entiende español
model = AutoModelForCausalLM.from_pretrained(
    "microsoft/Phi-3-mini-4k-instruct",
    device_map="cuda",
    torch_dtype="auto",
    trust_remote_code=False,
)
tokenizer = AutoTokenizer.from_pretrained("microsoft/Phi-3-mini-4k-instruct")

# Creamos un pipeline para facilitar el uso
from transformers import pipeline

generador = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    return_full_text=False,
    max_new_tokens=500,
    do_sample=False
)

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json:   0%|          | 0.00/967 [00:00<?, ?B/s]

model.safetensors.index.json:   0%|          | 0.00/16.5k [00:00<?, ?B/s]

Fetching 2 files:   0%|          | 0/2 [00:00<?, ?it/s]

model-00001-of-00002.safetensors:   0%|          | 0.00/4.97G [00:00<?, ?B/s]

model-00002-of-00002.safetensors:   0%|          | 0.00/2.67G [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/181 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/3.44k [00:00<?, ?B/s]

tokenizer.model:   0%|          | 0.00/500k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.94M [00:00<?, ?B/s]

added_tokens.json:   0%|          | 0.00/306 [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/599 [00:00<?, ?B/s]

Device set to use cuda
The following generation flags are not valid and may be ignored: ['temperature']. Set `TRANSFORMERS_VERBOSITY=info` for more details.


In [3]:
mensaje = [
    {"role": "user", "content": "El mate es una infusión tradicional profundamente arraigada en la cultura argentina. Más que una simple bebida, representa un ritual cotidiano que promueve la conversación, la amistad y el compartir. Preparado con hojas de yerba mate y consumido generalmente en grupo, el mate simboliza la hospitalidad y el sentido de comunidad. En plazas, oficinas o reuniones familiares, el acto de cebar y pasar el mate es una costumbre que atraviesa generaciones y clases sociales, convirtiéndose en un verdadero emblema de la identidad argentina."}
]

# Generamos la respuesta
salida = generador(mensaje)
print(salida[0]["generated_text"])

The following generation flags are not valid and may be ignored: ['temperature']. Set `TRANSFORMERS_VERBOSITY=info` for more details.


 El mate es una infusión tradicional profundamente arraigada en la cultura argentina. Más que una simple bebida, representa un ritual cotidiano que promueve la conversación, la amistad y el compartir. Preparado con hojas de yerba mate y consumido generalmente en grupo, el mate simboliza la hospitalidad y el sentido de comunidad. En plazas, oficinas o reuniones familiares, el acto de cebar y pasar el mate es una costumbre que atraviesa generaciones y clases sociales, convirtiéndose en un verdadero emblema de la identidad argentina.


### Explicaciones Teóricas

#### ¿Qué es Phi-3?
Phi-3 es un modelo de lenguaje desarrollado por Microsoft que:

* Entiende y genera texto en múltiples idiomas
* Puede mantener conversaciones naturales
* Es capaz de realizar tareas como escritura creativa, responder preguntas y más
* Tiene un buen entendimiento del contexto cultural

#### ¿Cómo funciona?
* **Entrada de texto:** Le das una instrucción o pregunta en español
* **Procesamiento:** El modelo analiza el texto usando su conocimiento previo
* **Generación:** Crea una respuesta coherente y contextualmente apropiada

###Ejercicios

In [None]:
prompt = "Escribí una receta de mate paso a paso"

# Ejercicio de cultura
prompt = "Explicá la diferencia entre el asado argentino y otros tipos de BBQ"

# Ejercicio de lenguaje local
prompt = "Escribí un diálogo usando modismos porteños"

In [4]:
mensaje = [
    {"role": "user", "content": "Escribí una receta de mate paso a paso"}
]

# Generamos la respuesta
salida = generador(mensaje)
print(salida[0]["generated_text"])

The following generation flags are not valid and may be ignored: ['temperature']. Set `TRANSFORMERS_VERBOSITY=info` for more details.


 **Receta de Mate:**


Ingredientes:

- 1 mate (recipiente para el té)

- 10 gramos de yerba mate

- Agua tibia

- Taza pequeña

- Cucharón


Pasos:

1. Llena el mate con la yerba mate hasta la mitad.

2. Vierte agua tibia en el mate hasta que la yerba esté completamente sumergida.

3. Deja reposar el mate durante 3 a 5 minutos para que la infusión se desarrolle.

4. Usa el cucharón para remover la yerba y el mate para distribuir la infusión de manera uniforme.

5. Sírvelo en una taza pequeña y disfruta de tu mate.


Recuerda que la temperatura del agua es crucial para el sabor del mate. No debe ser demasiado caliente ni demasiado fría.


In [7]:
mensaje = [
    {"role": "user", "content": "Explicá la diferencia entre el asado argentino y otros tipos de BBQ"}
]
# Generamos la respuesta
salida = generador(mensaje)
print(salida[0]["generated_text"])


The following generation flags are not valid and may be ignored: ['temperature']. Set `TRANSFORMERS_VERBOSITY=info` for more details.


 El asado argentino es una tradición culinaria que se ha convertido en un símbolo de la cultura argentina. A diferencia de otros tipos de barbacoa, el asado argentino se caracteriza por su técnica de cocción al aire libre y su variedad de cortes de carne.


En el asado argentino, se utilizan parrillas de carbón, conocidas como "parrillas", que se colocan al aire libre, generalmente en un lugar abierto y con viento. La carne se coloca en la parrilla y se cocina lentamente, permitiendo que el calor del carbón se disperse de manera uniforme. Este método de cocción le da a la carne un sabor distintivo y una textura tierna.


Otros tipos de barbacoa pueden variar en técnica y ingredientes. Por ejemplo, en la barbacoa mexicana, la carne se cocina en una olla de barro con especias y hierbas, mientras que en la barbacoa de los Estados Unidos, la carne suele ser asada en una parrilla de gas o carbón con una mezcla de especias y condimentos.


Además, el asado argentino se sirve típicamente con 

In [8]:
mensaje = [
    {"role": "user", "content": "Escribí un diálogo usando modismos porteños"}
]
# Generamos la respuesta
salida = generador(mensaje)
print(salida[0]["generated_text"])

The following generation flags are not valid and may be ignored: ['temperature']. Set `TRANSFORMERS_VERBOSITY=info` for more details.


 **Personaje 1:** ¡Ahí viene el tango, mi amigo! ¿Qué te parece si nos pongamos a bailar?

**Personaje 2:** ¡Claro que sí! Pero antes, ¿has visto ese nuevo restaurante en la calle Corrientes? Dicen que la comida es un milagro.

**Personaje 1:** ¡Vamos a ver! Aunque no se me ocurre que la comida sea milagroso, sí que es un lugar que vale la pena visitar.

**Personaje 2:** Exacto, y después de cenar, podríamos ir a ver una obra de teatro en el Teatro Colón.

**Personaje 1:** ¡Eso suena genial! Y si terminamos temprano, podríamos ir a tomar un mate en la esquina.

**Personaje 2:** ¡Perfecto! Aunque no me acostumbro a ello, me gusta probar cosas nuevas.

**Personaje 1:** No te preocupes, te lo explicaré. El mate es una bebida tradicional que se toma con una bombilla y un bombillazo.

**Personaje 2:** ¡Vaya! Me parece que estoy listo para aprender.

**Personaje 1:** ¡Genial! Y no olvides que en Buenos Aires, siempre hay algo que hacer.


### Tips para usar el modelo en español

* Usá instrucciones claras y específicas
* Incluí contexto cultural cuando sea relevante
* Pedile ejemplos relacionados con Argentina para mejor comprensión
* Experimentá con diferentes formas de hacer preguntas