# Introducción a los Modelos de Lenguaje

---

## Configuración Inicial

Antes de comenzar, necesitamos configurar nuestro entorno en Google Colab:

1. Asegúrate de activar la GPU:
   - Ve a **Entorno de ejecución > Cambiar tipo de entorno de ejecución > Acelerador de Hardware > GPU > Tipo de GPU > T4**

2. Instala las bibliotecas necesarias:


In [None]:
# @title Instalación de Dependencias { display-mode: "form" }
# @markdown Ejecutá esta celda para instalar las bibliotecas necesarias
!pip install transformers>=4.40.1 accelerate>=0.27.2

###Carga del Modelo
Vamos a usar un modelo que funciona bien con texto en español:

In [None]:
from transformers import AutoModelForCausalLM, AutoTokenizer

# Cargamos Phi-3, un modelo que entiende español
# Cambiado de device_map="cuda" a device_map="cpu" para usar CPU
model = AutoModelForCausalLM.from_pretrained(
    "microsoft/Phi-3-mini-4k-instruct",
    device_map="cpu", # Usar CPU si no hay GPU disponible
    torch_dtype="auto",
    trust_remote_code=False,
)
tokenizer = AutoTokenizer.from_pretrained("microsoft/Phi-3-mini-4k-instruct")

# Creamos un pipeline para facilitar el uso
from transformers import pipeline

generador = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    return_full_text=False,
    max_new_tokens=500,
    do_sample=False
)

Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/181 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/3.44k [00:00<?, ?B/s]

tokenizer.model:   0%|          | 0.00/500k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.94M [00:00<?, ?B/s]

added_tokens.json:   0%|          | 0.00/306 [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/599 [00:00<?, ?B/s]

Device set to use cpu
The following generation flags are not valid and may be ignored: ['temperature']. Set `TRANSFORMERS_VERBOSITY=info` for more details.


In [None]:
from transformers import AutoModelForCausalLM, AutoTokenizer

# Cargamos Phi-3, un modelo que entiende español
model = AutoModelForCausalLM.from_pretrained(
    "microsoft/Phi-3-mini-4k-instruct",
    device_map="cuda",
    torch_dtype="auto",
    trust_remote_code=False,
)
tokenizer = AutoTokenizer.from_pretrained("microsoft/Phi-3-mini-4k-instruct")

# Creamos un pipeline para facilitar el uso
from transformers import pipeline

generador = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    return_full_text=False,
    max_new_tokens=500,
    do_sample=False
)

In [None]:
mensaje = [
    {"role": "user", "content": "Escribí un párrafo corto sobre el dulce de leche y su importancia en la cultura argentina."}
]

# Generamos la respuesta
salida = generador(mensaje)
print(salida[0]["generated_text"])

The following generation flags are not valid and may be ignored: ['temperature']. Set `TRANSFORMERS_VERBOSITY=info` for more details.


 El dulce de leche, conocido en Argentina como "manjar," es una delicia que ha trascendido fronteras y generaciones. Este dulce, con su sabor rico y sedoso, se elabora a partir de la cocción prolongada de leche condensada, lo que le confiere su característico color amarillo dorado y su textura cremosa. No solo es un postre popular en reuniones familiares y fiestas, sino que también se utiliza en una variedad de platos, desde los tradicionales como las alfajores hasta los modernos como la pizza de dulce de leche. Su importancia en la cultura argentina es incuestionable, ya que representa un símbolo de la identidad culinaria del país y es un elemento esencial en la gastronomía argentina, reflejando la pasión y el arte de la cocina local.


### Explicaciones Teóricas

#### ¿Qué es Phi-3?
Phi-3 es un modelo de lenguaje desarrollado por Microsoft que:

* Entiende y genera texto en múltiples idiomas
* Puede mantener conversaciones naturales
* Es capaz de realizar tareas como escritura creativa, responder preguntas y más
* Tiene un buen entendimiento del contexto cultural

#### ¿Cómo funciona?
* **Entrada de texto:** Le das una instrucción o pregunta en español
* **Procesamiento:** El modelo analiza el texto usando su conocimiento previo
* **Generación:** Crea una respuesta coherente y contextualmente apropiada

###Ejercicios

In [None]:
prompt = "Escribí una receta de mate paso a paso"

# Ejercicio de cultura
prompt = "Explicá la diferencia entre el asado argentino y otros tipos de BBQ"

# Ejercicio de lenguaje local
prompt = "Escribí un diálogo usando modismos porteños"

### Tips para usar el modelo en español

* Usá instrucciones claras y específicas
* Incluí contexto cultural cuando sea relevante
* Pedile ejemplos relacionados con Argentina para mejor comprensión
* Experimentá con diferentes formas de hacer preguntas