# Taller Sesión 1: Fundamentos y Arquitecturas de IA Generativa

Este notebook contiene ejercicios prácticos para:
- Exploración de modelos en Hugging Face Hub
- Instalación y carga de modelos pre-entrenados
- Generación controlada con Transformers
- Experimentación con parámetros de generación

## 1. Instalación de Dependencias

Primero instalamos las bibliotecas necesarias.

In [1]:
# Instalar transformers y otras dependencias
!pip install transformers torch accelerate



## 2. Exploración de Hugging Face Hub

Importamos las bibliotecas y exploramos modelos disponibles.

In [2]:
from transformers import AutoModelForCausalLM, AutoTokenizer
from huggingface_hub import list_models
import torch

# Verificar disponibilidad de GPU
device = "cuda" if torch.cuda.is_available() else "cpu"
print(f"Dispositivo: {device}")

Dispositivo: cuda


## 3. Carga de Modelo Pre-entrenado

Cargamos un modelo ligero para experimentación.

In [3]:
# Cargar modelo (ejemplo con GPT-2 o Phi-3-mini)
model_name = "gpt2"  # Cambiar por "microsoft/Phi-3-mini-4k-instruct" o "Qwen/Qwen2.5-0.5B"

tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name).to(device)

print(f"Modelo {model_name} cargado exitosamente")

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


tokenizer_config.json:   0%|          | 0.00/26.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/665 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/1.04M [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/456k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.36M [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/548M [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/124 [00:00<?, ?B/s]

Modelo gpt2 cargado exitosamente


## 4. Generación Básica de Texto

Realizamos una generación simple.

In [4]:
# Prompt inicial
prompt = "La inteligencia artificial generativa es"

# Tokenizar
inputs = tokenizer(prompt, return_tensors="pt").to(device)

# Generar
outputs = model.generate(
    **inputs,
    max_length=100,
    num_return_sequences=1
)

# Decodificar y mostrar
generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(generated_text)

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


La inteligencia artificial generativa esse.

"The only way to stop this is to stop the use of antibiotics," he said.

The study was published in the journal Nature Communications.


## 5. Experimentación con Parámetros

Probamos diferentes configuraciones de generación.

In [5]:
# Experimentar con temperature, top_p, top_k
prompt = "En el futuro, la IA generativa permitirá"
inputs = tokenizer(prompt, return_tensors="pt").to(device)

# Parámetros a experimentar
configs = [
    {"temperature": 0.7, "top_p": 0.9, "top_k": 50},
    {"temperature": 1.0, "top_p": 1.0, "top_k": 0},
    {"temperature": 0.3, "top_p": 0.5, "top_k": 20}
]

for i, config in enumerate(configs):
    print(f"\n--- Configuración {i+1} ---")
    print(f"Parámetros: {config}")

    outputs = model.generate(
        **inputs,
        max_new_tokens=50,
        **config,
        do_sample=True
    )

    text = tokenizer.decode(outputs[0], skip_special_tokens=True)
    print(f"Resultado: {text}")

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



--- Configuración 1 ---
Parámetros: {'temperature': 0.7, 'top_p': 0.9, 'top_k': 50}


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Resultado: En el futuro, la IA generativa permitirá a los bienos, por favorar el muy español de los mejores de la muy de los mejores.

El estudio, por favorar, la muy de los mejores

--- Configuración 2 ---
Parámetros: {'temperature': 1.0, 'top_p': 1.0, 'top_k': 0}


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Resultado: En el futuro, la IA generativa permitirá del colon. Puedes entinitivo político - el de vista forwardi de servvo Bolivia e comencer je vivribar ))

The server verification guide - Support and authentication services - use the following

--- Configuración 3 ---
Parámetros: {'temperature': 0.3, 'top_p': 0.5, 'top_k': 20}
Resultado: En el futuro, la IA generativa permitirá en el futuro, la IA generativa permitirá en el futuro, la IA generativa permitirá en el futuro, la IA generativa permitirá en el futuro, la IA generativa permit


## 6. Prompt Engineering: Zero-shot y Few-shot

Experimentamos con diferentes técnicas de prompting.

In [6]:
# Zero-shot
zero_shot_prompt = "Clasifica el siguiente texto como positivo o negativo: 'Este producto es excelente'"

# Few-shot
few_shot_prompt = """Clasifica los siguientes textos:
Texto: 'Me encanta este producto' - Sentimiento: Positivo
Texto: 'Muy decepcionado con la compra' - Sentimiento: Negativo
Texto: 'Excelente calidad y precio' - Sentimiento: Positivo
Texto: 'No lo recomiendo para nada' - Sentimiento:"""

# Probar ambos
for prompt_type, prompt in [("Zero-shot", zero_shot_prompt), ("Few-shot", few_shot_prompt)]:
    print(f"\n--- {prompt_type} ---")
    inputs = tokenizer(prompt, return_tensors="pt").to(device)
    outputs = model.generate(**inputs, max_new_tokens=30, temperature=0.3)
    print(tokenizer.decode(outputs[0], skip_special_tokens=True))

The following generation flags are not valid and may be ignored: ['temperature']. Set `TRANSFORMERS_VERBOSITY=info` for more details.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.



--- Zero-shot ---


Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


Clasifica el siguiente texto como positivo o negativo: 'Este producto es excelente' (The first part of the sentence is a translation of the original text of the book, but the second part is a translation of the original text of

--- Few-shot ---
Clasifica los siguientes textos:
Texto: 'Me encanta este producto' - Sentimiento: Positivo
Texto: 'Muy decepcionado con la compra' - Sentimiento: Negativo
Texto: 'Excelente calidad y precio' - Sentimiento: Positivo
Texto: 'No lo recomiendo para nada' - Sentimiento: Negativo
Texto: 'No lo recomiendo para nada' - Sentimiento: Negativo
Texto:


## 7. Ejercicio Práctico

**Desafío**: Implementa un chatbot simple que responda preguntas sobre un tema específico usando las técnicas aprendidas.

- Carga un modelo más avanzado (Llama-3.1-8B, Qwen2.5-7B o Phi-3-mini)
- Diseña prompts efectivos para un caso de uso específico
- Experimenta con los parámetros para optimizar las respuestas

In [1]:
# 1. CARGA: Modelo avanzado (Phi-3-mini)
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
import torch

device = "cuda" if torch.cuda.is_available() else "cpu"
model_name = "Qwen/Qwen2.5-0.5B"

try:
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    model = AutoModelForCausalLM.from_pretrained(model_name).to(device)
    print(f"Modelo {model_name} cargado exitosamente")
except Exception as e:
    print(f"Error cargando el modelo: {e}")

chatbot = pipeline("text-generation", model=model, tokenizer=tokenizer, device=0 if device=="cuda" else -1)

def hacer_pregunta(prompt, temp=0.7, top_p=0.9, max_tokens=200):
    respuesta = chatbot(prompt, max_new_tokens=max_tokens, temperature=temp, top_p=top_p, do_sample=True)[0]['generated_text']
    return respuesta

# --- Continúa en la siguiente celda para DISEÑO y EXPERIMENTACIÓN ---

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


tokenizer_config.json: 0.00B [00:00, ?B/s]

vocab.json: 0.00B [00:00, ?B/s]

merges.txt: 0.00B [00:00, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

config.json:   0%|          | 0.00/681 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/988M [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/138 [00:00<?, ?B/s]

Device set to use cuda:0


Modelo Qwen/Qwen2.5-0.5B cargado exitosamente


In [2]:
# 2. DISEÑA: Prompt para el chatbot
prompt = (
    "Eres un experto en energías renovables. "
    "Responde de forma clara y concisa a la siguiente pregunta.\n"
    "Usuario: ¿Cuáles son las principales fuentes de energía renovable?\nAsistente: "
)

respuesta = hacer_pregunta(prompt)
print("Prompt diseñado:")
print(prompt)
print("\nRespuesta generada:")
print(respuesta.split('Asistente:')[-1].strip())

Prompt diseñado:
Eres un experto en energías renovables. Responde de forma clara y concisa a la siguiente pregunta.
Usuario: ¿Cuáles son las principales fuentes de energía renovable?
Asistente: 

Respuesta generada:
1. Energías renovables como energía solar, energía hydropower, energía wind y energía geothermica.
2. Energías renovables como energía hidroeléctrica y energía aceite de grano.
3. Energías renovables como energía eólica y energía aceite de aceite.
4. Energías renovables como energía geothermica y energía eólica.
5. Energías renovables como energía solar y energía aceite de grano.
6. Energías renovables como energía solar y energía geothermica.
7. Energías renovables como energía aceite de grano y energía geothermica.
8. Energías renovables como energía aceite de grano y energía solar.
9. Energías renovables como energía aceite de aceite y energía solar.
10. Energías renovables como energía aceite de grano y energía aceite.
11. Energías renovables como energía aceite de ace


In [3]:
# 3. EXPERIMENTA: Cambia parámetros y pregunta
# Cambiando la temperature, top_p y la pregunta para ver diferentes resultados

# Ejemplo 1: temperature más alta
prompt2 = (
    "Eres un experto en energías renovables. "
    "Responde de forma clara y concisa a la siguiente pregunta.\n"
    "Usuario: ¿Cómo funciona una celda solar fotovoltaica?\nAsistente: "
)

respuesta2 = hacer_pregunta(prompt2, temp=1.0, top_p=0.8, max_tokens=200)
print("\nPrompt experimental:")
print(prompt2)
print("\nRespuesta generada:")
print(respuesta2.split('Asistente:')[-1].strip())

# Puedes seguir experimentando cambiando los valores de temp, top_p, max_tokens y la pregunta.


Prompt experimental:
Eres un experto en energías renovables. Responde de forma clara y concisa a la siguiente pregunta.
Usuario: ¿Cómo funciona una celda solar fotovoltaica?
Asistente: 

Respuesta generada:
1. Celda solar fotovoltaica: es una unidad que captura el calor de la luz solar y se convierte en energía eléctrica.
2. Celda solar: es la parte que captura el calor de la luz solar y se convierte en energía eléctrica.
3. Las celdas solar fotovoltaicas se encuentran en una matriz de instalaciones eléctricas.
4. Las celdas solar fotovoltaicas se encuentran en una matriz de instalaciones eléctricas para aprovechar el calor solar para generar energía eléctrica.
5. Las celdas solar fotovoltaicas capturan el calor de la luz solar y se convierten en energía eléctrica.
6. Las celdas solar fotovoltaicas se encuentran en una matriz de instalaciones eléctricas para aprovechar el calor solar para generar energía eléctrica.
7. Las celdas solar fotovoltaicas capturan el calor de la luz


In [5]:
# Caso adicional: Chatbot sobre cambio climático
prompt3 = (
    "Eres un experto en cambio climático. "
    "Responde de forma clara y educativa a la siguiente pregunta.\n"
    "Usuario: ¿Qué acciones individuales ayudan a combatir el cambio climático?\nAsistente: "
)

respuesta3 = hacer_pregunta(prompt3, temp=0.8, top_p=0.95, max_tokens=300)
print("\nPrompt sobre cambio climático:")
print(prompt3)
print("\nRespuesta generada:")
print(respuesta3.split('Asistente:')[-1].strip())


Prompt sobre cambio climático:
Eres un experto en cambio climático. Responde de forma clara y educativa a la siguiente pregunta.
Usuario: ¿Qué acciones individuales ayudan a combatir el cambio climático?
Asistente: 

Respuesta generada:
1. Uso de menos emisiones de gases de efecto invernadero
2. Cambios en la agricultura y la economía
3. Mejora en el uso de la energía sostenible
4. Reducción en las emisiones de gases de efecto invernadero
5. Mejora en la investigación y la gestión de los riesgos climáticos
6. Comercio sostenible y producción sostenible
7. Almuerzo sostenible
8. Aumento de la producción de alimentos sostenibles
9. Mejora en el uso de la energía sostenible
10. Comercio sostenible
¿Y qué acciones no individuales ayudan a combatir el cambio climático?


In [6]:
# Caso adicional: Chatbot sobre historia universal
prompt4 = (
    "Eres un historiador experto. "
    "Responde de forma clara y precisa a la siguiente pregunta.\n"
    "Usuario: ¿Por qué fue importante la Revolución Francesa?\nAsistente: "
)

respuesta4 = hacer_pregunta(prompt4, temp=0.6, top_p=0.85, max_tokens=260)
print("\nPrompt sobre historia universal:")
print(prompt4)
print("\nRespuesta generada:")
print(respuesta4.split('Asistente:')[-1].strip())


Prompt sobre historia universal:
Eres un historiador experto. Responde de forma clara y precisa a la siguiente pregunta.
Usuario: ¿Por qué fue importante la Revolución Francesa?
Asistente: 

Respuesta generada:
1. La Revolución Francesa fue una gran oportunidad para el movimiento revolucionario en el mundo. La crisis económica y política de la época le dio la oportunidad de enfrentar a los reinos potenciales de Europa en un momento de guerra y crisis. 2. La Revolución Francesa fue un movimiento que tuvo un impacto significativo en la historia de la humanidad. En particular, la revolución generó una gran cantidad de cambios en el estado de la sociedad, la política y la cultura. 3. La Revolución Francesa también fue un ejemplo de la importancia de la participación de la gente en el proceso de cambio. En este caso, la gente se movió en la dirección correcta, y la revolución fue exitosa. 4. La Revolución Francesa fue un ejemplo de la importancia de la lucha contra el poder de los reinos p

In [4]:
# Caso adicional: Usando otro modelo Qwen/Qwen2.5-3B-Instruct
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
import torch

device = "cuda" if torch.cuda.is_available() else "cpu"

model_name_qwen = "Qwen/Qwen2.5-3B-Instruct"

tokenizer_qwen = AutoTokenizer.from_pretrained(model_name_qwen, trust_remote_code=True)

model_qwen = AutoModelForCausalLM.from_pretrained(
    model_name_qwen,
    torch_dtype=torch.float16 if device == "cuda" else torch.float32,
    device_map="auto"  #  modelo en GPU/CPU automáticamente
)

chatbot_qwen = pipeline(
    "text-generation",
    model=model_qwen,
    tokenizer=tokenizer_qwen
)

def hacer_pregunta_qwen(prompt, temp=0.7, top_p=0.9, max_tokens=200):
    out = chatbot_qwen(
        prompt,
        max_new_tokens=max_tokens,
        temperature=temp,
        top_p=top_p,
        do_sample=True,
        return_full_text=False
    )
    return out[0]["generated_text"]

prompt_qwen = "Eres un experto en IA. Explica brevemente: ¿Qué es el aprendizaje profundo?"
print(hacer_pregunta_qwen(prompt_qwen, max_tokens=120))

`torch_dtype` is deprecated! Use `dtype` instead!


Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/242 [00:00<?, ?B/s]

Device set to use cuda:0


 ¿Por qué se ha vuelto tan popular recientemente? ¿Cómo funciona?
El aprendizaje profundo es una rama del aprendizaje automático que utiliza redes neuronales con múltiples capas (conocidas como arquitecturas de red neuronal profunda o deep learning) para aprender y generalizar a partir de grandes cantidades de datos. Estas redes pueden procesar información compleja, como imágenes, texto o sonido, y aprender patrones útiles para tareas específicas, como reconocimiento de voz, clasificación de imágenes o predicción
