## üìò Introducci√≥n a los LLMs y al Prompt Engineering

### Glosario de Conceptos

#### ¬øQu√© es un LLM y c√≥mo funciona?

Un **LLM (Large Language Model)** es un modelo de lenguaje basado en aprendizaje profundo, entrenado con grandes vol√∫menes de texto para entender y generar lenguaje humano. Est√° dise√±ado para realizar tareas como:

- Completar textos
- Traducir idiomas
- Responder preguntas
- Generar c√≥digo
- Resumir contenido

Los LLMs se basan principalmente en la **arquitectura Transformer**, donde la atenci√≥n es el mecanismo clave para procesar texto en paralelo y comprender el contexto.

**Funcionamiento general:**

1. **Input (Prompt):** El usuario proporciona una instrucci√≥n o contexto.
2. **Tokenizaci√≥n:** El texto se convierte en tokens (fragmentos de palabras).
3. **Procesamiento:** El modelo calcula relaciones entre tokens usando capas de atenci√≥n.
4. **Output:** El modelo genera una respuesta (texto, c√≥digo, etc.) como continuaci√≥n l√≥gica del prompt.

---

## üß† Fundamentos del Prompting

El **prompting** es el arte de dise√±ar entradas efectivas para obtener respuestas √∫tiles de un modelo LLM. Existen tres enfoques comunes:

### ‚úÖ Zero-shot Prompting

Consiste en hacer una solicitud directa al modelo **sin proporcionar ejemplos previos**.

```text
Prompt:
"Resume el siguiente texto en una oraci√≥n."
```

### ‚úÖ Few-shot Prompting
Se proporciona al modelo uno o m√°s ejemplos antes de realizar la solicitud. Esto le ayuda a entender el formato o la l√≥gica deseada.

```text
Prompt:
Texto: "El cielo est√° nublado y podr√≠a llover."
Resumen: "Podr√≠a llover pronto."

Texto: "Hace calor y hay mucho sol."
Resumen:
```

### ‚úÖ Chain-of-Thought (CoT) Prompting
Implica pedirle al modelo que razone paso a paso, como si pensara en voz alta. Esto permite respuestas m√°s precisas para tareas de l√≥gica, c√°lculo o an√°lisis.

```text
Pregunta:
Si Mar√≠a tiene 5 manzanas y le da 2 a Juan, ¬øcu√°ntas le quedan?

Respuesta:
Primero, Mar√≠a tiene 5 manzanas.
Luego, le da 2 a Juan.
Entonces, le quedan 3 manzanas.
```

### üî† Tokens, Embeddings y Generaci√≥n de Texto
#### üéØ Tokens

Los LLMs no procesan texto directamente, sino que lo dividen en tokens, que pueden ser palabras, s√≠labas o incluso fragmentos de palabras.

```text
Texto: "Hola mundo"
Tokens: [ "Hola", " mundo" ]
```

#### üß¨ Embeddings

Cada token se transforma en un vector num√©rico conocido como embedding, que captura informaci√≥n sem√°ntica. Los embeddings permiten al modelo entender similitudes y relaciones entre palabras.

####  ‚úçÔ∏è Generaci√≥n de Texto

La generaci√≥n de texto se realiza token por token, prediciendo la siguiente palabra m√°s probable seg√∫n el contexto anterior. El resultado final es una secuencia coherente y contextual.

In [None]:
from google import genai
from getpass import getpass
GEMINI_API_KEY = getpass('Enter API key: ')

In [None]:
import google.generativeai as genai

# Configura tu API key (aseg√∫rate de definir GEMINI_API_KEY correctamente antes)
genai.configure(api_key=GEMINI_API_KEY)

# Usa el modelo correcto
model = genai.GenerativeModel('gemini-2.0-flash')

# Llama a generate_content correctamente
response = model.generate_content("Act√∫a como profe de ingl√©s y explica el pasado imperfecto con ejemplos.")

# Imprime el resultado
print(response.text)

## üß© Modelos LLM Multimodales

#### ¬øQu√© son?

Los **LLMs multimodales** son modelos de lenguaje capaces de procesar y generar contenido no solo en texto, sino tambi√©n a partir de otras modalidades como **im√°genes**, **audio** y **video**. Esto permite una interacci√≥n m√°s natural y enriquecida con la inteligencia artificial.

---

#### üß™ Ejemplos de uso con Gemini

- üñºÔ∏è **Descripci√≥n de im√°genes**: interpretar el contenido visual y generar descripciones en lenguaje natural.
- üîä **Transcripci√≥n de audio**: convertir voz a texto de manera autom√°tica.
- üòä **An√°lisis de sentimiento**: detectar emociones y tono a partir de texto o voz.

---

#### ‚öôÔ∏è Par√°metros importantes

Al usar LLMs multimodales, se pueden ajustar varios **par√°metros de configuraci√≥n** para optimizar resultados:

- `temperature`: controla la creatividad de las respuestas (valores bajos generan respuestas m√°s precisas).
- `model`: selecci√≥n del modelo adecuado (ej. `gemini-2.0-pro`, `gemini-2.0-flash`, etc.).
- `max_output_tokens`: define la longitud m√°xima de la respuesta generada.

---

#### üí° Ventajas clave

- Interacci√≥n m√°s rica y contextual.
- Permite soluciones inclusivas y accesibles.
- Aplicaciones en educaci√≥n, salud, dise√±o, etc.

---

#### üîó Recurso √∫til

- [Gemini Multimodal API](https://aistudio.google.com/)

In [None]:
import google.generativeai as genai
genai.configure(api_key=GEMINI_API_KEY)

model = genai.GenerativeModel('gemini-2.0-flash')

response = model.generate_content(
    "Act√∫a como profe de ingl√©s, y dame ejemplos para mejorar vocabulario.",
    generation_config={
        "temperature": 0.1,
        "max_output_tokens": 500
    }
)

print(response.text)

In [None]:
from PIL import Image
import requests
from io import BytesIO
import google.generativeai as genai

genai.configure(api_key=GEMINI_API_KEY)

image_url = "https://kinsta.com/es/wp-content/uploads/sites/8/2019/09/jpg-vs-jpeg.jpg"
response = requests.get(image_url)
img = Image.open(BytesIO(response.content))

img_byte_arr = BytesIO()
img.save(img_byte_arr, format='JPEG')
img_bytes = img_byte_arr.getvalue()

model = genai.GenerativeModel('gemini-2.0-flash')

# Send the prompt with image
response = model.generate_content(
    [
        "Describe la escena en la imagen usando palabras sencillas para que un estudiante principiante pueda entenderla.",
        {"mime_type": "image/jpeg", "data": img_bytes}
    ]
)

# Print the result
print(response.text)

## üíª Generaci√≥n de C√≥digo con LLMs

### Introducci√≥n

Los **Modelos de Lenguaje de Gran Escala (LLMs)** no solo comprenden texto, tambi√©n pueden **generar c√≥digo** en m√∫ltiples lenguajes de programaci√≥n. Gracias a su capacidad de aprender patrones sint√°cticos y sem√°nticos, los LLMs son √∫tiles para tareas como:

- Escribir funciones y scripts desde cero
- Explicar fragmentos de c√≥digo
- Traducir c√≥digo entre lenguajes
- Automatizar tareas repetitivas
- Resolver problemas paso a paso

Uno de los principales beneficios es la **aceleraci√≥n del desarrollo**, especialmente para principiantes o para quienes buscan prototipar r√°pidamente. Sin embargo, es importante **verificar la validez y seguridad** del c√≥digo generado.

---

### üß™ Actividad: Traductor palabra por palabra en Python

#### Enunciado

Usa **Gemini API** para generar un script en Python que:

- Reciba como entrada una oraci√≥n en ingl√©s.
- Devuelva la traducci√≥n **palabra por palabra** al espa√±ol.
- Se asuma que el modelo es un **experto en Python** y proporcione una soluci√≥n funcional y clara.

In [None]:
import google.generativeai as genai
genai.configure(api_key=GEMINI_API_KEY)
model = genai.GenerativeModel('gemini-2.0-flash')
response = model.generate_content("Eres un experto en python. Escribe un c√≥digo en Python que tome una oraci√≥n en ingl√©s y lo traduzca cada palabra al espa√±ol")
print(response.text)

### **Prompt Template**

In [None]:
prompt_template = """
Eres un experto en programaci√≥n, escribiendo c√≥digo limpio en python y escribes comentarios en cada l√≠nea de c√≥digo.
a continuaci√≥n, {pregunta}.
"""
pregunta = "Crea un diccionario"
prompt = prompt_template.format(pregunta=pregunta)
print(prompt)

In [None]:
import google.generativeai as genai
genai.configure(api_key=GEMINI_API_KEY)
model = genai.GenerativeModel('gemini-2.0-flash')
response = model.generate_content(prompt)
print(response.text)

In [None]:
#Implementaci√≥n de modelo que razona 'experimental gemini 2.0 flash'
import google.generativeai as genai
genai.configure(api_key=GEMINI_API_KEY)
model = genai.GenerativeModel('gemini-2.0-flash-thinking-exp')
response = model.generate_content(prompt)
print(response.text)

In [None]:
from IPython.display import display, Markdown
import google.generativeai as genai

#Implementaci√≥n de modelo que razona 'experimental gemini 2.0 flash'
prompt_template = """
Eres un experto en programaci√≥n, escribiendo c√≥digo limpio en python y escribes comentarios en cada l√≠nea de c√≥digo.
Explicame este c√≥digo con detalle y como aplicarlo.
a continuaci√≥n,
{codigo}.

El resultado deve estar en formato Markdown.
"""

codigo = """{ # Inicia la definici√≥n del diccionario con una llave de apertura {.
    "clave_texto": "valor de ejemplo", # Define el primer par clave-valor: "clave_texto" apunta a una cadena.
    "clave_numero": 123,             # Define el segundo par clave-valor: "clave_numero" apunta a un n√∫mero entero.
    "clave_booleano": True,          # Define el tercer par clave-valor: "clave_booleano" apunta a un valor booleano.
    "clave_lista": [1, 2, 3]         # Define el cuarto par clave-valor: "clave_lista" apunta a una lista.
} # Cierra la definici√≥n del diccionario con una llave de cierre }.
"""

prompt = prompt_template.format(codigo=codigo)

print(prompt)
genai.configure(api_key=GEMINI_API_KEY)
model = genai.GenerativeModel('gemini-2.0-flash-thinking-exp')
response = model.generate_content(prompt)
display(Markdown(response.text))

# üíª 3. Generaci√≥n de C√≥digo y Hugging Face

## üßæ Generaci√≥n y explicaci√≥n de c√≥digo mediante prompts

Los **Modelos de Lenguaje de Gran Escala (LLMs)** pueden generar fragmentos de c√≥digo fuente a partir de instrucciones en lenguaje natural. Esto se logra mediante **prompts** bien dise√±ados que indican al modelo qu√© tipo de c√≥digo se desea obtener. Por ejemplo, se puede pedir al modelo:

- Que escriba una funci√≥n espec√≠fica.
- Que traduzca c√≥digo de un lenguaje a otro.
- Que explique paso a paso lo que hace un bloque de c√≥digo.

Esta capacidad transforma al LLM en un asistente de programaci√≥n que puede ser √∫til tanto para principiantes como para desarrolladores avanzados.

---

## ü§ó Uso de la librer√≠a Transformers de Hugging Face

La biblioteca **Transformers** de [Hugging Face](https://huggingface.co/transformers/) permite acceder y trabajar con una gran variedad de modelos preentrenados, incluyendo aquellos dise√±ados para tareas de generaci√≥n de c√≥digo como:

- `CodeT5`
- `StarCoder`
- `GPT-2` y `GPT-Neo` con fine-tuning
- `Phi`, `CodeGen`, entre otros

Caracter√≠sticas clave de la librer√≠a:

- Compatibilidad con PyTorch y TensorFlow.
- Carga sencilla de modelos y tokenizadores.
- Interfaz de alto nivel para inferencia y entrenamiento.
- Integraci√≥n con APIs como Google Generative AI, OpenAI o DeepSpeed.

---

## ‚öñÔ∏è Ventajas y desaf√≠os del uso de LLMs en programaci√≥n

### ‚úÖ Ventajas
- **Ahorro de tiempo:** Los desarrolladores pueden generar funciones, scripts y estructuras b√°sicas en segundos.
- **Automatizaci√≥n:** Es posible automatizar tareas repetitivas como generaci√≥n de boilerplate, validaciones o transformaciones de datos.
- **Soporte educativo:** Ideal para aprender programaci√≥n, entender errores y practicar con ejemplos guiados.

### ‚ö†Ô∏è Desaf√≠os
- **Alucinaciones:** El modelo puede inventar funciones o estructuras no v√°lidas, incluso si su sintaxis parece correcta.
- **Seguridad:** Puede generar c√≥digo vulnerable si no se aplican filtros o validaciones.
- **Dependencia excesiva:** Usar el modelo sin entender el c√≥digo puede llevar a una p√©rdida de criterio t√©cnico o errores en producci√≥n.

### ü§ó **Hugging Face**

**Hugging Face** es una plataforma y comunidad de c√≥digo abierto enfocada en la **inteligencia artificial** y el **procesamiento de lenguaje natural (NLP)**. Es ampliamente reconocida por facilitar el acceso a modelos de lenguaje preentrenados y herramientas para desarrolladores, investigadores y entusiastas de la IA.

---

#### üîß ¬øQu√© ofrece Hugging Face?

- **Transformers**: biblioteca en Python para utilizar modelos de lenguaje como BERT, GPT-2, T5, entre otros. Compatible con PyTorch y TensorFlow.
- **Model Hub**: repositorio con miles de modelos preentrenados listos para usar.
- **Datasets**: colecci√≥n de conjuntos de datos p√∫blicos para entrenamiento y evaluaci√≥n de modelos.
- **Spaces**: plataforma para crear y compartir aplicaciones de IA usando Gradio, Streamlit o similares.
- **Tokenizers**: herramientas para convertir texto en tokens de forma eficiente, fundamentales en NLP.

---

#### üí° Aplicaciones comunes

- Generaci√≥n de texto
- Traducci√≥n autom√°tica
- Clasificaci√≥n de sentimientos
- Resumen de textos
- Chatbots y asistentes virtuales
- Pregunta-respuesta (Q&A)

In [None]:
from transformers import MarianMTModel, MarianTokenizer
model_name = "Helsinki-NLP/opus-mt-en-es"
tokenizer = MarianTokenizer.from_pretrained(model_name)
model = MarianMTModel.from_pretrained(model_name)

In [None]:
texto_ingles = ["Hello, how are you?", "This is a translation test."]
tokens = tokenizer(texto_ingles, return_tensors="pt", padding=True)

In [None]:
traduccion_tokens = model.generate(**tokens)
traduccion_texto = tokenizer.batch_decode(traduccion_tokens, skip_special_tokens=True)
print(traduccion_texto)

In [None]:
for i, t in zip(texto_ingles, traduccion_texto):
  print(f"Ingl√©s: {i} - Espa√±ol: {t}")

### üîç **RAG (Retrieval-Augmented Generation)**

**RAG (Generaci√≥n Aumentada con Recuperaci√≥n)** es una t√©cnica que combina **modelos generativos** (como los LLMs) con un **sistema de recuperaci√≥n de informaci√≥n**. Su objetivo es mejorar las respuestas del modelo accediendo a fuentes de conocimiento externas en tiempo real.

---

#### üß† ¬øC√≥mo funciona?

1. **Consulta**: El usuario env√≠a una pregunta o prompt.
2. **Recuperaci√≥n**: El sistema busca informaci√≥n relevante en una base de datos o colecci√≥n de documentos (por ejemplo, usando un motor tipo vectorial como FAISS o Elasticsearch).
3. **Generaci√≥n**: El modelo LLM usa la informaci√≥n recuperada para generar una respuesta m√°s precisa y actualizada.

---

#### üìå Caracter√≠sticas clave

- No requiere reentrenar el modelo base.
- Permite respuestas m√°s **contextualizadas** y **actualizadas**.
- Ideal para sistemas que usan datos privados, espec√≠ficos o en constante cambio.

---

#### üß™ Ejemplos de uso

- Asistentes de atenci√≥n al cliente que consultan una base de conocimientos.
- Sistemas de recomendaci√≥n basados en documentos.
- Aplicaciones empresariales que combinan IA generativa con datos internos.

---

#### ‚öñÔ∏è Ventajas vs Fine-Tuning

| RAG                                  | Fine-Tuning                          |
|--------------------------------------|--------------------------------------|
| Usa documentos externos              | Modifica el modelo base              |
| No necesita entrenamiento adicional  | Requiere entrenamiento y c√≥mputo     |
| Respuestas actualizadas y din√°micas | Respuestas m√°s coherentes y estables |

In [None]:
documentos = {
    "IA": "La inteligencia artificial es un campo de la inform√°tica que se centra en la creaci√≥n de sistemas capaces de realizar tareas que normalmente requieren inteligencia humana, como reconocer voz, im√°genes, tomar decisiones o resolver problemas.",
    "RAG": "Retrieval-Augmented Generation (RAG) es una t√©cnica de IA que combina b√∫squeda de informaci√≥n en bases de datos o documentos con modelos generativos, permitiendo respuestas m√°s precisas y basadas en conocimiento actualizado.",
    "Machine Learning": "El aprendizaje autom√°tico es una rama de la inteligencia artificial que permite a las computadoras aprender de datos y mejorar su rendimiento sin ser programadas expl√≠citamente para cada tarea."
}

In [None]:
def recuperar_contexto(pregunta):
  for tema, contenido in documentos.items():
    if tema.lower() in pregunta.lower():
      return contenido
    return "No se encontro informaci√≥n relevante en la base de conocimientos"

In [None]:
def generar_respuesta(pregunta):
  contexto = recuperar_contexto(pregunta)
  prompt = f"""Usa el siguiente contexto para responder la pregunta de manera clara y concisa \n\n Contexto: {contexto} \n\n Pregunta: {pregunta}"""
  genai.configure(api_key=GEMINI_API_KEY)
  model = genai.GenerativeModel('gemini-2.0-flash')
  response = model.generate_content(prompt)
  return response.text

In [None]:
pregunta_usuario = "Que es RAG"
respuesta = generar_respuesta(pregunta_usuario)
print(respuesta)

In [None]:
pregunta_usuario = "Que es Cartagena"
respuesta = generar_respuesta(pregunta_usuario)
print(respuesta)