## 📘 Introducción a los LLMs y al Prompt Engineering

### Glosario de Conceptos

#### ¿Qué es un LLM y cómo funciona?

Un **LLM (Large Language Model)** es un modelo de lenguaje basado en aprendizaje profundo, entrenado con grandes volúmenes de texto para entender y generar lenguaje humano. Está diseñado para realizar tareas como:

- Completar textos
- Traducir idiomas
- Responder preguntas
- Generar código
- Resumir contenido

Los LLMs se basan principalmente en la **arquitectura Transformer**, donde la atención es el mecanismo clave para procesar texto en paralelo y comprender el contexto.

**Funcionamiento general:**

1. **Input (Prompt):** El usuario proporciona una instrucción o contexto.
2. **Tokenización:** El texto se convierte en tokens (fragmentos de palabras).
3. **Procesamiento:** El modelo calcula relaciones entre tokens usando capas de atención.
4. **Output:** El modelo genera una respuesta (texto, código, etc.) como continuación lógica del prompt.

---

## 🧠 Fundamentos del Prompting

El **prompting** es el arte de diseñar entradas efectivas para obtener respuestas útiles de un modelo LLM. Existen tres enfoques comunes:

### ✅ Zero-shot Prompting

Consiste en hacer una solicitud directa al modelo **sin proporcionar ejemplos previos**.

```text
Prompt:
"Resume el siguiente texto en una oración."
```

### ✅ Few-shot Prompting
Se proporciona al modelo uno o más ejemplos antes de realizar la solicitud. Esto le ayuda a entender el formato o la lógica deseada.

```text
Prompt:
Texto: "El cielo está nublado y podría llover."
Resumen: "Podría llover pronto."

Texto: "Hace calor y hay mucho sol."
Resumen:
```

### ✅ Chain-of-Thought (CoT) Prompting
Implica pedirle al modelo que razone paso a paso, como si pensara en voz alta. Esto permite respuestas más precisas para tareas de lógica, cálculo o análisis.

```text
Pregunta:
Si María tiene 5 manzanas y le da 2 a Juan, ¿cuántas le quedan?

Respuesta:
Primero, María tiene 5 manzanas.
Luego, le da 2 a Juan.
Entonces, le quedan 3 manzanas.
```

### 🔠 Tokens, Embeddings y Generación de Texto
#### 🎯 Tokens

Los LLMs no procesan texto directamente, sino que lo dividen en tokens, que pueden ser palabras, sílabas o incluso fragmentos de palabras.

```text
Texto: "Hola mundo"
Tokens: [ "Hola", " mundo" ]
```

#### 🧬 Embeddings

Cada token se transforma en un vector numérico conocido como embedding, que captura información semántica. Los embeddings permiten al modelo entender similitudes y relaciones entre palabras.

####  ✍️ Generación de Texto

La generación de texto se realiza token por token, prediciendo la siguiente palabra más probable según el contexto anterior. El resultado final es una secuencia coherente y contextual.

In [1]:
from google import genai
from getpass import getpass
GEMINI_API_KEY = getpass('Enter API key: ')

Enter API key:  ········


In [2]:
import google.generativeai as genai

# Configura tu API key (asegúrate de definir GEMINI_API_KEY correctamente antes)
genai.configure(api_key=GEMINI_API_KEY)

# Usa el modelo correcto
model = genai.GenerativeModel('gemini-2.0-flash')

# Llama a generate_content correctamente
response = model.generate_content("Actúa como profe de inglés y explica el pasado imperfecto con ejemplos.")

# Imprime el resultado
print(response.text)

Alright students, settle down, settle down! Today, we're diving into a tense that can be a little tricky but oh-so-useful: the **Past Imperfect**!

Think of the Past Imperfect as painting a scene from the past, focusing not on completed actions, but on the **ongoing actions, descriptions, and states of being.** It's like a snapshot of a moment in time that's been stretched out.

**What is the Past Imperfect?**

The Past Imperfect is used to describe:

*   **Habitual actions in the past:** Things you used to do regularly.
*   **Ongoing actions in the past:** Actions that were in progress at a specific time.
*   **Descriptions of people, places, and things in the past:** Details about appearance, feelings, or surroundings.
*   **Background information in a narrative:** Setting the scene for a story.
*   **Simultaneous actions in the past:** Two or more things happening at the same time.

**How to Form the Past Imperfect (Irregular Verbs)**

While the rules to form the past imperfect vari

## 🧩 Modelos LLM Multimodales

#### ¿Qué son?

Los **LLMs multimodales** son modelos de lenguaje capaces de procesar y generar contenido no solo en texto, sino también a partir de otras modalidades como **imágenes**, **audio** y **video**. Esto permite una interacción más natural y enriquecida con la inteligencia artificial.

---

#### 🧪 Ejemplos de uso con Gemini

- 🖼️ **Descripción de imágenes**: interpretar el contenido visual y generar descripciones en lenguaje natural.
- 🔊 **Transcripción de audio**: convertir voz a texto de manera automática.
- 😊 **Análisis de sentimiento**: detectar emociones y tono a partir de texto o voz.

---

#### ⚙️ Parámetros importantes

Al usar LLMs multimodales, se pueden ajustar varios **parámetros de configuración** para optimizar resultados:

- `temperature`: controla la creatividad de las respuestas (valores bajos generan respuestas más precisas).
- `model`: selección del modelo adecuado (ej. `gemini-2.0-pro`, `gemini-2.0-flash`, etc.).
- `max_output_tokens`: define la longitud máxima de la respuesta generada.

---

#### 💡 Ventajas clave

- Interacción más rica y contextual.
- Permite soluciones inclusivas y accesibles.
- Aplicaciones en educación, salud, diseño, etc.

---

#### 🔗 Recurso útil

- [Gemini Multimodal API](https://aistudio.google.com/)

In [3]:
import google.generativeai as genai
genai.configure(api_key=GEMINI_API_KEY)

model = genai.GenerativeModel('gemini-2.0-flash')

response = model.generate_content(
    "Actúa como profe de inglés, y dame ejemplos para mejorar vocabulario.",
    generation_config={
        "temperature": 0.1,
        "max_output_tokens": 500
    }
)

print(response.text)

¡Hola! ¡Qué bueno que quieres expandir tu vocabulario en inglés! Es una de las mejores maneras de mejorar tu fluidez y comprensión. Aquí te presento algunas estrategias y ejemplos para que empieces a trabajar en ello:

**1. Aprende palabras en contexto:**

*   **En lugar de:** Memorizar listas de palabras aisladas.
*   **Intenta:** Aprender palabras dentro de frases y oraciones. Esto te ayudará a entender cómo se usan en la vida real.

    *   **Ejemplo:**
        *   **Palabra:** *Ubiquitous* (omnipresente)
        *   **En lugar de:** "Ubiquitous = omnipresente"
        *   **Aprende:** "Smartphones are ubiquitous in modern society." (Los teléfonos inteligentes son omnipresentes en la sociedad moderna).

**2. Usa tarjetas de memoria (Flashcards):**

*   **Crea tus propias tarjetas:** Escribe la palabra en un lado y la definición, una frase de ejemplo y una imagen (si es posible) en el otro.
*   **Aplicaciones:** Usa aplicaciones como Anki o Quizlet para crear y repasar tarjetas digit

In [4]:
from PIL import Image
import requests
from io import BytesIO
import google.generativeai as genai

genai.configure(api_key=GEMINI_API_KEY)

image_url = "https://kinsta.com/es/wp-content/uploads/sites/8/2019/09/jpg-vs-jpeg.jpg"
response = requests.get(image_url)
img = Image.open(BytesIO(response.content))

img_byte_arr = BytesIO()
img.save(img_byte_arr, format='JPEG')
img_bytes = img_byte_arr.getvalue()

model = genai.GenerativeModel('gemini-2.0-flash')

# Send the prompt with image
response = model.generate_content(
    [
        "Describe la escena en la imagen usando palabras sencillas para que un estudiante principiante pueda entenderla.",
        {"mime_type": "image/jpeg", "data": img_bytes}
    ]
)

# Print the result
print(response.text)

Okay, I see a picture. There's a lady with brown hair. She's wearing a pink shirt. She's looking at two screens or frames. The screens are blue and have some lines and dots on them. The background is also blue with some see-through shapes. It looks like she's thinking about what's on the screens.


## 💻 Generación de Código con LLMs

### Introducción

Los **Modelos de Lenguaje de Gran Escala (LLMs)** no solo comprenden texto, también pueden **generar código** en múltiples lenguajes de programación. Gracias a su capacidad de aprender patrones sintácticos y semánticos, los LLMs son útiles para tareas como:

- Escribir funciones y scripts desde cero
- Explicar fragmentos de código
- Traducir código entre lenguajes
- Automatizar tareas repetitivas
- Resolver problemas paso a paso

Uno de los principales beneficios es la **aceleración del desarrollo**, especialmente para principiantes o para quienes buscan prototipar rápidamente. Sin embargo, es importante **verificar la validez y seguridad** del código generado.

---

### 🧪 Actividad: Traductor palabra por palabra en Python

#### Enunciado

Usa **Gemini API** para generar un script en Python que:

- Reciba como entrada una oración en inglés.
- Devuelva la traducción **palabra por palabra** al español.
- Se asuma que el modelo es un **experto en Python** y proporcione una solución funcional y clara.

In [5]:
import google.generativeai as genai
genai.configure(api_key=GEMINI_API_KEY)
model = genai.GenerativeModel('gemini-2.0-flash')
response = model.generate_content("Eres un experto en python. Escribe un código en Python que tome una oración en inglés y lo traduzca cada palabra al español")
print(response.text)

```python
from googletrans import Translator

def traducir_oracion(oracion_ingles):
    """
    Traduce una oración en inglés al español palabra por palabra.

    Args:
        oracion_ingles: La oración en inglés que se va a traducir.

    Returns:
        Una cadena con la oración traducida al español palabra por palabra,
        o None si ocurre un error.
    """
    try:
        translator = Translator()
        palabras = oracion_ingles.split()
        oracion_traducida = []

        for palabra in palabras:
            # Detecta el idioma de la palabra (aunque asumimos que es inglés, 
            # esta verificación adicional puede ser útil en caso de entradas mixtas)
            deteccion = translator.detect(palabra)
            if deteccion.lang == 'en':  # Aseguramos que la palabra sea en inglés
                traduccion = translator.translate(palabra, dest='es').text
                oracion_traducida.append(traduccion)
            else:
                # Si no es inglés, sim

### **Prompt Template**

In [6]:
prompt_template = """
Eres un experto en programación, escribiendo código limpio en python y escribes comentarios en cada línea de código.
a continuación, {pregunta}.
"""
pregunta = "Crea un diccionario"
prompt = prompt_template.format(pregunta=pregunta)
print(prompt)


Eres un experto en programación, escribiendo código limpio en python y escribes comentarios en cada línea de código.
a continuación, Crea un diccionario.



In [7]:
import google.generativeai as genai
genai.configure(api_key=GEMINI_API_KEY)
model = genai.GenerativeModel('gemini-2.0-flash')
response = model.generate_content(prompt)
print(response.text)

```python
# Definimos un diccionario llamado 'mi_diccionario'
mi_diccionario = {
    # La clave 'nombre' tiene el valor 'Juan'
    "nombre": "Juan",
    # La clave 'edad' tiene el valor 30
    "edad": 30,
    # La clave 'ciudad' tiene el valor 'Madrid'
    "ciudad": "Madrid",
    # La clave 'hobbies' tiene una lista como valor.
    "hobbies": ["leer", "correr", "viajar"]
}

# El diccionario ahora contiene información sobre una persona:
# - nombre: Juan
# - edad: 30
# - ciudad: Madrid
# - hobbies: una lista de aficiones

# Imprimimos el diccionario para verificar su contenido
print(mi_diccionario)
```



In [8]:
#Implementación de modelo que razona 'experimental gemini 2.0 flash'
import google.generativeai as genai
genai.configure(api_key=GEMINI_API_KEY)
model = genai.GenerativeModel('gemini-2.0-flash-thinking-exp')
response = model.generate_content(prompt)
print(response.text)

¡Claro! Como experto en programación Python y con foco en código limpio y comentado, aquí tienes la creación de un diccionario, con un comentario en cada línea relevante:

```python
# Creamos una variable llamada 'informacion_personal' para almacenar un diccionario.
informacion_personal = {
    # Definimos la primera clave 'nombre' con el valor 'Carlos'.
    "nombre": "Carlos",
    # Definimos la clave 'edad' con el valor entero 35.
    "edad": 35,
    # Definimos la clave 'ciudad' con el valor 'Madrid'.
    "ciudad": "Madrid",
    # Definimos la clave 'es_estudiante' con el valor booleano False.
    "es_estudiante": False
} # Cerramos la definición del diccionario.

# Opcional: Puedes imprimir el diccionario para verificar su contenido.
# print(informacion_personal) # Esta línea imprimiría el diccionario.
```

Este código crea un diccionario llamado `informacion_personal` que contiene datos sobre una persona, utilizando diferentes tipos de valores (string, integer, boolean). Cada líne

In [9]:
from IPython.display import display, Markdown
import google.generativeai as genai

#Implementación de modelo que razona 'experimental gemini 2.0 flash'
prompt_template = """
Eres un experto en programación, escribiendo código limpio en python y escribes comentarios en cada línea de código.
Explicame este código con detalle y como aplicarlo.
a continuación,
{codigo}.

El resultado deve estar en formato Markdown.
"""

codigo = """{ # Inicia la definición del diccionario con una llave de apertura {.
    "clave_texto": "valor de ejemplo", # Define el primer par clave-valor: "clave_texto" apunta a una cadena.
    "clave_numero": 123,             # Define el segundo par clave-valor: "clave_numero" apunta a un número entero.
    "clave_booleano": True,          # Define el tercer par clave-valor: "clave_booleano" apunta a un valor booleano.
    "clave_lista": [1, 2, 3]         # Define el cuarto par clave-valor: "clave_lista" apunta a una lista.
} # Cierra la definición del diccionario con una llave de cierre }.
"""

prompt = prompt_template.format(codigo=codigo)

print(prompt)
genai.configure(api_key=GEMINI_API_KEY)
model = genai.GenerativeModel('gemini-2.0-flash-thinking-exp')
response = model.generate_content(prompt)
display(Markdown(response.text))


Eres un experto en programación, escribiendo código limpio en python y escribes comentarios en cada línea de código.
Explicame este código con detalle y como aplicarlo.
a continuación,
{ # Inicia la definición del diccionario con una llave de apertura {.
    "clave_texto": "valor de ejemplo", # Define el primer par clave-valor: "clave_texto" apunta a una cadena.
    "clave_numero": 123,             # Define el segundo par clave-valor: "clave_numero" apunta a un número entero.
    "clave_booleano": True,          # Define el tercer par clave-valor: "clave_booleano" apunta a un valor booleano.
    "clave_lista": [1, 2, 3]         # Define el cuarto par clave-valor: "clave_lista" apunta a una lista.
} # Cierra la definición del diccionario con una llave de cierre }.
.

El resultado deve estar en formato Markdown.



¡Excelente! Con gusto te explicaré en detalle este fragmento de código Python, actuando como un experto que valora el código limpio y bien comentado.

---

# Explicación Detallada de un Diccionario en Python

El código que proporcionaste es un ejemplo de un **literal de diccionario** en Python. Un diccionario es una de las estructuras de datos fundamentales y más versátiles en Python. Es una colección *desordenada* (en versiones antiguas de Python, pero ordenado por inserción desde Python 3.7) de pares **clave-valor**. Cada clave debe ser única dentro de un diccionario, y las claves deben ser **inmutables** (como cadenas de texto, números, o tuplas). Los valores, sin embargo, pueden ser de *cualquier* tipo de dato de Python (cadenas, números, booleanos, listas, otros diccionarios, etc.).

Piensa en un diccionario como una libreta de direcciones o un diccionario de la vida real: buscas algo (la clave, como un nombre o una palabra) para encontrar la información asociada (el valor, como un número de teléfono o una definición).

## El Código del Diccionario

Aquí está el código exacto que proporcionaste, con tus comentarios originales que describen la sintaxis:

```python
{ # Inicia la definición del diccionario con una llave de apertura {.
    "clave_texto": "valor de ejemplo", # Define el primer par clave-valor: "clave_texto" apunta a una cadena.
    "clave_numero": 123,             # Define el segundo par clave-valor: "clave_numero" apunta a un número entero.
    "clave_booleano": True,          # Define el tercer par clave-valor: "clave_booleano" apunta a un valor booleano.
    "clave_lista": [1, 2, 3]         # Define el cuarto par clave-valor: "clave_lista" apunta a una lista.
} # Cierra la definición del diccionario con una llave de cierre }.
```

## Desglose Detallado del Código

Analicemos cada parte de este literal de diccionario:

1.  **`{` y `}`:** Las llaves (`{}`) marcan el inicio y el final de un literal de diccionario en Python. Todo lo que está dentro de ellas, separado por comas, son los elementos del diccionario.

2.  **Pares `clave: valor`:** La estructura principal de un diccionario son los pares `clave: valor`.
    *   La `clave` está a la izquierda de los dos puntos (`:`).
    *   El `valor` está a la derecha de los dos puntos (`:`).
    *   Los dos puntos (`:`) separan la clave de su valor asociado.

3.  **Separación por comas (`,`):** Cada par `clave: valor` está separado del siguiente par por una coma (`,`). La última pareja no necesita una coma después, aunque es una práctica común incluirla para facilitar la adición de nuevos elementos y la legibilidad (esto se llama "trailing comma").

4.  **Los Tipos de Datos en el Ejemplo:** El ejemplo muestra la flexibilidad de los valores en un diccionario:
    *   `"clave_texto": "valor de ejemplo"`: La clave es una cadena (`"clave_texto"`) y el valor es otra cadena (`"valor de ejemplo"`). Las cadenas son tipos de datos inmutables y son muy comunes como claves.
    *   `"clave_numero": 123`: La clave es una cadena (`"clave_numero"`) y el valor es un número entero (`123`). Los números (enteros, flotantes, etc.) también son inmutables y pueden ser claves.
    *   `"clave_booleano": True`: La clave es una cadena (`"clave_booleano"`) y el valor es un booleano (`True`). Los booleanos son inmutables.
    *   `"clave_lista": [1, 2, 3]`: La clave es una cadena (`"clave_lista"`) y el valor es una lista (`[1, 2, 3]`). Las listas son tipos de datos **mutables** en Python, y aquí actúan como valor del diccionario. Esto demuestra que los valores pueden ser *cualquier* tipo de objeto Python.

5.  **Los Comentarios (`# ...`):** Cada línea del código proporcionado incluye un comentario que describe su propósito sintáctico o el par clave-valor que define. Aunque en código de producción no siempre se comenta *cada* línea de un literal simple como este, es una práctica excelente para fines educativos o cuando la estructura es compleja, y sigue la regla de "comentar cada línea" que te pedí.

## Cómo Aplicar Este Código (Uso en Python)

Para "aplicar" o usar este diccionario en un programa Python, típicamente lo asignas a una variable. Una vez asignado, puedes realizar diversas operaciones con él, como acceder a sus valores, modificarlos, agregar nuevos pares o eliminar existentes.

Aquí tienes ejemplos de cómo usar un diccionario como este en código real:

```python
# Definimos el diccionario literal y lo asignamos a una variable llamada 'datos_ejemplo'.
datos_ejemplo = { # Creamos una variable para almacenar nuestro diccionario.
    "clave_texto": "valor de ejemplo", # La clave 'clave_texto' guarda una cadena.
    "clave_numero": 123,             # La clave 'clave_numero' guarda un entero.
    "clave_booleano": True,          # La clave 'clave_booleano' guarda un booleano.
    "clave_lista": [1, 2, 3]         # La clave 'clave_lista' guarda una lista.
} # Fin de la definición del diccionario.

# --- Acceder a los valores ---
print("Accediendo a valores:") # Imprimimos un encabezado.
valor_texto = datos_ejemplo["clave_texto"] # Obtenemos el valor asociado a "clave_texto".
print(f"Valor de 'clave_texto': {valor_texto}") # Imprimimos el valor obtenido.

valor_numero = datos_ejemplo["clave_numero"] # Obtenemos el valor asociado a "clave_numero".
print(f"Valor de 'clave_numero': {valor_numero}") # Imprimimos el valor obtenido.

primer_elemento_lista = datos_ejemplo["clave_lista"][0] # Obtenemos la lista y luego su primer elemento.
print(f"Primer elemento de 'clave_lista': {primer_elemento_lista}") # Imprimimos el elemento de la lista.

# --- Modificar valores ---
print("\nModificando valores:") # Imprimimos un encabezado para la sección de modificación.
datos_ejemplo["clave_numero"] = 456 # Cambiamos el valor de la clave 'clave_numero' a 456.
print(f"Nuevo valor de 'clave_numero': {datos_ejemplo['clave_numero']}") # Verificamos el cambio.

# --- Agregar un nuevo par clave-valor ---
print("\nAgregando un nuevo par:") # Imprimimos un encabezado para la sección de adición.
datos_ejemplo["nueva_clave"] = "este es un valor nuevo" # Añadimos una nueva clave 'nueva_clave' con su valor.
print(f"Diccionario después de agregar: {datos_ejemplo}") # Mostramos el diccionario completo para ver el cambio.

# --- Eliminar un par clave-valor ---
print("\nEliminando un par:") # Imprimimos un encabezado para la sección de eliminación.
del datos_ejemplo["clave_booleano"] # Eliminamos la clave 'clave_booleano' y su valor asociado.
print(f"Diccionario después de eliminar: {datos_ejemplo}") # Mostramos el diccionario completo después de la eliminación.

# --- Iterar sobre el diccionario ---
print("\nIterando sobre el diccionario (claves):") # Imprimimos un encabezado para la iteración.
for clave in datos_ejemplo: # Iteramos directamente sobre el diccionario, lo que recorre las claves.
    print(f"Clave: {clave}") # Imprimimos cada clave.

print("\nIterando sobre el diccionario (claves y valores):") # Imprimimos un encabezado para la iteración con items.
for clave, valor in datos_ejemplo.items(): # Usamos el método .items() para obtener pares clave-valor.
    print(f"Clave: {clave}, Valor: {valor}") # Imprimimos cada par clave-valor.
```

### Puntos Clave de Aplicación:

*   **Creación:** Simplemente escribes el literal `{...}` y lo asignas a una variable.
*   **Acceso:** Usas corchetes `[]` con la clave dentro (ej: `mi_diccionario["mi_clave"]`). Si la clave no existe, se produce un error `KeyError`. Puedes usar `.get(clave, valor_default)` para evitar este error y obtener un valor por defecto si la clave no está presente.
*   **Modificación:** Asigna un nuevo valor a una clave existente usando `mi_diccionario["mi_clave"] = nuevo_valor`.
*   **Adición:** Si usas corchetes `[]` con una clave que *no existe* y asignas un valor, Python añade automáticamente ese nuevo par clave-valor al diccionario.
*   **Eliminación:** Usas la palabra clave `del` seguida del diccionario y la clave entre corchetes (ej: `del mi_diccionario["mi_clave"]`).
*   **Iteración:** Puedes iterar directamente sobre un diccionario para obtener sus claves, o usar métodos como `.values()` para obtener los valores, o `.items()` para obtener pares (clave, valor).

## Conclusión

El literal de diccionario que mostraste es una forma directa y legible de crear diccionarios en Python con datos predefinidos. Los diccionarios son increíblemente útiles para representar datos estructurados donde cada pieza de información (valor) está asociada a un identificador único (clave). La capacidad de almacenar diferentes tipos de datos como valores y la eficiencia en el acceso mediante clave los convierten en una herramienta indispensable en la programación Python.

# 💻 3. Generación de Código y Hugging Face

## 🧾 Generación y explicación de código mediante prompts

Los **Modelos de Lenguaje de Gran Escala (LLMs)** pueden generar fragmentos de código fuente a partir de instrucciones en lenguaje natural. Esto se logra mediante **prompts** bien diseñados que indican al modelo qué tipo de código se desea obtener. Por ejemplo, se puede pedir al modelo:

- Que escriba una función específica.
- Que traduzca código de un lenguaje a otro.
- Que explique paso a paso lo que hace un bloque de código.

Esta capacidad transforma al LLM en un asistente de programación que puede ser útil tanto para principiantes como para desarrolladores avanzados.

---

## 🤗 Uso de la librería Transformers de Hugging Face

La biblioteca **Transformers** de [Hugging Face](https://huggingface.co/transformers/) permite acceder y trabajar con una gran variedad de modelos preentrenados, incluyendo aquellos diseñados para tareas de generación de código como:

- `CodeT5`
- `StarCoder`
- `GPT-2` y `GPT-Neo` con fine-tuning
- `Phi`, `CodeGen`, entre otros

Características clave de la librería:

- Compatibilidad con PyTorch y TensorFlow.
- Carga sencilla de modelos y tokenizadores.
- Interfaz de alto nivel para inferencia y entrenamiento.
- Integración con APIs como Google Generative AI, OpenAI o DeepSpeed.

---

## ⚖️ Ventajas y desafíos del uso de LLMs en programación

### ✅ Ventajas
- **Ahorro de tiempo:** Los desarrolladores pueden generar funciones, scripts y estructuras básicas en segundos.
- **Automatización:** Es posible automatizar tareas repetitivas como generación de boilerplate, validaciones o transformaciones de datos.
- **Soporte educativo:** Ideal para aprender programación, entender errores y practicar con ejemplos guiados.

### ⚠️ Desafíos
- **Alucinaciones:** El modelo puede inventar funciones o estructuras no válidas, incluso si su sintaxis parece correcta.
- **Seguridad:** Puede generar código vulnerable si no se aplican filtros o validaciones.
- **Dependencia excesiva:** Usar el modelo sin entender el código puede llevar a una pérdida de criterio técnico o errores en producción.

### 🤗 **Hugging Face**

**Hugging Face** es una plataforma y comunidad de código abierto enfocada en la **inteligencia artificial** y el **procesamiento de lenguaje natural (NLP)**. Es ampliamente reconocida por facilitar el acceso a modelos de lenguaje preentrenados y herramientas para desarrolladores, investigadores y entusiastas de la IA.

---

#### 🔧 ¿Qué ofrece Hugging Face?

- **Transformers**: biblioteca en Python para utilizar modelos de lenguaje como BERT, GPT-2, T5, entre otros. Compatible con PyTorch y TensorFlow.
- **Model Hub**: repositorio con miles de modelos preentrenados listos para usar.
- **Datasets**: colección de conjuntos de datos públicos para entrenamiento y evaluación de modelos.
- **Spaces**: plataforma para crear y compartir aplicaciones de IA usando Gradio, Streamlit o similares.
- **Tokenizers**: herramientas para convertir texto en tokens de forma eficiente, fundamentales en NLP.

---

#### 💡 Aplicaciones comunes

- Generación de texto
- Traducción automática
- Clasificación de sentimientos
- Resumen de textos
- Chatbots y asistentes virtuales
- Pregunta-respuesta (Q&A)

In [10]:
from transformers import MarianMTModel, MarianTokenizer
model_name = "Helsinki-NLP/opus-mt-en-es"
tokenizer = MarianTokenizer.from_pretrained(model_name)
model = MarianMTModel.from_pretrained(model_name)

In [11]:
texto_ingles = ["Hello, how are you?", "This is a translation test."]
tokens = tokenizer(texto_ingles, return_tensors="pt", padding=True)

In [12]:
traduccion_tokens = model.generate(**tokens)
traduccion_texto = tokenizer.batch_decode(traduccion_tokens, skip_special_tokens=True)
print(traduccion_texto)

['Hola, ¿cómo estás?', 'Esta es una prueba de traducción.']


In [13]:
for i, t in zip(texto_ingles, traduccion_texto):
  print(f"Inglés: {i} - Español: {t}")

Inglés: Hello, how are you? - Español: Hola, ¿cómo estás?
Inglés: This is a translation test. - Español: Esta es una prueba de traducción.


### 🔍 **RAG (Retrieval-Augmented Generation)**

**RAG (Generación Aumentada con Recuperación)** es una técnica que combina **modelos generativos** (como los LLMs) con un **sistema de recuperación de información**. Su objetivo es mejorar las respuestas del modelo accediendo a fuentes de conocimiento externas en tiempo real.

---

#### 🧠 ¿Cómo funciona?

1. **Consulta**: El usuario envía una pregunta o prompt.
2. **Recuperación**: El sistema busca información relevante en una base de datos o colección de documentos (por ejemplo, usando un motor tipo vectorial como FAISS o Elasticsearch).
3. **Generación**: El modelo LLM usa la información recuperada para generar una respuesta más precisa y actualizada.

---

#### 📌 Características clave

- No requiere reentrenar el modelo base.
- Permite respuestas más **contextualizadas** y **actualizadas**.
- Ideal para sistemas que usan datos privados, específicos o en constante cambio.

---

#### 🧪 Ejemplos de uso

- Asistentes de atención al cliente que consultan una base de conocimientos.
- Sistemas de recomendación basados en documentos.
- Aplicaciones empresariales que combinan IA generativa con datos internos.

---

#### ⚖️ Ventajas vs Fine-Tuning

| RAG                                  | Fine-Tuning                          |
|--------------------------------------|--------------------------------------|
| Usa documentos externos              | Modifica el modelo base              |
| No necesita entrenamiento adicional  | Requiere entrenamiento y cómputo     |
| Respuestas actualizadas y dinámicas | Respuestas más coherentes y estables |

In [14]:
documentos = {
    "IA": "La inteligencia artificial es un campo de la informática que se centra en la creación de sistemas capaces de realizar tareas que normalmente requieren inteligencia humana, como reconocer voz, imágenes, tomar decisiones o resolver problemas.",
    "RAG": "Retrieval-Augmented Generation (RAG) es una técnica de IA que combina búsqueda de información en bases de datos o documentos con modelos generativos, permitiendo respuestas más precisas y basadas en conocimiento actualizado.",
    "Machine Learning": "El aprendizaje automático es una rama de la inteligencia artificial que permite a las computadoras aprender de datos y mejorar su rendimiento sin ser programadas explícitamente para cada tarea."
}

In [15]:
def recuperar_contexto(pregunta):
  for tema, contenido in documentos.items():
    if tema.lower() in pregunta.lower():
      return contenido
    return "No se encontro información relevante en la base de conocimientos"

In [16]:
def generar_respuesta(pregunta):
  contexto = recuperar_contexto(pregunta)
  prompt = f"""Usa el siguiente contexto para responder la pregunta de manera clara y concisa \n\n Contexto: {contexto} \n\n Pregunta: {pregunta}"""
  genai.configure(api_key=GEMINI_API_KEY)
  model = genai.GenerativeModel('gemini-2.0-flash')
  response = model.generate_content(prompt)
  return response.text

In [17]:
pregunta_usuario = "Que es RAG"
respuesta = generar_respuesta(pregunta_usuario)
print(respuesta)

Dado que no se encontró información relevante en la base de conocimientos, no puedo responder a tu pregunta sobre qué es RAG basándome en ese contexto.



In [18]:
pregunta_usuario = "Que es Cartagena"
respuesta = generar_respuesta(pregunta_usuario)
print(respuesta)

No se pudo encontrar información específica sobre Cartagena en la base de conocimientos.

