## üìò Introducci√≥n a los LLMs y al Prompt Engineering

### Glosario de Conceptos

#### ¬øQu√© es un LLM y c√≥mo funciona?

Un **LLM (Large Language Model)** es un modelo de lenguaje basado en aprendizaje profundo, entrenado con grandes vol√∫menes de texto para entender y generar lenguaje humano. Est√° dise√±ado para realizar tareas como:

- Completar textos
- Traducir idiomas
- Responder preguntas
- Generar c√≥digo
- Resumir contenido

Los LLMs se basan principalmente en la **arquitectura Transformer**, donde la atenci√≥n es el mecanismo clave para procesar texto en paralelo y comprender el contexto.

**Funcionamiento general:**

1. **Input (Prompt):** El usuario proporciona una instrucci√≥n o contexto.
2. **Tokenizaci√≥n:** El texto se convierte en tokens (fragmentos de palabras).
3. **Procesamiento:** El modelo calcula relaciones entre tokens usando capas de atenci√≥n.
4. **Output:** El modelo genera una respuesta (texto, c√≥digo, etc.) como continuaci√≥n l√≥gica del prompt.

---

## üß† Fundamentos del Prompting

El **prompting** es el arte de dise√±ar entradas efectivas para obtener respuestas √∫tiles de un modelo LLM. Existen tres enfoques comunes:

### ‚úÖ Zero-shot Prompting

Consiste en hacer una solicitud directa al modelo **sin proporcionar ejemplos previos**.

```text
Prompt:
"Resume el siguiente texto en una oraci√≥n."
```

### ‚úÖ Few-shot Prompting
Se proporciona al modelo uno o m√°s ejemplos antes de realizar la solicitud. Esto le ayuda a entender el formato o la l√≥gica deseada.

```text
Prompt:
Texto: "El cielo est√° nublado y podr√≠a llover."
Resumen: "Podr√≠a llover pronto."

Texto: "Hace calor y hay mucho sol."
Resumen:
```

### ‚úÖ Chain-of-Thought (CoT) Prompting
Implica pedirle al modelo que razone paso a paso, como si pensara en voz alta. Esto permite respuestas m√°s precisas para tareas de l√≥gica, c√°lculo o an√°lisis.

```text
Pregunta:
Si Mar√≠a tiene 5 manzanas y le da 2 a Juan, ¬øcu√°ntas le quedan?

Respuesta:
Primero, Mar√≠a tiene 5 manzanas.
Luego, le da 2 a Juan.
Entonces, le quedan 3 manzanas.
```

### üî† Tokens, Embeddings y Generaci√≥n de Texto
#### üéØ Tokens

Los LLMs no procesan texto directamente, sino que lo dividen en tokens, que pueden ser palabras, s√≠labas o incluso fragmentos de palabras.

```text
Texto: "Hola mundo"
Tokens: [ "Hola", " mundo" ]
```

#### üß¨ Embeddings

Cada token se transforma en un vector num√©rico conocido como embedding, que captura informaci√≥n sem√°ntica. Los embeddings permiten al modelo entender similitudes y relaciones entre palabras.

####  ‚úçÔ∏è Generaci√≥n de Texto

La generaci√≥n de texto se realiza token por token, prediciendo la siguiente palabra m√°s probable seg√∫n el contexto anterior. El resultado final es una secuencia coherente y contextual.

In [1]:
from google import genai
from getpass import getpass
GEMINI_API_KEY = getpass('Enter API key: ')

Enter API key:  ¬∑¬∑¬∑¬∑¬∑¬∑¬∑¬∑


In [2]:
import google.generativeai as genai

# Configura tu API key (aseg√∫rate de definir GEMINI_API_KEY correctamente antes)
genai.configure(api_key=GEMINI_API_KEY)

# Usa el modelo correcto
model = genai.GenerativeModel('gemini-2.0-flash')

# Llama a generate_content correctamente
response = model.generate_content("Act√∫a como profe de ingl√©s y explica el pasado imperfecto con ejemplos.")

# Imprime el resultado
print(response.text)

Alright students, settle down, settle down! Today, we're diving into a tense that can be a little tricky but oh-so-useful: the **Past Imperfect**!

Think of the Past Imperfect as painting a scene from the past, focusing not on completed actions, but on the **ongoing actions, descriptions, and states of being.** It's like a snapshot of a moment in time that's been stretched out.

**What is the Past Imperfect?**

The Past Imperfect is used to describe:

*   **Habitual actions in the past:** Things you used to do regularly.
*   **Ongoing actions in the past:** Actions that were in progress at a specific time.
*   **Descriptions of people, places, and things in the past:** Details about appearance, feelings, or surroundings.
*   **Background information in a narrative:** Setting the scene for a story.
*   **Simultaneous actions in the past:** Two or more things happening at the same time.

**How to Form the Past Imperfect (Irregular Verbs)**

While the rules to form the past imperfect vari

## üß© Modelos LLM Multimodales

#### ¬øQu√© son?

Los **LLMs multimodales** son modelos de lenguaje capaces de procesar y generar contenido no solo en texto, sino tambi√©n a partir de otras modalidades como **im√°genes**, **audio** y **video**. Esto permite una interacci√≥n m√°s natural y enriquecida con la inteligencia artificial.

---

#### üß™ Ejemplos de uso con Gemini

- üñºÔ∏è **Descripci√≥n de im√°genes**: interpretar el contenido visual y generar descripciones en lenguaje natural.
- üîä **Transcripci√≥n de audio**: convertir voz a texto de manera autom√°tica.
- üòä **An√°lisis de sentimiento**: detectar emociones y tono a partir de texto o voz.

---

#### ‚öôÔ∏è Par√°metros importantes

Al usar LLMs multimodales, se pueden ajustar varios **par√°metros de configuraci√≥n** para optimizar resultados:

- `temperature`: controla la creatividad de las respuestas (valores bajos generan respuestas m√°s precisas).
- `model`: selecci√≥n del modelo adecuado (ej. `gemini-2.0-pro`, `gemini-2.0-flash`, etc.).
- `max_output_tokens`: define la longitud m√°xima de la respuesta generada.

---

#### üí° Ventajas clave

- Interacci√≥n m√°s rica y contextual.
- Permite soluciones inclusivas y accesibles.
- Aplicaciones en educaci√≥n, salud, dise√±o, etc.

---

#### üîó Recurso √∫til

- [Gemini Multimodal API](https://aistudio.google.com/)

In [3]:
import google.generativeai as genai
genai.configure(api_key=GEMINI_API_KEY)

model = genai.GenerativeModel('gemini-2.0-flash')

response = model.generate_content(
    "Act√∫a como profe de ingl√©s, y dame ejemplos para mejorar vocabulario.",
    generation_config={
        "temperature": 0.1,
        "max_output_tokens": 500
    }
)

print(response.text)

¬°Hola! ¬°Qu√© bueno que quieres expandir tu vocabulario en ingl√©s! Es una de las mejores maneras de mejorar tu fluidez y comprensi√≥n. Aqu√≠ te presento algunas estrategias y ejemplos para que empieces a trabajar en ello:

**1. Aprende palabras en contexto:**

*   **En lugar de:** Memorizar listas de palabras aisladas.
*   **Intenta:** Aprender palabras dentro de frases y oraciones. Esto te ayudar√° a entender c√≥mo se usan en la vida real.

    *   **Ejemplo:**
        *   **Palabra:** *Ubiquitous* (omnipresente)
        *   **En lugar de:** "Ubiquitous = omnipresente"
        *   **Aprende:** "Smartphones are ubiquitous in modern society." (Los tel√©fonos inteligentes son omnipresentes en la sociedad moderna).

**2. Usa tarjetas de memoria (Flashcards):**

*   **Crea tus propias tarjetas:** Escribe la palabra en un lado y la definici√≥n, una frase de ejemplo y una imagen (si es posible) en el otro.
*   **Aplicaciones:** Usa aplicaciones como Anki o Quizlet para crear y repasar tarj

In [4]:
from PIL import Image
import requests
from io import BytesIO
import google.generativeai as genai

genai.configure(api_key=GEMINI_API_KEY)

image_url = "https://kinsta.com/es/wp-content/uploads/sites/8/2019/09/jpg-vs-jpeg.jpg"
response = requests.get(image_url)
img = Image.open(BytesIO(response.content))

img_byte_arr = BytesIO()
img.save(img_byte_arr, format='JPEG')
img_bytes = img_byte_arr.getvalue()

model = genai.GenerativeModel('gemini-2.0-flash')

# Send the prompt with image
response = model.generate_content(
    [
        "Describe la escena en la imagen usando palabras sencillas para que un estudiante principiante pueda entenderla.",
        {"mime_type": "image/jpeg", "data": img_bytes}
    ]
)

# Print the result
print(response.text)

Okay, I see a picture. There's a lady with brown hair. She's wearing a pink shirt. She's looking at two screens or frames. The screens are blue and have some lines and dots on them. The background is also blue with some see-through shapes. It looks like she's thinking about what's on the screens.


## üíª Generaci√≥n de C√≥digo con LLMs

### Introducci√≥n

Los **Modelos de Lenguaje de Gran Escala (LLMs)** no solo comprenden texto, tambi√©n pueden **generar c√≥digo** en m√∫ltiples lenguajes de programaci√≥n. Gracias a su capacidad de aprender patrones sint√°cticos y sem√°nticos, los LLMs son √∫tiles para tareas como:

- Escribir funciones y scripts desde cero
- Explicar fragmentos de c√≥digo
- Traducir c√≥digo entre lenguajes
- Automatizar tareas repetitivas
- Resolver problemas paso a paso

Uno de los principales beneficios es la **aceleraci√≥n del desarrollo**, especialmente para principiantes o para quienes buscan prototipar r√°pidamente. Sin embargo, es importante **verificar la validez y seguridad** del c√≥digo generado.

---

### üß™ Actividad: Traductor palabra por palabra en Python

#### Enunciado

Usa **Gemini API** para generar un script en Python que:

- Reciba como entrada una oraci√≥n en ingl√©s.
- Devuelva la traducci√≥n **palabra por palabra** al espa√±ol.
- Se asuma que el modelo es un **experto en Python** y proporcione una soluci√≥n funcional y clara.

In [5]:
import google.generativeai as genai
genai.configure(api_key=GEMINI_API_KEY)
model = genai.GenerativeModel('gemini-2.0-flash')
response = model.generate_content("Eres un experto en python. Escribe un c√≥digo en Python que tome una oraci√≥n en ingl√©s y lo traduzca cada palabra al espa√±ol")
print(response.text)

```python
from googletrans import Translator

def traducir_oracion(oracion_ingles):
    """
    Traduce una oraci√≥n en ingl√©s al espa√±ol palabra por palabra.

    Args:
        oracion_ingles: La oraci√≥n en ingl√©s que se va a traducir.

    Returns:
        Una cadena con la oraci√≥n traducida al espa√±ol palabra por palabra,
        o None si ocurre un error.
    """
    try:
        translator = Translator()
        palabras = oracion_ingles.split()
        oracion_traducida = []

        for palabra in palabras:
            # Detecta el idioma de la palabra (aunque asumimos que es ingl√©s, 
            # esta verificaci√≥n adicional puede ser √∫til en caso de entradas mixtas)
            deteccion = translator.detect(palabra)
            if deteccion.lang == 'en':  # Aseguramos que la palabra sea en ingl√©s
                traduccion = translator.translate(palabra, dest='es').text
                oracion_traducida.append(traduccion)
            else:
                # Si no es 

### **Prompt Template**

In [6]:
prompt_template = """
Eres un experto en programaci√≥n, escribiendo c√≥digo limpio en python y escribes comentarios en cada l√≠nea de c√≥digo.
a continuaci√≥n, {pregunta}.
"""
pregunta = "Crea un diccionario"
prompt = prompt_template.format(pregunta=pregunta)
print(prompt)


Eres un experto en programaci√≥n, escribiendo c√≥digo limpio en python y escribes comentarios en cada l√≠nea de c√≥digo.
a continuaci√≥n, Crea un diccionario.



In [7]:
import google.generativeai as genai
genai.configure(api_key=GEMINI_API_KEY)
model = genai.GenerativeModel('gemini-2.0-flash')
response = model.generate_content(prompt)
print(response.text)

```python
# Definimos un diccionario llamado 'mi_diccionario'
mi_diccionario = {
    # La clave 'nombre' tiene el valor 'Juan'
    "nombre": "Juan",
    # La clave 'edad' tiene el valor 30
    "edad": 30,
    # La clave 'ciudad' tiene el valor 'Madrid'
    "ciudad": "Madrid",
    # La clave 'hobbies' tiene una lista como valor.
    "hobbies": ["leer", "correr", "viajar"]
}

# El diccionario ahora contiene informaci√≥n sobre una persona:
# - nombre: Juan
# - edad: 30
# - ciudad: Madrid
# - hobbies: una lista de aficiones

# Imprimimos el diccionario para verificar su contenido
print(mi_diccionario)
```



In [8]:
#Implementaci√≥n de modelo que razona 'experimental gemini 2.0 flash'
import google.generativeai as genai
genai.configure(api_key=GEMINI_API_KEY)
model = genai.GenerativeModel('gemini-2.0-flash-thinking-exp')
response = model.generate_content(prompt)
print(response.text)

¬°Claro! Como experto en programaci√≥n Python y con foco en c√≥digo limpio y comentado, aqu√≠ tienes la creaci√≥n de un diccionario, con un comentario en cada l√≠nea relevante:

```python
# Creamos una variable llamada 'informacion_personal' para almacenar un diccionario.
informacion_personal = {
    # Definimos la primera clave 'nombre' con el valor 'Carlos'.
    "nombre": "Carlos",
    # Definimos la clave 'edad' con el valor entero 35.
    "edad": 35,
    # Definimos la clave 'ciudad' con el valor 'Madrid'.
    "ciudad": "Madrid",
    # Definimos la clave 'es_estudiante' con el valor booleano False.
    "es_estudiante": False
} # Cerramos la definici√≥n del diccionario.

# Opcional: Puedes imprimir el diccionario para verificar su contenido.
# print(informacion_personal) # Esta l√≠nea imprimir√≠a el diccionario.
```

Este c√≥digo crea un diccionario llamado `informacion_personal` que contiene datos sobre una persona, utilizando diferentes tipos de valores (string, integer, boolean).

In [9]:
from IPython.display import display, Markdown
import google.generativeai as genai

#Implementaci√≥n de modelo que razona 'experimental gemini 2.0 flash'
prompt_template = """
Eres un experto en programaci√≥n, escribiendo c√≥digo limpio en python y escribes comentarios en cada l√≠nea de c√≥digo.
Explicame este c√≥digo con detalle y como aplicarlo.
a continuaci√≥n,
{codigo}.

El resultado deve estar en formato Markdown.
"""

codigo = """{ # Inicia la definici√≥n del diccionario con una llave de apertura {.
    "clave_texto": "valor de ejemplo", # Define el primer par clave-valor: "clave_texto" apunta a una cadena.
    "clave_numero": 123,             # Define el segundo par clave-valor: "clave_numero" apunta a un n√∫mero entero.
    "clave_booleano": True,          # Define el tercer par clave-valor: "clave_booleano" apunta a un valor booleano.
    "clave_lista": [1, 2, 3]         # Define el cuarto par clave-valor: "clave_lista" apunta a una lista.
} # Cierra la definici√≥n del diccionario con una llave de cierre }.
"""

prompt = prompt_template.format(codigo=codigo)

print(prompt)
genai.configure(api_key=GEMINI_API_KEY)
model = genai.GenerativeModel('gemini-2.0-flash-thinking-exp')
response = model.generate_content(prompt)
display(Markdown(response.text))


Eres un experto en programaci√≥n, escribiendo c√≥digo limpio en python y escribes comentarios en cada l√≠nea de c√≥digo.
Explicame este c√≥digo con detalle y como aplicarlo.
a continuaci√≥n,
{ # Inicia la definici√≥n del diccionario con una llave de apertura {.
    "clave_texto": "valor de ejemplo", # Define el primer par clave-valor: "clave_texto" apunta a una cadena.
    "clave_numero": 123,             # Define el segundo par clave-valor: "clave_numero" apunta a un n√∫mero entero.
    "clave_booleano": True,          # Define el tercer par clave-valor: "clave_booleano" apunta a un valor booleano.
    "clave_lista": [1, 2, 3]         # Define el cuarto par clave-valor: "clave_lista" apunta a una lista.
} # Cierra la definici√≥n del diccionario con una llave de cierre }.
.

El resultado deve estar en formato Markdown.



¬°Excelente! Con gusto te explicar√© en detalle este fragmento de c√≥digo Python, actuando como un experto que valora el c√≥digo limpio y bien comentado.

---

# Explicaci√≥n Detallada de un Diccionario en Python

El c√≥digo que proporcionaste es un ejemplo de un **literal de diccionario** en Python. Un diccionario es una de las estructuras de datos fundamentales y m√°s vers√°tiles en Python. Es una colecci√≥n *desordenada* (en versiones antiguas de Python, pero ordenado por inserci√≥n desde Python 3.7) de pares **clave-valor**. Cada clave debe ser √∫nica dentro de un diccionario, y las claves deben ser **inmutables** (como cadenas de texto, n√∫meros, o tuplas). Los valores, sin embargo, pueden ser de *cualquier* tipo de dato de Python (cadenas, n√∫meros, booleanos, listas, otros diccionarios, etc.).

Piensa en un diccionario como una libreta de direcciones o un diccionario de la vida real: buscas algo (la clave, como un nombre o una palabra) para encontrar la informaci√≥n asociada (el valor, como un n√∫mero de tel√©fono o una definici√≥n).

## El C√≥digo del Diccionario

Aqu√≠ est√° el c√≥digo exacto que proporcionaste, con tus comentarios originales que describen la sintaxis:

```python
{ # Inicia la definici√≥n del diccionario con una llave de apertura {.
    "clave_texto": "valor de ejemplo", # Define el primer par clave-valor: "clave_texto" apunta a una cadena.
    "clave_numero": 123,             # Define el segundo par clave-valor: "clave_numero" apunta a un n√∫mero entero.
    "clave_booleano": True,          # Define el tercer par clave-valor: "clave_booleano" apunta a un valor booleano.
    "clave_lista": [1, 2, 3]         # Define el cuarto par clave-valor: "clave_lista" apunta a una lista.
} # Cierra la definici√≥n del diccionario con una llave de cierre }.
```

## Desglose Detallado del C√≥digo

Analicemos cada parte de este literal de diccionario:

1.  **`{` y `}`:** Las llaves (`{}`) marcan el inicio y el final de un literal de diccionario en Python. Todo lo que est√° dentro de ellas, separado por comas, son los elementos del diccionario.

2.  **Pares `clave: valor`:** La estructura principal de un diccionario son los pares `clave: valor`.
    *   La `clave` est√° a la izquierda de los dos puntos (`:`).
    *   El `valor` est√° a la derecha de los dos puntos (`:`).
    *   Los dos puntos (`:`) separan la clave de su valor asociado.

3.  **Separaci√≥n por comas (`,`):** Cada par `clave: valor` est√° separado del siguiente par por una coma (`,`). La √∫ltima pareja no necesita una coma despu√©s, aunque es una pr√°ctica com√∫n incluirla para facilitar la adici√≥n de nuevos elementos y la legibilidad (esto se llama "trailing comma").

4.  **Los Tipos de Datos en el Ejemplo:** El ejemplo muestra la flexibilidad de los valores en un diccionario:
    *   `"clave_texto": "valor de ejemplo"`: La clave es una cadena (`"clave_texto"`) y el valor es otra cadena (`"valor de ejemplo"`). Las cadenas son tipos de datos inmutables y son muy comunes como claves.
    *   `"clave_numero": 123`: La clave es una cadena (`"clave_numero"`) y el valor es un n√∫mero entero (`123`). Los n√∫meros (enteros, flotantes, etc.) tambi√©n son inmutables y pueden ser claves.
    *   `"clave_booleano": True`: La clave es una cadena (`"clave_booleano"`) y el valor es un booleano (`True`). Los booleanos son inmutables.
    *   `"clave_lista": [1, 2, 3]`: La clave es una cadena (`"clave_lista"`) y el valor es una lista (`[1, 2, 3]`). Las listas son tipos de datos **mutables** en Python, y aqu√≠ act√∫an como valor del diccionario. Esto demuestra que los valores pueden ser *cualquier* tipo de objeto Python.

5.  **Los Comentarios (`# ...`):** Cada l√≠nea del c√≥digo proporcionado incluye un comentario que describe su prop√≥sito sint√°ctico o el par clave-valor que define. Aunque en c√≥digo de producci√≥n no siempre se comenta *cada* l√≠nea de un literal simple como este, es una pr√°ctica excelente para fines educativos o cuando la estructura es compleja, y sigue la regla de "comentar cada l√≠nea" que te ped√≠.

## C√≥mo Aplicar Este C√≥digo (Uso en Python)

Para "aplicar" o usar este diccionario en un programa Python, t√≠picamente lo asignas a una variable. Una vez asignado, puedes realizar diversas operaciones con √©l, como acceder a sus valores, modificarlos, agregar nuevos pares o eliminar existentes.

Aqu√≠ tienes ejemplos de c√≥mo usar un diccionario como este en c√≥digo real:

```python
# Definimos el diccionario literal y lo asignamos a una variable llamada 'datos_ejemplo'.
datos_ejemplo = { # Creamos una variable para almacenar nuestro diccionario.
    "clave_texto": "valor de ejemplo", # La clave 'clave_texto' guarda una cadena.
    "clave_numero": 123,             # La clave 'clave_numero' guarda un entero.
    "clave_booleano": True,          # La clave 'clave_booleano' guarda un booleano.
    "clave_lista": [1, 2, 3]         # La clave 'clave_lista' guarda una lista.
} # Fin de la definici√≥n del diccionario.

# --- Acceder a los valores ---
print("Accediendo a valores:") # Imprimimos un encabezado.
valor_texto = datos_ejemplo["clave_texto"] # Obtenemos el valor asociado a "clave_texto".
print(f"Valor de 'clave_texto': {valor_texto}") # Imprimimos el valor obtenido.

valor_numero = datos_ejemplo["clave_numero"] # Obtenemos el valor asociado a "clave_numero".
print(f"Valor de 'clave_numero': {valor_numero}") # Imprimimos el valor obtenido.

primer_elemento_lista = datos_ejemplo["clave_lista"][0] # Obtenemos la lista y luego su primer elemento.
print(f"Primer elemento de 'clave_lista': {primer_elemento_lista}") # Imprimimos el elemento de la lista.

# --- Modificar valores ---
print("\nModificando valores:") # Imprimimos un encabezado para la secci√≥n de modificaci√≥n.
datos_ejemplo["clave_numero"] = 456 # Cambiamos el valor de la clave 'clave_numero' a 456.
print(f"Nuevo valor de 'clave_numero': {datos_ejemplo['clave_numero']}") # Verificamos el cambio.

# --- Agregar un nuevo par clave-valor ---
print("\nAgregando un nuevo par:") # Imprimimos un encabezado para la secci√≥n de adici√≥n.
datos_ejemplo["nueva_clave"] = "este es un valor nuevo" # A√±adimos una nueva clave 'nueva_clave' con su valor.
print(f"Diccionario despu√©s de agregar: {datos_ejemplo}") # Mostramos el diccionario completo para ver el cambio.

# --- Eliminar un par clave-valor ---
print("\nEliminando un par:") # Imprimimos un encabezado para la secci√≥n de eliminaci√≥n.
del datos_ejemplo["clave_booleano"] # Eliminamos la clave 'clave_booleano' y su valor asociado.
print(f"Diccionario despu√©s de eliminar: {datos_ejemplo}") # Mostramos el diccionario completo despu√©s de la eliminaci√≥n.

# --- Iterar sobre el diccionario ---
print("\nIterando sobre el diccionario (claves):") # Imprimimos un encabezado para la iteraci√≥n.
for clave in datos_ejemplo: # Iteramos directamente sobre el diccionario, lo que recorre las claves.
    print(f"Clave: {clave}") # Imprimimos cada clave.

print("\nIterando sobre el diccionario (claves y valores):") # Imprimimos un encabezado para la iteraci√≥n con items.
for clave, valor in datos_ejemplo.items(): # Usamos el m√©todo .items() para obtener pares clave-valor.
    print(f"Clave: {clave}, Valor: {valor}") # Imprimimos cada par clave-valor.
```

### Puntos Clave de Aplicaci√≥n:

*   **Creaci√≥n:** Simplemente escribes el literal `{...}` y lo asignas a una variable.
*   **Acceso:** Usas corchetes `[]` con la clave dentro (ej: `mi_diccionario["mi_clave"]`). Si la clave no existe, se produce un error `KeyError`. Puedes usar `.get(clave, valor_default)` para evitar este error y obtener un valor por defecto si la clave no est√° presente.
*   **Modificaci√≥n:** Asigna un nuevo valor a una clave existente usando `mi_diccionario["mi_clave"] = nuevo_valor`.
*   **Adici√≥n:** Si usas corchetes `[]` con una clave que *no existe* y asignas un valor, Python a√±ade autom√°ticamente ese nuevo par clave-valor al diccionario.
*   **Eliminaci√≥n:** Usas la palabra clave `del` seguida del diccionario y la clave entre corchetes (ej: `del mi_diccionario["mi_clave"]`).
*   **Iteraci√≥n:** Puedes iterar directamente sobre un diccionario para obtener sus claves, o usar m√©todos como `.values()` para obtener los valores, o `.items()` para obtener pares (clave, valor).

## Conclusi√≥n

El literal de diccionario que mostraste es una forma directa y legible de crear diccionarios en Python con datos predefinidos. Los diccionarios son incre√≠blemente √∫tiles para representar datos estructurados donde cada pieza de informaci√≥n (valor) est√° asociada a un identificador √∫nico (clave). La capacidad de almacenar diferentes tipos de datos como valores y la eficiencia en el acceso mediante clave los convierten en una herramienta indispensable en la programaci√≥n Python.

# üíª 3. Generaci√≥n de C√≥digo y Hugging Face

## üßæ Generaci√≥n y explicaci√≥n de c√≥digo mediante prompts

Los **Modelos de Lenguaje de Gran Escala (LLMs)** pueden generar fragmentos de c√≥digo fuente a partir de instrucciones en lenguaje natural. Esto se logra mediante **prompts** bien dise√±ados que indican al modelo qu√© tipo de c√≥digo se desea obtener. Por ejemplo, se puede pedir al modelo:

- Que escriba una funci√≥n espec√≠fica.
- Que traduzca c√≥digo de un lenguaje a otro.
- Que explique paso a paso lo que hace un bloque de c√≥digo.

Esta capacidad transforma al LLM en un asistente de programaci√≥n que puede ser √∫til tanto para principiantes como para desarrolladores avanzados.

---

## ü§ó Uso de la librer√≠a Transformers de Hugging Face

La biblioteca **Transformers** de [Hugging Face](https://huggingface.co/transformers/) permite acceder y trabajar con una gran variedad de modelos preentrenados, incluyendo aquellos dise√±ados para tareas de generaci√≥n de c√≥digo como:

- `CodeT5`
- `StarCoder`
- `GPT-2` y `GPT-Neo` con fine-tuning
- `Phi`, `CodeGen`, entre otros

Caracter√≠sticas clave de la librer√≠a:

- Compatibilidad con PyTorch y TensorFlow.
- Carga sencilla de modelos y tokenizadores.
- Interfaz de alto nivel para inferencia y entrenamiento.
- Integraci√≥n con APIs como Google Generative AI, OpenAI o DeepSpeed.

---

## ‚öñÔ∏è Ventajas y desaf√≠os del uso de LLMs en programaci√≥n

### ‚úÖ Ventajas
- **Ahorro de tiempo:** Los desarrolladores pueden generar funciones, scripts y estructuras b√°sicas en segundos.
- **Automatizaci√≥n:** Es posible automatizar tareas repetitivas como generaci√≥n de boilerplate, validaciones o transformaciones de datos.
- **Soporte educativo:** Ideal para aprender programaci√≥n, entender errores y practicar con ejemplos guiados.

### ‚ö†Ô∏è Desaf√≠os
- **Alucinaciones:** El modelo puede inventar funciones o estructuras no v√°lidas, incluso si su sintaxis parece correcta.
- **Seguridad:** Puede generar c√≥digo vulnerable si no se aplican filtros o validaciones.
- **Dependencia excesiva:** Usar el modelo sin entender el c√≥digo puede llevar a una p√©rdida de criterio t√©cnico o errores en producci√≥n.

### ü§ó **Hugging Face**

**Hugging Face** es una plataforma y comunidad de c√≥digo abierto enfocada en la **inteligencia artificial** y el **procesamiento de lenguaje natural (NLP)**. Es ampliamente reconocida por facilitar el acceso a modelos de lenguaje preentrenados y herramientas para desarrolladores, investigadores y entusiastas de la IA.

---

#### üîß ¬øQu√© ofrece Hugging Face?

- **Transformers**: biblioteca en Python para utilizar modelos de lenguaje como BERT, GPT-2, T5, entre otros. Compatible con PyTorch y TensorFlow.
- **Model Hub**: repositorio con miles de modelos preentrenados listos para usar.
- **Datasets**: colecci√≥n de conjuntos de datos p√∫blicos para entrenamiento y evaluaci√≥n de modelos.
- **Spaces**: plataforma para crear y compartir aplicaciones de IA usando Gradio, Streamlit o similares.
- **Tokenizers**: herramientas para convertir texto en tokens de forma eficiente, fundamentales en NLP.

---

#### üí° Aplicaciones comunes

- Generaci√≥n de texto
- Traducci√≥n autom√°tica
- Clasificaci√≥n de sentimientos
- Resumen de textos
- Chatbots y asistentes virtuales
- Pregunta-respuesta (Q&A)

In [10]:
from transformers import MarianMTModel, MarianTokenizer
model_name = "Helsinki-NLP/opus-mt-en-es"
tokenizer = MarianTokenizer.from_pretrained(model_name)
model = MarianMTModel.from_pretrained(model_name)

In [11]:
texto_ingles = ["Hello, how are you?", "This is a translation test."]
tokens = tokenizer(texto_ingles, return_tensors="pt", padding=True)

In [12]:
traduccion_tokens = model.generate(**tokens)
traduccion_texto = tokenizer.batch_decode(traduccion_tokens, skip_special_tokens=True)
print(traduccion_texto)

['Hola, ¬øc√≥mo est√°s?', 'Esta es una prueba de traducci√≥n.']


In [13]:
for i, t in zip(texto_ingles, traduccion_texto):
  print(f"Ingl√©s: {i} - Espa√±ol: {t}")

Ingl√©s: Hello, how are you? - Espa√±ol: Hola, ¬øc√≥mo est√°s?
Ingl√©s: This is a translation test. - Espa√±ol: Esta es una prueba de traducci√≥n.


### üîç **RAG (Retrieval-Augmented Generation)**

**RAG (Generaci√≥n Aumentada con Recuperaci√≥n)** es una t√©cnica que combina **modelos generativos** (como los LLMs) con un **sistema de recuperaci√≥n de informaci√≥n**. Su objetivo es mejorar las respuestas del modelo accediendo a fuentes de conocimiento externas en tiempo real.

---

#### üß† ¬øC√≥mo funciona?

1. **Consulta**: El usuario env√≠a una pregunta o prompt.
2. **Recuperaci√≥n**: El sistema busca informaci√≥n relevante en una base de datos o colecci√≥n de documentos (por ejemplo, usando un motor tipo vectorial como FAISS o Elasticsearch).
3. **Generaci√≥n**: El modelo LLM usa la informaci√≥n recuperada para generar una respuesta m√°s precisa y actualizada.

---

#### üìå Caracter√≠sticas clave

- No requiere reentrenar el modelo base.
- Permite respuestas m√°s **contextualizadas** y **actualizadas**.
- Ideal para sistemas que usan datos privados, espec√≠ficos o en constante cambio.

---

#### üß™ Ejemplos de uso

- Asistentes de atenci√≥n al cliente que consultan una base de conocimientos.
- Sistemas de recomendaci√≥n basados en documentos.
- Aplicaciones empresariales que combinan IA generativa con datos internos.

---

#### ‚öñÔ∏è Ventajas vs Fine-Tuning

| RAG                                  | Fine-Tuning                          |
|--------------------------------------|--------------------------------------|
| Usa documentos externos              | Modifica el modelo base              |
| No necesita entrenamiento adicional  | Requiere entrenamiento y c√≥mputo     |
| Respuestas actualizadas y din√°micas | Respuestas m√°s coherentes y estables |

In [14]:
documentos = {
    "IA": "La inteligencia artificial es un campo de la inform√°tica que se centra en la creaci√≥n de sistemas capaces de realizar tareas que normalmente requieren inteligencia humana, como reconocer voz, im√°genes, tomar decisiones o resolver problemas.",
    "RAG": "Retrieval-Augmented Generation (RAG) es una t√©cnica de IA que combina b√∫squeda de informaci√≥n en bases de datos o documentos con modelos generativos, permitiendo respuestas m√°s precisas y basadas en conocimiento actualizado.",
    "Machine Learning": "El aprendizaje autom√°tico es una rama de la inteligencia artificial que permite a las computadoras aprender de datos y mejorar su rendimiento sin ser programadas expl√≠citamente para cada tarea."
}

In [15]:
def recuperar_contexto(pregunta):
  for tema, contenido in documentos.items():
    if tema.lower() in pregunta.lower():
      return contenido
    return "No se encontro informaci√≥n relevante en la base de conocimientos"

In [16]:
def generar_respuesta(pregunta):
  contexto = recuperar_contexto(pregunta)
  prompt = f"""Usa el siguiente contexto para responder la pregunta de manera clara y concisa \n\n Contexto: {contexto} \n\n Pregunta: {pregunta}"""
  genai.configure(api_key=GEMINI_API_KEY)
  model = genai.GenerativeModel('gemini-2.0-flash')
  response = model.generate_content(prompt)
  return response.text

In [17]:
pregunta_usuario = "Que es RAG"
respuesta = generar_respuesta(pregunta_usuario)
print(respuesta)

Dado que no se encontr√≥ informaci√≥n relevante en la base de conocimientos, no puedo responder a tu pregunta sobre qu√© es RAG bas√°ndome en ese contexto.



In [18]:
pregunta_usuario = "Que es Cartagena"
respuesta = generar_respuesta(pregunta_usuario)
print(respuesta)

No se pudo encontrar informaci√≥n espec√≠fica sobre Cartagena en la base de conocimientos.

