## 📘 Introducción a los LLMs y al Prompt Engineering

### Glosario de Conceptos

#### ¿Qué es un LLM y cómo funciona?

Un **LLM (Large Language Model)** es un modelo de lenguaje basado en aprendizaje profundo, entrenado con grandes volúmenes de texto para entender y generar lenguaje humano. Está diseñado para realizar tareas como:

- Completar textos
- Traducir idiomas
- Responder preguntas
- Generar código
- Resumir contenido

Los LLMs se basan principalmente en la **arquitectura Transformer**, donde la atención es el mecanismo clave para procesar texto en paralelo y comprender el contexto.

**Funcionamiento general:**

1. **Input (Prompt):** El usuario proporciona una instrucción o contexto.
2. **Tokenización:** El texto se convierte en tokens (fragmentos de palabras).
3. **Procesamiento:** El modelo calcula relaciones entre tokens usando capas de atención.
4. **Output:** El modelo genera una respuesta (texto, código, etc.) como continuación lógica del prompt.

---

## 🧠 Fundamentos del Prompting

El **prompting** es el arte de diseñar entradas efectivas para obtener respuestas útiles de un modelo LLM. Existen tres enfoques comunes:

### ✅ Zero-shot Prompting

Consiste en hacer una solicitud directa al modelo **sin proporcionar ejemplos previos**.

```text
Prompt:
"Resume el siguiente texto en una oración."
```

### ✅ Few-shot Prompting
Se proporciona al modelo uno o más ejemplos antes de realizar la solicitud. Esto le ayuda a entender el formato o la lógica deseada.

```text
Prompt:
Texto: "El cielo está nublado y podría llover."
Resumen: "Podría llover pronto."

Texto: "Hace calor y hay mucho sol."
Resumen:
```

### ✅ Chain-of-Thought (CoT) Prompting
Implica pedirle al modelo que razone paso a paso, como si pensara en voz alta. Esto permite respuestas más precisas para tareas de lógica, cálculo o análisis.

```text
Pregunta:
Si María tiene 5 manzanas y le da 2 a Juan, ¿cuántas le quedan?

Respuesta:
Primero, María tiene 5 manzanas.
Luego, le da 2 a Juan.
Entonces, le quedan 3 manzanas.
```

### 🔠 Tokens, Embeddings y Generación de Texto
#### 🎯 Tokens

Los LLMs no procesan texto directamente, sino que lo dividen en tokens, que pueden ser palabras, sílabas o incluso fragmentos de palabras.

```text
Texto: "Hola mundo"
Tokens: [ "Hola", " mundo" ]
```

#### 🧬 Embeddings

Cada token se transforma en un vector numérico conocido como embedding, que captura información semántica. Los embeddings permiten al modelo entender similitudes y relaciones entre palabras.

####  ✍️ Generación de Texto

La generación de texto se realiza token por token, prediciendo la siguiente palabra más probable según el contexto anterior. El resultado final es una secuencia coherente y contextual.

In [1]:
from google import genai
from getpass import getpass
GEMINI_API_KEY = getpass('Enter API key: ')

Enter API key:  ········


In [2]:
import google.generativeai as genai

# Configura tu API key (asegúrate de definir GEMINI_API_KEY correctamente antes)
genai.configure(api_key=GEMINI_API_KEY)

# Usa el modelo correcto
model = genai.GenerativeModel('gemini-2.0-flash')

# Llama a generate_content correctamente
response = model.generate_content("Actúa como profe de inglés y explica el pasado imperfecto con ejemplos.")

# Imprime el resultado
print(response.text)

Alright students, settle down, settle down! Let's talk about a very important tense in English, the **Past Continuous**, also known as the **Past Progressive** or **Past Imperfect**.

Think of it as setting the scene in the past. It describes **actions that were in progress at a specific time in the past, or that continued for a period of time in the past.** It's about painting a picture of *what was happening*.

**How do we form it?**

The structure is simple:

**Subject + was/were + verb-ing (present participle)**

*   **I/He/She/It + was + verb-ing**
*   **You/We/They + were + verb-ing**

For example:

*   I **was eating** dinner.
*   They **were playing** football.
*   She **was studying** for her exam.

**When do we use the Past Continuous?**  Let's break it down into key situations:

**1. Actions in progress at a specific time in the past:**

We use the Past Continuous to say what someone was doing at a particular moment. This time can be specified by:

*   **A specific time:**  

## 🧩 Modelos LLM Multimodales

#### ¿Qué son?

Los **LLMs multimodales** son modelos de lenguaje capaces de procesar y generar contenido no solo en texto, sino también a partir de otras modalidades como **imágenes**, **audio** y **video**. Esto permite una interacción más natural y enriquecida con la inteligencia artificial.

---

#### 🧪 Ejemplos de uso con Gemini

- 🖼️ **Descripción de imágenes**: interpretar el contenido visual y generar descripciones en lenguaje natural.
- 🔊 **Transcripción de audio**: convertir voz a texto de manera automática.
- 😊 **Análisis de sentimiento**: detectar emociones y tono a partir de texto o voz.

---

#### ⚙️ Parámetros importantes

Al usar LLMs multimodales, se pueden ajustar varios **parámetros de configuración** para optimizar resultados:

- `temperature`: controla la creatividad de las respuestas (valores bajos generan respuestas más precisas).
- `model`: selección del modelo adecuado (ej. `gemini-2.0-pro`, `gemini-2.0-flash`, etc.).
- `max_output_tokens`: define la longitud máxima de la respuesta generada.

---

#### 💡 Ventajas clave

- Interacción más rica y contextual.
- Permite soluciones inclusivas y accesibles.
- Aplicaciones en educación, salud, diseño, etc.

---

#### 🔗 Recurso útil

- [Gemini Multimodal API](https://aistudio.google.com/)

In [3]:
import google.generativeai as genai
genai.configure(api_key=GEMINI_API_KEY)

model = genai.GenerativeModel('gemini-2.0-flash')

response = model.generate_content(
    "Actúa como profe de inglés, y dame ejemplos para mejorar vocabulario.",
    generation_config={
        "temperature": 0.1,
        "max_output_tokens": 500
    }
)

print(response.text)

¡Hola! ¡Me alegra ser tu profe de inglés hoy! Vamos a expandir tu vocabulario de una manera práctica y divertida. Aquí te presento algunos ejemplos y estrategias para que empieces a ver resultados:

**1. Aprende Palabras en Contexto:**

En lugar de memorizar listas de palabras aisladas, aprende cómo se usan en frases y situaciones reales.

*   **Ejemplo:** En lugar de solo aprender "happy," busca frases como:
    *   "She was **happy** to receive the good news." (Estaba feliz de recibir las buenas noticias.)
    *   "The children were **happily** playing in the park." (Los niños estaban jugando felizmente en el parque.)
    *   "He has a **happy** disposition." (Tiene una disposición alegre.)

**2. Usa Sinónimos y Antónimos:**

Conocer sinónimos (palabras con significados similares) y antónimos (palabras con significados opuestos) te ayuda a variar tu lenguaje y a comprender mejor los matices de cada palabra.

*   **Ejemplo:**
    *   **Palabra:** "Important" (Importante)
    *   **Sin

In [4]:
from PIL import Image
import requests
from io import BytesIO
import google.generativeai as genai

genai.configure(api_key=GEMINI_API_KEY)

image_url = "https://kinsta.com/es/wp-content/uploads/sites/8/2019/09/jpg-vs-jpeg.jpg"
response = requests.get(image_url)
img = Image.open(BytesIO(response.content))

img_byte_arr = BytesIO()
img.save(img_byte_arr, format='JPEG')
img_bytes = img_byte_arr.getvalue()

model = genai.GenerativeModel('gemini-2.0-flash')

# Send the prompt with image
response = model.generate_content(
    [
        "Describe la escena en la imagen usando palabras sencillas para que un estudiante principiante pueda entenderla.",
        {"mime_type": "image/jpeg", "data": img_bytes}
    ]
)

# Print the result
print(response.text)

Okay, I see a picture of a woman. She is standing in front of two screens. The screens are blue with white frames. On each screen, there is a curved red line and some black dots. The woman looks like she is thinking about what is on the screens. The background is also blue with some light blue shapes.


## 💻 Generación de Código con LLMs

### Introducción

Los **Modelos de Lenguaje de Gran Escala (LLMs)** no solo comprenden texto, también pueden **generar código** en múltiples lenguajes de programación. Gracias a su capacidad de aprender patrones sintácticos y semánticos, los LLMs son útiles para tareas como:

- Escribir funciones y scripts desde cero
- Explicar fragmentos de código
- Traducir código entre lenguajes
- Automatizar tareas repetitivas
- Resolver problemas paso a paso

Uno de los principales beneficios es la **aceleración del desarrollo**, especialmente para principiantes o para quienes buscan prototipar rápidamente. Sin embargo, es importante **verificar la validez y seguridad** del código generado.

---

### 🧪 Actividad: Traductor palabra por palabra en Python

#### Enunciado

Usa **Gemini API** para generar un script en Python que:

- Reciba como entrada una oración en inglés.
- Devuelva la traducción **palabra por palabra** al español.
- Se asuma que el modelo es un **experto en Python** y proporcione una solución funcional y clara.

In [5]:
import google.generativeai as genai
genai.configure(api_key=GEMINI_API_KEY)
model = genai.GenerativeModel('gemini-2.0-flash')
response = model.generate_content("Eres un experto en python. Escribe un código en Python que tome una oración en inglés y lo traduzca cada palabra al español")
print(response.text)

```python
from googletrans import Translator

def traducir_oracion(oracion_ingles):
  """
  Traduce una oración en inglés al español palabra por palabra usando la biblioteca googletrans.

  Args:
    oracion_ingles: La oración en inglés que se va a traducir (string).

  Returns:
    Una string con la oración traducida al español palabra por palabra.
    Retorna None si hay un error durante la traducción o si la oración está vacía.
  """

  if not oracion_ingles:
    print("Error: La oración está vacía.")
    return None

  try:
    translator = Translator()
    palabras = oracion_ingles.split()
    oracion_traducida = ""

    for palabra in palabras:
      # Traducir cada palabra individualmente
      try:
        traduccion = translator.translate(palabra, dest='es').text
        oracion_traducida += traduccion + " "
      except Exception as e:
        print(f"Error al traducir la palabra '{palabra}': {e}")
        return None  # Devuelve None si falla la traducción de alguna palabra


### **Prompt Template**

In [6]:
prompt_template = """
Eres un experto en programación, escribiendo código limpio en python y escribes comentarios en cada línea de código.
a continuación, {pregunta}.
"""
pregunta = "Crea un diccionario"
prompt = prompt_template.format(pregunta=pregunta)
print(prompt)


Eres un experto en programación, escribiendo código limpio en python y escribes comentarios en cada línea de código.
a continuación, Crea un diccionario.



In [7]:
import google.generativeai as genai
genai.configure(api_key=GEMINI_API_KEY)
model = genai.GenerativeModel('gemini-2.0-flash')
response = model.generate_content(prompt)
print(response.text)

```python
# Definimos un diccionario llamado 'mi_diccionario'.
# Un diccionario es una estructura de datos que almacena pares clave-valor.
mi_diccionario = {}

# Agregamos un par clave-valor al diccionario.
# La clave es 'nombre' y el valor es 'Juan'.
mi_diccionario['nombre'] = 'Juan'

# Agregamos otro par clave-valor al diccionario.
# La clave es 'edad' y el valor es 30.
mi_diccionario['edad'] = 30

# Agregamos un tercer par clave-valor al diccionario.
# La clave es 'ciudad' y el valor es 'Madrid'.
mi_diccionario['ciudad'] = 'Madrid'

# Imprimimos el diccionario completo para verificar su contenido.
print(mi_diccionario)

# Accedemos al valor asociado con la clave 'nombre'.
# Esto imprimirá 'Juan'.
print(mi_diccionario['nombre'])

# Modificamos el valor asociado con la clave 'edad'.
# Cambiamos la edad de 30 a 31.
mi_diccionario['edad'] = 31

# Imprimimos el diccionario actualizado.
print(mi_diccionario)

# Eliminamos la clave 'ciudad' y su valor asociado del diccionario.
del mi_dicci

In [8]:
#Implementación de modelo que razona 'experimental gemini 2.0 flash'
import google.generativeai as genai
genai.configure(api_key=GEMINI_API_KEY)
model = genai.GenerativeModel('gemini-2.0-flash-thinking-exp')
response = model.generate_content(prompt)
print(response.text)

Claro, como experto en programación, escribo código limpio y con comentarios detallados en cada línea según tu indicación.

Aquí tienes un ejemplo de cómo crear un diccionario simple en Python:

```python
# Esta línea define una variable llamada 'mi_diccionario'
mi_diccionario = {
    # Esta línea define la primera clave 'clave1' con su valor asociado 'valor1'
    'clave1': 'valor1',
    # Esta línea define la segunda clave 'clave2' con su valor asociado 'valor2'
    'clave2': 123,
    # Esta línea define la tercera clave 'clave3' con su valor asociado True (booleano)
    'clave3': True
    # La llave de cierre '}' indica el final de la definición del diccionario
}

# Esta línea opcional imprime el diccionario creado para verificar su contenido
print(mi_diccionario)
```

**Explicación:**

*   Utilizamos las llaves `{}` para definir un diccionario.
*   Dentro de las llaves, cada elemento es un par `clave: valor`.
*   Las claves y los valores están separados por dos puntos `:`.
*   Los p

In [9]:
from IPython.display import display, Markdown
import google.generativeai as genai

#Implementación de modelo que razona 'experimental gemini 2.0 flash'
prompt_template = """
Eres un experto en programación, escribiendo código limpio en python y escribes comentarios en cada línea de código.
Explicame este código con detalle y como aplicarlo.
a continuación,
{codigo}.

El resultado deve estar en formato Markdown.
"""

codigo = """{ # Inicia la definición del diccionario con una llave de apertura {.
    "clave_texto": "valor de ejemplo", # Define el primer par clave-valor: "clave_texto" apunta a una cadena.
    "clave_numero": 123,             # Define el segundo par clave-valor: "clave_numero" apunta a un número entero.
    "clave_booleano": True,          # Define el tercer par clave-valor: "clave_booleano" apunta a un valor booleano.
    "clave_lista": [1, 2, 3]         # Define el cuarto par clave-valor: "clave_lista" apunta a una lista.
} # Cierra la definición del diccionario con una llave de cierre }.
"""

prompt = prompt_template.format(codigo=codigo)

print(prompt)
genai.configure(api_key=GEMINI_API_KEY)
model = genai.GenerativeModel('gemini-2.0-flash-thinking-exp')
response = model.generate_content(prompt)
display(Markdown(response.text))


Eres un experto en programación, escribiendo código limpio en python y escribes comentarios en cada línea de código.
Explicame este código con detalle y como aplicarlo.
a continuación,
{ # Inicia la definición del diccionario con una llave de apertura {.
    "clave_texto": "valor de ejemplo", # Define el primer par clave-valor: "clave_texto" apunta a una cadena.
    "clave_numero": 123,             # Define el segundo par clave-valor: "clave_numero" apunta a un número entero.
    "clave_booleano": True,          # Define el tercer par clave-valor: "clave_booleano" apunta a un valor booleano.
    "clave_lista": [1, 2, 3]         # Define el cuarto par clave-valor: "clave_lista" apunta a una lista.
} # Cierra la definición del diccionario con una llave de cierre }.
.

El resultado deve estar en formato Markdown.



¡Claro! Como experto en programación Python, con gusto te explico este fragmento de código, que representa la definición de un diccionario. Siempre escribo código limpio y con comentarios para que sea fácil de entender.

Aquí tienes la explicación detallada en formato Markdown:

---

# Explicación Detallada de un Diccionario en Python

El fragmento de código que has proporcionado es la definición literal de un **diccionario** en Python. Un diccionario es una colección desordenada (en versiones antiguas de Python, ordenada por inserción en Python 3.7+ y garantizado en 3.8+) de pares **clave-valor**. Cada clave única está asociada a un valor, lo que permite acceder a los valores de manera eficiente utilizando sus claves.

Aquí te muestro el código con los comentarios estándar de Python, seguido de la explicación:

```python
# Este es un comentario general que describe lo que hace el bloque de código.
# Define un diccionario llamado 'mi_diccionario'.
mi_diccionario = { # Inicia la definición del diccionario con la llave de apertura '{'.
    "clave_texto": "valor de ejemplo",  # Primer par clave-valor: 'clave_texto' (cadena) mapea a una cadena. La clave es una cadena, el valor es una cadena.
    "clave_numero": 123,              # Segundo par clave-valor: 'clave_numero' (cadena) mapea a un número entero. La clave es una cadena, el valor es un entero.
    "clave_booleano": True,           # Tercer par clave-valor: 'clave_booleano' (cadena) mapea a un valor booleano. La clave es una cadena, el valor es booleano.
    "clave_lista": [1, 2, 3]          # Cuarto par clave-valor: 'clave_lista' (cadena) mapea a una lista. La clave es una cadena, el valor es una lista.
} # Finaliza la definición del diccionario con la llave de cierre '}'.
# El punto '.' al final en tu ejemplo original no forma parte de la sintaxis del diccionario en Python; parece un separador de la explicación.
```

## Explicación Línea por Línea

1.  `# Este es un comentario general...`: Los comentarios que inician con `#` son ignorados por el intérprete de Python y se usan para documentar el código. Esta línea es un comentario general sobre el propósito del bloque.
2.  `# Define un diccionario llamado 'mi_diccionario'.`: Otro comentario, especificando que estamos creando un diccionario y asignándolo a una variable llamada `mi_diccionario`.
3.  `mi_diccionario = {`: Esta línea inicia la **definición del diccionario**.
    *   `mi_diccionario =`: Asigna el diccionario que se está creando a la variable `mi_diccionario`. Usar una variable es la forma común de trabajar con un diccionario después de definirlo.
    *   `{`: La llave de apertura `{` indica el comienzo de un diccionario literal.
    *   `# Inicia la definición del diccionario...`: Comentario que describe el significado de la llave `{`.
4.  `"clave_texto": "valor de ejemplo",`: Esta es la definición del **primer par clave-valor** dentro del diccionario.
    *   `"clave_texto"`: Es la **clave**. En los diccionarios de Python, las claves suelen ser cadenas (`str`), pero pueden ser cualquier tipo de dato **inmutable** (como números, tuplas). Las claves deben ser **únicas** dentro de un mismo diccionario.
    *   `: `: El **dos puntos** separa la clave de su valor asociado.
    *   `"valor de ejemplo"`: Es el **valor** asociado a la clave `"clave_texto"`. Los valores pueden ser de **cualquier tipo** de dato en Python (cadenas, números, booleanos, listas, otros diccionarios, objetos, etc.).
    *   `,`: La **coma** al final de la línea separa este par clave-valor del siguiente par. No se requiere coma después del último par.
    *   `# Primer par clave-valor...`: Comentario que describe este par específico, indicando los tipos de datos de la clave y el valor.
5.  `"clave_numero": 123,`: **Segundo par clave-valor**.
    *   `"clave_numero"`: La clave, una cadena.
    *   `123`: El valor asociado, un número entero (`int`).
    *   `# Segundo par clave-valor...`: Comentario descriptivo.
6.  `"clave_booleano": True,`: **Tercer par clave-valor**.
    *   `"clave_booleano"`: La clave, una cadena.
    *   `True`: El valor asociado, un valor booleano (`bool`).
    *   `# Tercer par clave-valor...`: Comentario descriptivo.
7.  `"clave_lista": [1, 2, 3]`: **Cuarto par clave-valor**.
    *   `"clave_lista"`: La clave, una cadena.
    *   `[1, 2, 3]`: El valor asociado, una lista (`list`). Esto demuestra que los valores pueden ser colecciones u otras estructuras de datos.
    *   `# Cuarto par clave-valor...`: Comentario descriptivo.
8.  `} # Finaliza la definición del diccionario...`: La llave de cierre `}` marca el **final** de la definición del diccionario literal.

## Cómo Aplicar (Usar) Este Diccionario

Una vez que tienes el diccionario definido y asignado a una variable como `mi_diccionario`, puedes interactuar con él de diversas maneras:

1.  **Acceder a valores:** Usando la clave entre corchetes `[]`.
    ```python
    # Acceder al valor asociado con "clave_texto"
    texto = mi_diccionario["clave_texto"] # texto contendrá "valor de ejemplo"
    print(texto) # Salida: valor de ejemplo

    # Acceder al valor asociado con "clave_numero"
    numero = mi_diccionario["clave_numero"] # numero contendrá 123
    print(numero) # Salida: 123

    # Usar el método .get() para acceder de forma segura (devuelve None o un valor por defecto si la clave no existe)
    valor_seguro = mi_diccionario.get("clave_inexistente", "Valor por defecto")
    print(valor_seguro) # Salida: Valor por defecto
    ```

2.  **Modificar valores:** Asignando un nuevo valor a una clave existente.
    ```python
    # Cambiar el valor de "clave_numero"
    mi_diccionario["clave_numero"] = 456
    print(mi_diccionario["clave_numero"]) # Salida: 456
    ```

3.  **Añadir nuevos pares clave-valor:** Asignando un valor a una nueva clave (que no existe en el diccionario).
    ```python
    # Añadir un nuevo par
    mi_diccionario["nueva_clave"] = "¡Hola, mundo!"
    print(mi_diccionario["nueva_clave"]) # Salida: ¡Hola, mundo!
    ```

4.  **Eliminar pares clave-valor:** Usando la palabra clave `del` o el método `.pop()`.
    ```python
    # Eliminar un par usando del
    del mi_diccionario["clave_booleano"]
    # print(mi_diccionario["clave_booleano"]) # Esto causaría un error KeyError porque ya no existe

    # Eliminar un par usando pop (también puedes obtener el valor eliminado)
    lista_eliminada = mi_diccionario.pop("clave_lista")
    print(lista_eliminada) # Salida: [1, 2, 3]

    # pop() también permite un valor por defecto si la clave no se encuentra
    valor_removido_seguro = mi_diccionario.pop("otra_clave", "Clave no encontrada")
    print(valor_removido_seguro) # Salida: Clave no encontrada
    ```

5.  **Iterar sobre el diccionario:** Puedes iterar sobre las claves, los valores o los pares (ítems).
    ```python
    # Iterar sobre las claves
    print("Claves:")
    for clave in mi_diccionario: # Por defecto, itera sobre las claves
        print(clave)

    # Iterar sobre los valores
    print("\nValores:")
    for valor in mi_diccionario.values():
        print(valor)

    # Iterar sobre los pares (clave, valor)
    print("\nPares (clave, valor):")
    for clave, valor in mi_diccionario.items():
        print(f"{clave}: {valor}")
    ```

Este diccionario simple muestra cómo puedes almacenar y acceder a diferentes tipos de datos bajo nombres significativos (las claves). Los diccionarios son increíblemente útiles para representar objetos, configuraciones, registros de datos y mucho más en Python.

---

# 💻 3. Generación de Código y Hugging Face

## 🧾 Generación y explicación de código mediante prompts

Los **Modelos de Lenguaje de Gran Escala (LLMs)** pueden generar fragmentos de código fuente a partir de instrucciones en lenguaje natural. Esto se logra mediante **prompts** bien diseñados que indican al modelo qué tipo de código se desea obtener. Por ejemplo, se puede pedir al modelo:

- Que escriba una función específica.
- Que traduzca código de un lenguaje a otro.
- Que explique paso a paso lo que hace un bloque de código.

Esta capacidad transforma al LLM en un asistente de programación que puede ser útil tanto para principiantes como para desarrolladores avanzados.

---

## 🤗 Uso de la librería Transformers de Hugging Face

La biblioteca **Transformers** de [Hugging Face](https://huggingface.co/transformers/) permite acceder y trabajar con una gran variedad de modelos preentrenados, incluyendo aquellos diseñados para tareas de generación de código como:

- `CodeT5`
- `StarCoder`
- `GPT-2` y `GPT-Neo` con fine-tuning
- `Phi`, `CodeGen`, entre otros

Características clave de la librería:

- Compatibilidad con PyTorch y TensorFlow.
- Carga sencilla de modelos y tokenizadores.
- Interfaz de alto nivel para inferencia y entrenamiento.
- Integración con APIs como Google Generative AI, OpenAI o DeepSpeed.

---

## ⚖️ Ventajas y desafíos del uso de LLMs en programación

### ✅ Ventajas
- **Ahorro de tiempo:** Los desarrolladores pueden generar funciones, scripts y estructuras básicas en segundos.
- **Automatización:** Es posible automatizar tareas repetitivas como generación de boilerplate, validaciones o transformaciones de datos.
- **Soporte educativo:** Ideal para aprender programación, entender errores y practicar con ejemplos guiados.

### ⚠️ Desafíos
- **Alucinaciones:** El modelo puede inventar funciones o estructuras no válidas, incluso si su sintaxis parece correcta.
- **Seguridad:** Puede generar código vulnerable si no se aplican filtros o validaciones.
- **Dependencia excesiva:** Usar el modelo sin entender el código puede llevar a una pérdida de criterio técnico o errores en producción.

### 🤗 **Hugging Face**

**Hugging Face** es una plataforma y comunidad de código abierto enfocada en la **inteligencia artificial** y el **procesamiento de lenguaje natural (NLP)**. Es ampliamente reconocida por facilitar el acceso a modelos de lenguaje preentrenados y herramientas para desarrolladores, investigadores y entusiastas de la IA.

---

#### 🔧 ¿Qué ofrece Hugging Face?

- **Transformers**: biblioteca en Python para utilizar modelos de lenguaje como BERT, GPT-2, T5, entre otros. Compatible con PyTorch y TensorFlow.
- **Model Hub**: repositorio con miles de modelos preentrenados listos para usar.
- **Datasets**: colección de conjuntos de datos públicos para entrenamiento y evaluación de modelos.
- **Spaces**: plataforma para crear y compartir aplicaciones de IA usando Gradio, Streamlit o similares.
- **Tokenizers**: herramientas para convertir texto en tokens de forma eficiente, fundamentales en NLP.

---

#### 💡 Aplicaciones comunes

- Generación de texto
- Traducción automática
- Clasificación de sentimientos
- Resumen de textos
- Chatbots y asistentes virtuales
- Pregunta-respuesta (Q&A)

In [10]:
from transformers import MarianMTModel, MarianTokenizer
model_name = "Helsinki-NLP/opus-mt-en-es"
tokenizer = MarianTokenizer.from_pretrained(model_name)
model = MarianMTModel.from_pretrained(model_name)

In [11]:
texto_ingles = ["Hello, how are you?", "This is a translation test."]
tokens = tokenizer(texto_ingles, return_tensors="pt", padding=True)

In [12]:
traduccion_tokens = model.generate(**tokens)
traduccion_texto = tokenizer.batch_decode(traduccion_tokens, skip_special_tokens=True)
print(traduccion_texto)

['Hola, ¿cómo estás?', 'Esta es una prueba de traducción.']


In [13]:
for i, t in zip(texto_ingles, traduccion_texto):
  print(f"Inglés: {i} - Español: {t}")

Inglés: Hello, how are you? - Español: Hola, ¿cómo estás?
Inglés: This is a translation test. - Español: Esta es una prueba de traducción.


### 🔍 **RAG (Retrieval-Augmented Generation)**

**RAG (Generación Aumentada con Recuperación)** es una técnica que combina **modelos generativos** (como los LLMs) con un **sistema de recuperación de información**. Su objetivo es mejorar las respuestas del modelo accediendo a fuentes de conocimiento externas en tiempo real.

---

#### 🧠 ¿Cómo funciona?

1. **Consulta**: El usuario envía una pregunta o prompt.
2. **Recuperación**: El sistema busca información relevante en una base de datos o colección de documentos (por ejemplo, usando un motor tipo vectorial como FAISS o Elasticsearch).
3. **Generación**: El modelo LLM usa la información recuperada para generar una respuesta más precisa y actualizada.

---

#### 📌 Características clave

- No requiere reentrenar el modelo base.
- Permite respuestas más **contextualizadas** y **actualizadas**.
- Ideal para sistemas que usan datos privados, específicos o en constante cambio.

---

#### 🧪 Ejemplos de uso

- Asistentes de atención al cliente que consultan una base de conocimientos.
- Sistemas de recomendación basados en documentos.
- Aplicaciones empresariales que combinan IA generativa con datos internos.

---

#### ⚖️ Ventajas vs Fine-Tuning

| RAG                                  | Fine-Tuning                          |
|--------------------------------------|--------------------------------------|
| Usa documentos externos              | Modifica el modelo base              |
| No necesita entrenamiento adicional  | Requiere entrenamiento y cómputo     |
| Respuestas actualizadas y dinámicas | Respuestas más coherentes y estables |

In [14]:
documentos = {
    "IA": "La inteligencia artificial es un campo de la informática que se centra en la creación de sistemas capaces de realizar tareas que normalmente requieren inteligencia humana, como reconocer voz, imágenes, tomar decisiones o resolver problemas.",
    "RAG": "Retrieval-Augmented Generation (RAG) es una técnica de IA que combina búsqueda de información en bases de datos o documentos con modelos generativos, permitiendo respuestas más precisas y basadas en conocimiento actualizado.",
    "Machine Learning": "El aprendizaje automático es una rama de la inteligencia artificial que permite a las computadoras aprender de datos y mejorar su rendimiento sin ser programadas explícitamente para cada tarea."
}

In [15]:
def recuperar_contexto(pregunta):
  for tema, contenido in documentos.items():
    if tema.lower() in pregunta.lower():
      return contenido
    return "No se encontro información relevante en la base de conocimientos"

In [16]:
def generar_respuesta(pregunta):
  contexto = recuperar_contexto(pregunta)
  prompt = f"""Usa el siguiente contexto para responder la pregunta de manera clara y concisa \n\n Contexto: {contexto} \n\n Pregunta: {pregunta}"""
  genai.configure(api_key=GEMINI_API_KEY)
  model = genai.GenerativeModel('gemini-2.0-flash')
  response = model.generate_content(prompt)
  return response.text

In [17]:
pregunta_usuario = "Que es RAG"
respuesta = generar_respuesta(pregunta_usuario)
print(respuesta)

Dado que no hay información en la base de conocimientos, no puedo proporcionar una definición específica de "RAG" basada en ella.  Sin acceso a información relevante, solo puedo especular sobre posibles significados o pedir más contexto.



In [18]:
pregunta_usuario = "Que es Cartagena"
respuesta = generar_respuesta(pregunta_usuario)
print(respuesta)

Como no se encontró información relevante en la base de conocimientos, no puedo decirte qué es Cartagena.



## 🤖 ¿Qué es Crew AI?

**Crew AI** es un marco de trabajo para crear **agentes de inteligencia artificial colaborativos**, también conocidos como *AI agents*, que trabajan juntos como un "equipo" (*crew*) para resolver tareas complejas.

Cada agente puede tener un rol específico (por ejemplo: investigador, planificador, escritor, traductor), y todos operan de forma **coordinada y autónoma** mediante objetivos compartidos, herramientas externas, y comunicación entre ellos.

---

### 🎯 Objetivos clave

- **Automatizar flujos de trabajo complejos**
- **Descomponer tareas grandes en subtareas distribuidas entre agentes**
- **Mejorar la eficiencia y precisión al combinar diferentes habilidades cognitivas**

---

### ⚙️ Características destacadas

- Compatible con **modelos LLM** como GPT-4, Claude o Gemini
- Soporte para múltiples roles con comportamientos personalizados
- Capacidad de integración con APIs, herramientas externas o fuentes de datos
- Ideal para tareas como análisis de datos, redacción de reportes, investigación, planificación y más

---

Crew AI facilita la construcción de sistemas autónomos más inteligentes, colaborativos y especializados, siguiendo el enfoque emergente de la **IA multiagente**.

In [None]:
from google import genai
import litellm
from crewai import Agent, Task, Crew, LLM

### Definir los agentes
profesor = Agent(
    role="Profesor de Ingles",
    goal="Explicar conceptos de gramática y vocabulario en Inglés de manera clara y efectiva",
    backstory="Eres un profesor con experiencia en enseñar inglés a estudiantes de todos los niveles",
    verbose=True,
    allow_delegation=False,
    llm={
        "model": "gemini/gemini-2.0-flash",
        "api_key": GEMINI_API_KEY
    }
)

evaluador = Agent(
    role="Evaluador de Ingles",
    goal="Diseñar preguntas de evaluación y revisar las respuestas del estudiante.",
    backstory="Eres un experto en pruebas de inglés y puedes dar retroalimentación detallada",
    verbose=True,
    allow_delegation=False,
    llm={
        "model": "gemini/gemini-2.0-flash",
        "api_key": GEMINI_API_KEY
    }
)

### Definición de tarea de los agentes
explicacion_ingles = Task(
    description = "Explica la diferencia entre los tiempos verbales 'Present Perfect' y 'Past Perfect' con ejemplos",
    expected_output="Una explicaxión clara y ejemplos concretos",
    agent = profesor
)

evaluacion_ingles = Task(
    description = "Crea un Test de 3 preguntas basado en la explicación dada por el profesor",
    expected_output="Un test de 3 preguntas con sus respuestas correctas, relacionado con la diferencia entre 'Present perfect' y 'Past Perfect'",
    agent = evaluador
)

# Definir el Crew
crew = Crew(
    agents=[profesor, evaluador],
    tasks=[explicacion_ingles, evaluacion_ingles],
    verbose=True
)

# Ejecutar el Crew
resultado = crew.kickoff()
print(resultado)


[1;31mProvider List: https://docs.litellm.ai/docs/providers[0m


[1;31mProvider List: https://docs.litellm.ai/docs/providers[0m


[1;31mProvider List: https://docs.litellm.ai/docs/providers[0m


[1;31mProvider List: https://docs.litellm.ai/docs/providers[0m



Output()


[1;31mProvider List: https://docs.litellm.ai/docs/providers[0m


[1;31mProvider List: https://docs.litellm.ai/docs/providers[0m

