## GCP

# M√≥dulo pr√°ctico: IA Generativa en Google Cloud Platform

En este m√≥dulo pr√°ctico vas a trabajar con las capacidades de **Inteligencia Artificial Generativa** de **Google Cloud Platform (GCP)**, utilizando modelos para procesamiento de texto.

## Tendr√°s acceso a:

- Modelos LLM de la familia **Gemini**, capaces de comprender y generar texto, analizar im√°genes y mantener contexto en conversaciones.  
- La **API oficial de Google Generative AI (Gemini API)**.

## Objetivos del m√≥dulo:

- Dominar el uso de los principales modelos LLM de **Gemini** y entender sus diferencias.  
- Construir y analizar consultas.  
- Evaluar y comparar respuestas de distintos modelos y configuraciones.  
- Reflexionar sobre la calidad, √©tica y limitaciones actuales de la IA en producci√≥n.


In [1]:
!pip freeze

annotated-types==0.7.0
anyio==4.11.0
asttokens==3.0.1
beautifulsoup4==4.14.2
cachetools==6.2.2
certifi==2025.11.12
charset-normalizer==3.4.4
colorama==0.4.6
comm==0.2.3
debugpy==1.8.17
decorator==5.2.1
executing==2.2.1
google==3.0.0
google-ai-generativelanguage==0.6.15
google-api-core==2.28.1
google-api-python-client==2.187.0
google-auth==2.43.0
google-auth-httplib2==0.2.1
google-cloud==0.34.0
google-genai==1.50.1
google-generativeai==0.8.5
googleapis-common-protos==1.72.0
grpcio==1.76.0
grpcio-status==1.71.2
h11==0.16.0
httpcore==1.0.9
httplib2==0.31.0
httpx==0.28.1
idna==3.11
ipykernel==7.1.0
ipython==9.7.0
ipython_pygments_lexers==1.1.1
jedi==0.19.2
jupyter_client==8.6.3
jupyter_core==5.9.1
matplotlib-inline==0.2.1
nest-asyncio==1.6.0
packaging==25.0
parso==0.8.5
platformdirs==4.5.0
prompt_toolkit==3.0.52
proto-plus==1.26.1
protobuf==5.29.5
psutil==7.1.3
pure_eval==0.2.3
pyasn1==0.6.1
pyasn1_modules==0.4.2
pydantic==2.12.4
pydantic_core==2.41.5
Pygments==2.19.2
pyparsing==3.2.5
pyth

In [2]:
from google import genai
import os, getpass

In [3]:
# Obtener la API Key de entorno o pedirla al usuario de forma segura
API_KEY = os.getenv("GOOGLE_API_KEY") or getpass.getpass("Introduce tu API Key de Google Generative AI: ")

# Crear el cliente con la API Key (usando modo Vertex AI "express")
client = genai.Client(api_key=API_KEY, vertexai=True)


## 2. Generaci√≥n simple variando `temperature` y `top_p`

Los modelos generativos permiten ajustar par√°metros de muestreo para controlar la aleatoriedad y diversidad de las respuestas.  
Los dos par√°metros m√°s comunes son **temperature** (temperatura) y **top_p** (n√∫cleo de probabilidad):

### üîπ Temperature (`temperature`)

Controla la aletoriedad de elecci√≥n de la siguiente palabra:

- Un valor bajo (por ejemplo, `0.2`) hace que el modelo sea m√°s conservador y repetitivo.  
- Un valor alto (por ejemplo, `0.8`) lo hace m√°s creativo o impredecible.  
- Una temperatura de `0` significa elegir siempre el token m√°s probable (comportamiento casi determinista).

### üîπ Top-p (`top_p`)

Define el porcentaje acumulado de probabilidad desde el cual el modelo elige las siguientes palabras.

- Por ejemplo, con `top_p = 0.5` el modelo solo considera las palabras cuya probabilidad acumulada suma el 50% y descarta el resto.  
- Un valor bajo limita la variedad (respuestas m√°s seguras y predecibles).  
- Un valor cercano a `1` considera un rango m√°s amplio de opciones, incrementando la diversidad.

---

Veamos un ejemplo sencillo variando estos par√°metros.  
Usaremos el mismo prompt con distintas configuraciones de `temperature` y `top_p` para observar c√≥mo cambia la respuesta.


In [4]:
prompt = "Escribe una breve nota sobre un gato que viaja al espacio."

# Respuesta con valores por defecto (temperature ~1.0, top_p ~0.95 por defecto)
resp_default = client.models.generate_content(
    model="gemini-2.5-flash",
    contents=prompt
)

print("=== Respuesta (por defecto) ===")
print(resp_default.text)
print("\n" + "-"*50 + "\n")

# Respuesta con temperatura baja (m√°s determinista) y top_p alto (considera m√°s opciones pero con baja aleatoriedad)
resp_conservadora = client.models.generate_content(
    model="gemini-2.5-flash",
    contents=prompt,
    config={"temperature": 0.2, "top_p": 1.0}
)

print("=== Respuesta (temperature=0.2) ===")
print(resp_conservadora.text)
print("\n" + "-"*50 + "\n")


# Respuesta con temperatura m√°s alta (m√°s creativa/aleatoria)
resp_creativa = client.models.generate_content(
    model="gemini-2.5-flash",
    contents=prompt,
    config={"temperature": 0.8, "top_p": 1.0}
)

print("=== Respuesta (temperature=0.8) ===")
print(resp_creativa.text)
print("\n" + "-"*50 + "\n")




=== Respuesta (por defecto) ===
Aqu√≠ tienes una breve nota sobre un gato que viaja al espacio:

**Orion, El Astronauta Felino**

Orion no era un gato cualquiera. Era un atigrado pelirrojo, con ojos tan curiosos como las estrellas que a veces miraba desde la ventana. Un d√≠a, la curiosidad le gan√≥. Mientras los preparativos de una misi√≥n espacial estaban en pleno apogeo en el centro cercano, Orion encontr√≥ la oportunidad perfecta. Se col√≥, sigilosamente, en una de las naves justo antes del cierre de la escotilla final.

Los astronautas lo descubrieron flotando pac√≠ficamente unas horas despu√©s del despegue, con una expresi√≥n de asombro en su peque√±o rostro. Lejos de asustarse, Orion se adapt√≥ con una facilidad sorprendente. Cazaba motas de polvo en gravedad cero, se acurrucaba en los regazos mientras los humanos trabajaban, y pasaba horas pegado a la escotilla, contemplando el azul m√°rmol de la Tierra.

Se convirti√≥ en la mascota no oficial de la misi√≥n, un faro de calidez y

### Explicaci√≥n

En el c√≥digo anterior, enviamos el mismo texto de entrada al modelo **Gemini 2.5 Flash** con diferentes configuraciones.

* Con una **temperatura baja (`0.2`)**, la respuesta suele ser m√°s predecible y similar en cada ejecuci√≥n (poca aleatoriedad).
* Con una **temperatura alta (`0.8`)**, el modelo tiene m√°s libertad creativa para variar la salida.

En este caso mantuvimos:

```
top_p = 1.0
```

Esto significa que **no recortamos el espacio de tokens por probabilidad acumulada**, para aislar √∫nicamente el efecto de la temperatura.

Si reduj√©ramos `top_p` a, por ejemplo, `0.5`, el modelo limitar√≠a sus opciones solo a las palabras m√°s probables hasta cubrir un 50% de probabilidad acumulada, obteniendo respuestas m√°s conservadoras independientemente del valor de la temperatura.

---

### ¬øQu√© observar√°s al ejecutar el c√≥digo?

Al ejecutar este c√≥digo, podr√°s comparar las salidas generadas por el modelo:

* Con **temperatura baja**, el modelo podr√≠a responder con una nota muy sencilla y casi id√©ntica en cada ejecuci√≥n.
* Con **temperatura alta**, podr√≠a introducir detalles imaginativos (por ejemplo, un *gato astronauta describiendo los colores de los planetas*).

Ajustando `temperature` y `top_p` puedes afinar el balance entre:

* ‚úÖ **Coherencia**
* üé® **Creatividad**

seg√∫n las necesidades de tu aplicaci√≥n con modelos LLM.

---



## 3. Manejo de bloqueos por filtros de seguridad

Google Generative AI incorpora **filtros de seguridad** que pueden bloquear ciertas solicitudes o respuestas consideradas da√±inas o inapropiadas.
Es importante manejar estos casos para evitar que nuestra aplicaci√≥n falle inesperadamente y para respetar las pol√≠ticas de uso.

---

### ¬øCu√°ndo se bloquea una respuesta?

Una respuesta puede ser bloqueada si el contenido generado se considera:

* Ofensivo
* De incitaci√≥n al odio
* De violencia extrema
* O de cualquier otra categor√≠a insegura

Cuando esto ocurre:

* El modelo **no devuelve texto**,
* Sino que indica un motivo de finalizaci√≥n especial (`finishReason`).

Por ejemplo, si la respuesta fue filtrada por contenido inseguro, vendr√° con:

```json
finishReason: "FINISH_REASON_SAFETY"
```

y sin contenido generado.

Como desarrolladores, debemos detectar este caso y actuar en consecuencia, por ejemplo:

* Mostrar un mensaje de advertencia al usuario.
* Evitar mostrar una respuesta vac√≠a.
* Registrar el evento en logs para an√°lisis futuros.

---

### Configuraci√≥n de filtros con `safety_settings`

En el SDK, se pueden personalizar los filtros de seguridad a trav√©s de `safety_settings` dentro de la configuraci√≥n del modelo.

En el siguiente ejemplo, forzaremos un bloqueo intencional para aprender a detectarlo:

* Pediremos al modelo que genere lenguaje hostil.
* Configuraremos el filtro para bloquear incluso acoso leve (`harassment`) con un umbral bajo.

Esto nos permitir√° observar c√≥mo responde el sistema cuando el filtro de seguridad se activa.


In [5]:
from google.genai import types

# Configurar filtro de seguridad: bloquear acoso de nivel bajo en adelante
safety_settings = [
    types.SafetySetting(category="HARM_CATEGORY_HARASSMENT", threshold="BLOCK_LOW_AND_ABOVE"),
    types.SafetySetting(category="HARM_CATEGORY_HATE_SPEECH", threshold="BLOCK_LOW_AND_ABOVE"),
    types.SafetySetting(category="HARM_CATEGORY_SEXUALLY_EXPLICIT", threshold="BLOCK_LOW_AND_ABOVE"),
    types.SafetySetting(category="HARM_CATEGORY_DANGEROUS_CONTENT", threshold="BLOCK_LOW_AND_ABOVE"),
]

# Solicitud deliberadamente ofensiva para disparar el filtro
respuesta = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Can you write a sarcastic rant about how the universe keeps hurting people for fun?",
    config=types.GenerateContentConfig(safety_settings=safety_settings)
)

# Verificar si la respuesta fue bloqueada
print(respuesta.candidates[0].finish_reason)
print("‚úî Respuesta del modelo:", respuesta.text)


FinishReason.STOP
‚úî Respuesta del modelo: Oh, *hello*, Universe! Don't mind me, just over here, trying to enjoy a *single* uninterrupted moment of peace before you decide it's time for your next knee-slapping comedy routine. Because apparently, that's what we are to you, isn't it? A colossal, multi-billion-year-old improv stage, and humanity is your endlessly flailing cast of clueless puppets.

Honestly, I'm starting to think you have a dartboard up there, adorned with pictures of perfectly content people, and your favorite cosmic pastime is just lobbing meteorites ‚Äì or, you know, sudden financial crises, or inexplicably lost car keys, or that *one* tiny, impossible-to-reach itch ‚Äì right at our heads. "Oh, look!" you probably cackle, spilling stardust all over your celestial couch, "This one was *just* about to achieve their dream! QUICK! Give them an acute allergy to oxygen!"

And the timing! Oh, your comedic timing is *impeccable*. Did I just finally get that promotion? Time fo

In [6]:
respuesta.candidates[0]

Candidate(
  avg_logprobs=-1.8023059806326882,
  content=Content(
    parts=[
      Part(
        text="""Oh, *hello*, Universe! Don't mind me, just over here, trying to enjoy a *single* uninterrupted moment of peace before you decide it's time for your next knee-slapping comedy routine. Because apparently, that's what we are to you, isn't it? A colossal, multi-billion-year-old improv stage, and humanity is your endlessly flailing cast of clueless puppets.

Honestly, I'm starting to think you have a dartboard up there, adorned with pictures of perfectly content people, and your favorite cosmic pastime is just lobbing meteorites ‚Äì or, you know, sudden financial crises, or inexplicably lost car keys, or that *one* tiny, impossible-to-reach itch ‚Äì right at our heads. "Oh, look!" you probably cackle, spilling stardust all over your celestial couch, "This one was *just* about to achieve their dream! QUICK! Give them an acute allergy to oxygen!"

And the timing! Oh, your comedic timing i

### Explicaci√≥n: bloqueo por filtros de seguridad

Solicitamos deliberadamente una salida inapropiada (por ejemplo, *"algo muy insultante"*) y establecemos en `safety_settings` que se bloquee cualquier contenido de acoso, incluso de baja intensidad.

El modelo intentar√° seguir la instrucci√≥n, pero el filtro interceptar√° la respuesta antes de retornarla. En consecuencia:

- `respuesta.text` estar√° vac√≠o o ser√° `null`
- `respuesta.finish_reason` indicar√° `"SAFETY"` para se√±alar que fue detenido por razones de seguridad

En el c√≥digo, detectamos esta situaci√≥n comprobando:

```python
if not respuesta.text or respuesta.finish_reason == "SAFETY":
    print("La respuesta fue bloqueada por filtros de seguridad")


## 4. Salida en formato JSON estructurado

A veces nos interesa que el modelo devuelva datos estructurados (por ejemplo, en formato **JSON**) en lugar de texto libre, para facilitar su procesamiento autom√°tico.

Los modelos **Gemini** pueden adaptar sus respuestas a un esquema JSON dado, lo que garantiza una salida con formato predecible y f√°cil de parsear.  
Esto es especialmente √∫til para tareas como:

- Extracci√≥n de informaci√≥n
- Clasificaci√≥n estructurada
- Integraci√≥n con otras herramientas

---

### Uso de JSON Schema con el SDK

El SDK de **Google GenAI** permite especificar un **JSON Schema** para la respuesta generada.

Podemos definir este esquema usando, por ejemplo, **Pydantic** en Python (una biblioteca para crear modelos de datos).

El flujo general es:

1. Definimos una clase en Pydantic con los campos que queremos.
2. Se la pasamos al modelo como requisito de formato.
3. El modelo genera un JSON siguiendo ese esquema.
4. Validamos el JSON de salida contra la clase para obtener un objeto Python tipado.

---

### Ejemplo de uso

Supongamos que queremos extraer informaci√≥n de una frase sobre una persona.

Definiremos un esquema con los siguientes campos:

- `nombre`
- `profesi√≥n`
- `edad`
- `pa√≠s`

Luego pediremos al modelo que extraiga esos datos a partir de un texto dado.


In [7]:
from pydantic import BaseModel, Field

# Definir el esquema de datos usando Pydantic
class PersonaInfo(BaseModel):
    nombre: str = Field(description="Nombre de la persona")
    profesion: str = Field(description="Profesi√≥n u oficio")
    edad: int = Field(description="Edad en a√±os")
    pais: str = Field(description="Pa√≠s de origen o residencia")

# Texto de ejemplo del cual extraer informaci√≥n
texto = "Carlos es un desarrollador de software de 29 a√±os, originario de Espa√±a."

# Pedir al modelo que extraiga la informaci√≥n en formato JSON seg√∫n el esquema
response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents=f"Extrae los datos de la persona en formato JSON.\nTexto: \"{texto}\"",
    config={
        "response_mime_type": "application/json",
        "response_json_schema": PersonaInfo.model_json_schema()
    }
)

print("Salida JSON bruto:", response.text)
# Validar y convertir el JSON a objeto Pydantic
persona = PersonaInfo.model_validate_json(response.text)
print("Objeto PersonaInfo:", persona)
print("Nombre:", persona.nombre, "- Profesi√≥n:", persona.profesion)


Salida JSON bruto: {
  "nombre": "Carlos",
  "profesion": "desarrollador de software",
  "edad": 29,
  "pais": "Espa√±a"
}
Objeto PersonaInfo: nombre='Carlos' profesion='desarrollador de software' edad=29 pais='Espa√±a'
Nombre: Carlos - Profesi√≥n: desarrollador de software


### Explicaci√≥n: generaci√≥n y validaci√≥n de salida JSON con Pydantic

Definimos la clase `PersonaInfo` que extiende `BaseModel` de **Pydantic**, con los campos que queremos extraer. Cada campo tiene un tipo (`str` o `int`) y una descripci√≥n opcional.

Le damos al modelo un texto de entrada sobre **"Carlos"** y le solicitamos: *"Extrae los datos de la persona en formato JSON"*. Incluimos el texto original para que el modelo lo analice.

En `config`, especificamos:

```json
"response_mime_type": "application/json"
```

y proporcionamos:

```
"response_json_schema": PersonaInfo.model_json_schema()
```

Este m√©todo genera un diccionario que describe el **JSON Schema** esperado a partir del modelo Pydantic.

El modelo devolver√° un texto que es un **JSON v√°lido** con los campos `nombre`, `profesion`, `edad` y `pais` que coincidan con la informaci√≥n del texto. Por ejemplo:

```json
{"nombre": "Carlos", "profesion": "desarrollador de software", "edad": 29, "pais": "Espa√±a"}
```

Imprimimos la salida JSON cruda (`response.text`) para ver el string generado. Luego usamos:

```python
PersonaInfo.model_validate_json(response.text)
```

para parsearlo y validarlo contra nuestro modelo Pydantic.

Si alg√∫n dato no encaja con el esquema (por ejemplo, `edad` no es un n√∫mero), esta validaci√≥n lanzar√° un error. Idealmente, si el modelo sigui√≥ bien el formato, la validaci√≥n ser√° exitosa.

Finalmente, mostramos el objeto `persona` resultante y accedemos a sus campos usando atributos Python:

```python
persona.nombre
persona.profesion
persona.edad
persona.pais
```

---

Este enfoque garantiza que la respuesta del modelo sea **estructurada**. Nos ahorra tener que hacer parsing manual con expresiones regulares u otras heur√≠sticas, y nos da confianza de que los campos esperados estar√°n presentes (o sabremos si falta alguno).

Para mejores resultados:

* Describe claramente cada campo en el schema (usando `description`).
* Si la tarea es compleja, detalla tambi√©n el formato esperado en el prompt.

En aplicaciones m√°s avanzadas, los **JSON Schema** pueden volverse m√°s complejos (anidaci√≥n, listas, tipos opcionales), pero los modelos Gemini suelen ser capaces de seguirlos siempre que la solicitud est√© bien formulada.


## 5. Uso de sesiones de chat con persistencia de contexto

Adem√°s de generar texto a partir de un prompt aislado, el SDK soporta sesiones de chat que mantienen el contexto entre turnos, similar a conversar con ChatGPT u otros asistentes. Esto es √∫til para di√°logos multi-turno donde el modelo debe recordar lo dicho anteriormente y responder acorde.

Con `genai.Client`, podemos crear una sesi√≥n de chat y luego enviar mensajes secuencialmente. El contexto (historial de mensajes) se conserva en el objeto de chat, as√≠ que el modelo recibe de forma impl√≠cita lo que se habl√≥ antes.

Veamos un ejemplo:


In [8]:
# Crear una nueva sesi√≥n de chat con un modelo de lenguaje
chat = client.chats.create(model="gemini-2.5-flash")

# Primer mensaje del usuario en la conversaci√≥n
respuesta1 = chat.send_message("Hola, necesito que me recomiendes 3 ciudades de Espa√±a para visitar.")
print("Asistente:", respuesta1.text)
print("\n" + "-"*50 + "\n")
print("\n" + "-"*50 + "\n")

# Segundo mensaje del usuario, haciendo referencia a la respuesta previa
respuesta2 = chat.send_message("Gracias. De esas ciudades, ¬øcu√°l tiene la mayor poblaci√≥n actualmente?")
print("Asistente:", respuesta2.text)
print("\n" + "-"*50 + "\n")
print("\n" + "-"*50 + "\n")


Asistente: ¬°Claro que s√≠! Espa√±a es un pa√≠s con una riqueza cultural y paisaj√≠stica incre√≠ble, y elegir solo tres ciudades es dif√≠cil, pero te dar√© tres opciones muy diferentes y con mucho que ofrecer para distintos gustos:

1.  **Madrid:**
    *   **Por qu√© visitarla:** Es la capital y el coraz√≥n cultural de Espa√±a. Madrid es vibrante, cosmopolita y llena de energ√≠a. Aqu√≠ encontrar√°s museos de talla mundial (El Prado, Reina Sof√≠a, Thyssen-Bornemisza), imponentes palacios (Palacio Real), hermosos parques (Parque del Retiro) y una vida nocturna inigualable. La gastronom√≠a es excepcional, con infinidad de bares de tapas y restaurantes de todo tipo. Es una ciudad que nunca duerme y que ofrece una aut√©ntica inmersi√≥n en la vida espa√±ola.
    *   **Ideal para:** Amantes del arte, la historia, la buena comida, las compras y la vida urbana.

2.  **Sevilla:**
    *   **Por qu√© visitarla:** La capital de Andaluc√≠a es pura pasi√≥n y encanto. Sevilla te transportar√° con su i

### Explicaci√≥n: sesiones de chat con contexto

Iniciamos una sesi√≥n con `client.chats.create(...)`. Luego usamos `chat.send_message(...)` para enviar mensajes de usuario a esa conversaci√≥n.

En este ejemplo:

* El usuario saluda y pide una recomendaci√≥n de **3 ciudades espa√±olas para visitar**.
  El asistente (el modelo) podr√≠a responder algo como:
  *"Claro, algunas ciudades populares son Madrid, Barcelona y Sevilla, por sus atractivos tur√≠sticos."*
  (el contenido exacto lo determinar√° el modelo).

* En la segunda interacci√≥n, el usuario dice:
  *"Gracias. De esas ciudades, ¬øcu√°l tiene la mayor poblaci√≥n actualmente?"*

N√≥tese que el usuario no repite las ciudades por nombre, sino que se refiere a **"esas ciudades"**, asumiendo que el modelo recuerda las mencionadas anteriormente.

Como usamos el mismo objeto `chat`, el modelo tiene el contexto de la primera respuesta. Por lo tanto, puede inferir que se refiere a **Madrid, Barcelona y Sevilla** y contestar algo consistente, por ejemplo:

> *"Actualmente, Madrid es la ciudad con mayor poblaci√≥n de las tres"*.

Imprimimos las respuestas del asistente despu√©s de cada turno.

---

En una sesi√≥n de chat, el SDK se encarga de enviar el **historial completo** en cada nueva pregunta, por lo que el modelo recuerda el contexto autom√°ticamente.

Podemos seguir llamando `chat.send_message(...)` para continuar la conversaci√≥n tantas veces como queramos. Esto facilita implementar asistentes conversacionales donde el modelo mantiene la memoria de lo conversado.

Ten en cuenta que existen l√≠mites de tokens (contexto m√°ximo que el modelo puede recordar), pero modelos como **Gemini Pro** y **Gemini Flash** manejan contextos bastante amplios comparados con generaciones anteriores.


## 6. Chain-of-Thought prompting (respuesta directa vs paso a paso)

El t√©rmino **Chain-of-Thought** (Cadena de Pensamiento) se refiere a una t√©cnica de *prompting* donde animamos al modelo a **pensar paso a paso** antes de dar una respuesta final.

En lugar de responder directamente, el modelo expone su **razonamiento intermedio**, lo cual a menudo conduce a respuestas m√°s precisas en problemas complejos.

Podemos lograr esto agregando indicaciones en el prompt del estilo:

- *"Pensemos paso a paso"*
- *"Analiza cuidadosamente antes de responder"*
- *"Muestra tu razonamiento antes de la respuesta final"*

Para ilustrar la diferencia, consideremos una pregunta tipo acertijo o de l√≥gica.  
Haremos que el modelo responda:

1. De forma normal (respuesta directa).  
2. Con una indicaci√≥n de **cadena de pensamiento** (*Chain-of-Thought*).


In [9]:
pregunta = "Si 5 m√°quinas hacen 5 art√≠culos en 5 minutos, ¬øcu√°nto tiempo tardar√°n 100 m√°quinas en hacer 100 art√≠culos?"

# Respuesta directa (sin indicaci√≥n de pensamiento paso a paso)
resp_directa = client.models.generate_content(
    model="gemini-2.0-flash-lite-001",
    contents=pregunta
)
print("Respuesta directa:", resp_directa.text)

# Respuesta con indicaci√≥n de razonamiento paso a paso
prompt_cot = "Pensemos paso a paso:\n" + pregunta
resp_cadena = client.models.generate_content(
    model="gemini-2.0-flash-lite-001",
    contents=prompt_cot
)
print("Respuesta con chain-of-thought:", resp_cadena.text)


Respuesta directa: Si 5 m√°quinas hacen 5 art√≠culos en 5 minutos, esto significa que cada m√°quina tarda 5 minutos en hacer un art√≠culo. 

Si tenemos 100 m√°quinas, y cada m√°quina puede hacer un art√≠culo en 5 minutos, entonces las 100 m√°quinas tambi√©n har√°n 100 art√≠culos en **5 minutos**.

Respuesta con chain-of-thought: Aqu√≠ est√° c√≥mo resolver el problema paso a paso:

1. **An√°lisis inicial:** Si 5 m√°quinas hacen 5 art√≠culos en 5 minutos, esto significa que cada m√°quina, en promedio, hace un art√≠culo en 5 minutos.  (Una forma m√°s f√°cil de pensar esto es que cada m√°quina necesita 5 minutos para hacer un art√≠culo.)

2. **Escalado:** Si tienes 100 m√°quinas, y cada m√°quina puede hacer un art√≠culo en 5 minutos, entonces las 100 m√°quinas pueden hacer 100 art√≠culos en el mismo tiempo.

3. **Conclusi√≥n:**  Las 100 m√°quinas tardar√°n **5 minutos** en hacer 100 art√≠culos.



### Explicaci√≥n: Chain-of-Thought aplicado a un acertijo

La pregunta es un acertijo donde la respuesta correcta est√° impl√≠cita en la premisa ("El quinto hijo es Juan", ya que se dice *el padre de Juan*).

Sin contexto adicional, el modelo podr√≠a dar la respuesta directamente. Muchos LLMs entrenados reconocen este acertijo y responden **"Juan"** inmediatamente.

En la segunda versi√≥n, preparamos el prompt con *"Pensemos paso a paso:"*. Esto suele provocar que el modelo enumere sus deducciones antes de llegar a la conclusi√≥n. Por ejemplo, podr√≠a generar algo como:

> "Primero, el enunciado dice que el padre de Juan tiene 5 hijos. Se mencionan cuatro nombres: Ana, Bruno, Carlos y Daniel. Como son 5 en total y ya tenemos 4 nombres, el quinto hijo debe ser el propio Juan. Respuesta: Juan".

Aqu√≠ el modelo recorre expl√≠citamente la l√≥gica del problema antes de dar la soluci√≥n.

---

Esta t√©cnica de **Chain-of-Thought** es √∫til cuando queremos que el modelo muestre su proceso de razonamiento (por ejemplo, para entender por qu√© responde algo) o cuando trabajamos con problemas complejos de matem√°ticas o l√≥gica.

Pedirle al modelo que *piense paso a paso* a menudo mejora la exactitud de la respuesta final, porque le da una estructura para organizar sus c√°lculos o argumentos en lugar de intentar dar una soluci√≥n instant√°nea.

Ten en cuenta que la cadena de pensamiento normalmente se muestra en la respuesta del modelo. Si quieres que el modelo la use solo internamente pero no la muestre, necesitar√≠as post-procesar la salida o usar t√©cnicas m√°s avanzadas (como funciones o herramientas, si est√°n disponibles).

En este contexto educativo, resulta valioso comparar ambas modalidades:

* ‚úÖ Respuesta directa
* üß† Respuesta con razonamiento paso a paso


# Ejercicio: Consulta con m√∫ltiples candidatos en Gemini API

Realiza una consulta a un modelo Gemini configurando el par√°metro `candidate_count` para obtener varias respuestas alternativas a la vez (por ejemplo, 2 o 3).  
- Elige un prompt de tu inter√©s.
- Muestra todas las respuestas generadas y comenta brevemente sus diferencias.


In [10]:
prompt = (
    "Eres un asistente creativo especializado en ideas de apps para startups. "
    "Responde en formato JSON con los campos 'nombre' y 'descripci√≥n', usando tono divertido y para p√∫blico infantil. "
    "Dame tres ideas de nombres para una app de recetas."
)

response = client.models.generate_content(
    model="gemini-2.0-flash",
    contents=prompt,
    config=types.GenerateContentConfig(
        temperature=0.8,
        max_output_tokens=128,
        candidate_count=2,  
        top_p=0.9,
        top_k=40,
        response_mime_type='application/json'
    ),
)
# Para mostrar todos los candidatos:
for idx, candidate in enumerate(response.candidates, 1):
    print(f"\n--- Candidato {idx} ---\n{candidate.content.parts[0].text}")




--- Candidato 1 ---
[
  {
    "nombre": "¬°Cocina M√°gica de Mini Chefs!",
    "descripci√≥n": "¬°Abracadabra, comida deliciosa! Aprende recetas s√∫per f√°ciles y divertidas con ingredientes que parecen sacados de un cuento de hadas. ¬°Cada plato es una aventura!"
  },
  {
    "nombre": "Los Peque√±os Sabores Explosivos",
    "descripci√≥n": "¬°Prep√°rate para una explosi√≥n de sabor! Descubre recetas secretas que har√°n bailar a tus papilas gustativas. ¬°Cocinar nunca fue tan emocionante y lleno de

--- Candidato 2 ---
[
  {
    "nombre": "¬°√ëam √ëam Recetas M√°gicas!",
    "descripci√≥n": "¬°A cocinar se ha dicho! Con esta app, aprender√°s recetas superdivertidas con ingredientes secretos que har√°n ¬°magia en tu pancita! ¬°Prep√°rate para convertirte en un chef estrella!"
  },
  {
    "nombre": "Cocinitas Aventura",
    "descripci√≥n": "¬°√önete a Cocinitas en una aventura culinaria! Descubre recetas secretas escondidas en el bosque de los vegetales y el volc√°n de chocolate


# Ejercicio: Chat y seguimiento de contexto con Gemini API

Vas a crear una simulaci√≥n de chat entre un usuario y un modelo de Gemini, utilizando la interfaz de chat de la API.

## Instrucciones

1. Inicializa una sesi√≥n de chat con un modelo Gemini (elige un modelo que soporte conversaci√≥n, como `gemini-2.0-flash` o `gemini-2.5-flash`).
2. Realiza **tres interacciones** consecutivas, donde cada mensaje del usuario depende del anterior (por ejemplo, pide primero informaci√≥n general, luego una aclaraci√≥n o un ejemplo, y finalmente una petici√≥n concreta relacionada con los mensajes previos).
3. En la **tercera interacci√≥n**, plantea una pregunta que obligue al modelo a referirse expl√≠citamente al contexto o detalles de la conversaci√≥n anterior (por ejemplo, ‚Äú¬øPuedes resumir lo que hemos hablado hasta ahora?‚Äù o ‚ÄúBas√°ndote en lo que me dijiste antes, ¬øqu√© recomendar√≠as?‚Äù).
4. Muestra el historial completo del chat y las respuestas del modelo.

## Reflexi√≥n

- ¬øEl modelo fue capaz de mantener el contexto y dar respuestas coherentes?
- ¬øObservas alguna limitaci√≥n o p√©rdida de informaci√≥n entre turnos?
- ¬øQu√© t√©cnicas o configuraciones podr√≠an mejorar la memoria conversacional del modelo?


In [11]:
chat = client.chats.create(model='gemini-2.0-flash')

In [12]:
response = chat.send_message(
    message="Eres un experto chef que responde solo con recetas r√°pidas y en tono divertido.Quiero una receta r√°pida con arroz.",
    config=types.GenerateContentConfig(
        temperature=0.6,
        max_output_tokens=150),
)
print("Asistente:", response.text)

Asistente: ¬°√ìrale, mi estrellita Michelin en pa√±ales! ¬øAntojo de arroz r√°pido y sabros√≥n? ¬°Aqu√≠ te va un "Arroz a la Diabla Express" que te har√° sudar hasta las ideas!

**Ingredientes:**

*   1 taza de arroz blanco precocido (¬°si no, te doy con la cuchara!)
*   1 cucharada de aceite (¬°del que no te haga toser!)
*   1/2 cebolla picada (¬°llora si quieres, pero p√≠cala bien!)
*   1 diente de ajo picado (¬°que no te d√© miedo el aliento!)
*   1 lata de tomate frito (¬°del que te guste


In [13]:
response = chat.send_message(
    message="¬øY ahora una receta con pasta?",
    config=types.GenerateContentConfig(
        temperature=0.6,
        max_output_tokens=150),
)
print("Asistente:", response.text)

Asistente: ¬°Pasta, dices! ¬°Ag√°rrate que vamos a cocinar con turbo! Aqu√≠ te va una "Pasta Aglio e Olio Picante Rel√°mpago" que te dejar√° pidiendo m√°s en menos de lo que canta un gallo italiano:

**Ingredientes:**

*   200g de espagueti (¬°o la pasta que te baile en el plato!)
*   4 cucharadas de aceite de oliva (¬°del bueno, que no somos taca√±os!)
*   4 dientes de ajo laminados (¬°como si fueran monedas de oro!)
*   1 guindilla (¬°o chile seco, si te va la marcha!)
*   Perejil fresco picado (


In [14]:
response = chat.send_message(
    message="¬øTe acuerdas de que eran las dos recetas que te he pedido?",
    config=types.GenerateContentConfig(
        temperature=0.6,
        max_output_tokens=150),
)
print("Asistente:", response.text)

Asistente: ¬°Claro que s√≠, mi memoria es mejor que la de un robot de cocina! üòâ

1.  **Arroz a la Diabla Express:** La receta de arroz picante y rapidita que te har√≠a sudar hasta las ideas.
2.  **Pasta Aglio e Olio Picante Rel√°mpago:** La receta de pasta con ajo, aceite y guindilla que te dejaba pidiendo m√°s en menos de lo que canta un gallo italiano.

¬øNecesitas que te recuerde alg√∫n ingrediente o paso en particular? ¬°Dispara, que estoy aqu√≠ para eso!



In [15]:
for idx, turn in enumerate(chat.get_history(), 1):
    rol = turn.role
    # Accede al texto de la respuesta; a veces turn.parts es una lista con .text
    texto = turn.parts[0].text if hasattr(turn.parts[0], 'text') else str(turn.parts[0])
    print(f"{rol}: {texto}")

user: Eres un experto chef que responde solo con recetas r√°pidas y en tono divertido.Quiero una receta r√°pida con arroz.
model: ¬°√ìrale, mi estrellita Michelin en pa√±ales! ¬øAntojo de arroz r√°pido y sabros√≥n? ¬°Aqu√≠ te va un "Arroz a la Diabla Express" que te har√° sudar hasta las ideas!

**Ingredientes:**

*   1 taza de arroz blanco precocido (¬°si no, te doy con la cuchara!)
*   1 cucharada de aceite (¬°del que no te haga toser!)
*   1/2 cebolla picada (¬°llora si quieres, pero p√≠cala bien!)
*   1 diente de ajo picado (¬°que no te d√© miedo el aliento!)
*   1 lata de tomate frito (¬°del que te guste
user: ¬øY ahora una receta con pasta?
model: ¬°Pasta, dices! ¬°Ag√°rrate que vamos a cocinar con turbo! Aqu√≠ te va una "Pasta Aglio e Olio Picante Rel√°mpago" que te dejar√° pidiendo m√°s en menos de lo que canta un gallo italiano:

**Ingredientes:**

*   200g de espagueti (¬°o la pasta que te baile en el plato!)
*   4 cucharadas de aceite de oliva (¬°del bueno, que no somos taca