# Prompt Engineering con OpenAI

En este notebook veremos como utilizar la API de OpenAI para aplicar diferentes t√©cnicas de prompt engineering:

In [1]:
# üëâ Ejecuta esta celda una sola vez para instalar dependencias
!pip install -q openai ipywidgets python-dotenv


[?25l   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m0.0/1.6 MB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[91m‚ï∏[0m [32m1.6/1.6 MB[0m [31m84.1 MB/s[0m eta [36m0:00:01[0m[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m1.6/1.6 MB[0m [31m40.4 MB/s[0m eta [36m0:00:00[0m
[?25h

Accedemos a la web de la [API de OpenAI](https://platform.openai.com/docs/overview) para obtener una API KEY que podamos utlizar

In [2]:
# üëâ Introduce tu clave de OpenAI (se guarda solo en la sesi√≥n actual)
import os, getpass
os.environ["OPENAI_API_KEY"] = getpass.getpass("üîë OpenAI API key: ")
print("‚úÖ¬†Clave configurada.")


üîë OpenAI API key: ¬∑¬∑¬∑¬∑¬∑¬∑¬∑¬∑¬∑¬∑
‚úÖ¬†Clave configurada.


## 1. Introducci√≥n al Prompt Engineering  
El **prompt engineering** es la pr√°ctica de dise√±ar instrucciones (prompts) para maximizar la **utilidad, precisi√≥n y seguridad** de las respuestas de los modelos de lenguaje de gran escala (LLMs).

Problemas que aborda:
- **Alucinaciones**: las respuestas inventadas o incorrectas.  
- **Ambig√ºedad**: enunciados poco claros generan salidas inconsistentes.  
- **Dependencia de contexto**: la falta de informaci√≥n relevante degrada la calidad.  

A continuaci√≥n probaremos un ejemplo simple.


In [3]:
from openai import OpenAI
import os

client = OpenAI()

def ask(prompt, model="gpt-4.1-nano", max_tokens=150):
    response = client.chat.completions.create(
        model=model,
        messages=[{"role":"user","content":prompt}],
        seed=42
        #temperature=0.7,
        #max_tokens=max_tokens
    )
    return response.choices[0].message.content.strip()


In [4]:
ejemplo = "¬øQu√© es el prompt engineering en una frase corta y clara?"
print(ask(ejemplo))

El prompt engineering es el proceso de dise√±ar y optimizar las instrucciones para que un modelo de inteligencia artificial genere respuestas precisas y relevantes.


## 2. Instruction‚ÄëBased Prompting  
Como hemos visto en la teor√≠a, un **prompt** bien estructurado puede incluir varios bloques:  

| Bloque | Descripci√≥n | Ejemplo |
| --- | --- | --- |
| **Persona** | Rol o estilo de la IA | ¬´Eres un profesor paciente‚Ä¶¬ª |
| **Instrucci√≥n** | Tarea a realizar | ¬´Explica la fotos√≠ntesis‚Ä¶¬ª |
| **Contexto** | Informaci√≥n adicional | ¬´Para estudiantes de 12¬†a√±os‚Ä¶¬ª |
| **Formato** | Forma de la salida | ¬´Responde en bullets‚Ä¶¬ª |
| **Audiencia** | A qui√©n va dirigido | ¬´Dir√≠gete a tus alumnos‚Ä¶¬ª |
| **Tono** | Voz deseada | ¬´Usa tono informal‚Ä¶¬ª |
| **Datos** | Ejemplos, tablas, etc. | (opcional) |

La construcci√≥n del prompt es **iterativa**. Veamos un ejemplo paso a paso.


In [5]:
import ipywidgets as widgets
from IPython.display import display, Markdown

persona     = widgets.Text(value='Eres un experto en IA experto en comunicaci√≥n adaptada al nivel de tu audiencia.', description='Persona')
instruccion = widgets.Textarea(value='Explica la Self-Attention de la arquitectura Transformers', description='Instrucci√≥n')
contexto    = widgets.Textarea(value='', description='Contexto')
formato     = widgets.Text(value='Explica el proceso en pasos numerados.', description='Formato')
audiencia   = widgets.Text(value='Estudiantes de primaria', description='Audiencia')
tono        = widgets.Text(value='Tono gracioso.', description='Tono')
btn = widgets.Button(description="Generar respuesta")

out = widgets.Output()

def build_prompt(_):
    prompt = "\n".join([persona.value,
                         instruccion.value,
                         contexto.value,
                         formato.value,
                         audiencia.value,
                         tono.value]).strip()
    with out:
        out.clear_output()
        display(Markdown(f"**Prompt generado:**\n```\n{prompt}\n```"))
        respuesta = ask(prompt)
        display(Markdown(f"**Respuesta del modelo:**\n{respuesta}"))

btn.on_click(build_prompt)

display(widgets.VBox([persona, instruccion, contexto, formato, audiencia, tono, btn, out]))


VBox(children=(Text(value='Eres un experto en IA experto en comunicaci√≥n adaptada al nivel de tu audiencia.', ‚Ä¶

## 3. In‚ÄëContext Learning (ICL)  
En lugar de entrenar el modelo de nuevo, se **ense√±a con ejemplos en el mismo prompt**:

- **Zero‚Äëshot**: sin ejemplos.  
- **One‚Äëshot**: un ejemplo.  
- **Few‚Äëshot**: varios ejemplos.

El modelo aprende del patr√≥n observado para **generalizar** a la nueva consulta.


In [6]:
import json

ej_bio = [
   'Concepto: "CPU" ‚Üí Analog√≠a: "Es como el cerebro que decide qu√© hacer en una f√°brica."',
   'Concepto: "Red neuronal" ‚Üí Analog√≠a: "Es como un grupo de trabajadores que votan cu√°l es la mejor soluci√≥n."'
]

texto_desafio = (
    "servidor web",
    "GPU"
)

# Zero-shot (sin ejemplos)
ej_zero = []

# One-shot (un ejemplo sencillo)
ej_one = [ej_bio[0]]

# Few-shot (varios ejemplos, incluido uno con alias y evento)
ej_few = ej_bio

concepto = texto_desafio[0]
prompt = f"Crear una analog√≠a para explicar el concepto{concepto}.\n"
ejemplos_one = f"Aqu√≠ tienes un ejemplo:\n {ej_one}"
ejemplos_few = f"Aqu√≠ tienes algunos ejemplos:\n {ej_few}"

print("Zero-shot: \n", ask(prompt))
print("One-shot: \n", ask(prompt+ejemplos_one))
print("Few-shot: \n", ask(prompt+ejemplos_few))


Zero-shot: 
 Un servidor web es como una biblioteca: cuando buscas un libro (una p√°gina web), la biblioteca (el servidor) busca en su estante (su almacenamiento) el libro solicitado y te lo entrega para que puedas leerlo en tu casa (tu navegador). As√≠, el servidor web almacena y entrega la informaci√≥n que los usuarios piden, permitiendo que puedas acceder a las p√°ginas y contenidos en internet.
One-shot: 
 Concepto: "Servidor web" ‚Üí Analog√≠a: "Es como un restaurante que recibe pedidos de comida (las solicitudes de los navegadores) y les sirve el plato correspondiente (las p√°ginas web)."
Few-shot: 
 Concepto: "Servidor web" ‚Üí Analog√≠a: "Es como una oficina de atenci√≥n en un restaurante, donde los clientes (usuarios) hacen sus pedidos (las solicitudes) y el personal (el servidor) prepara y entrega la comida (la p√°gina web) en funci√≥n de lo solicitado."


## 4. T√©cnicas Avanzadas  

### 4.1 Chain‚Äëof‚ÄëThought (CoT)  
Se le pide al modelo que **razone paso a paso** antes de entregar la respuesta final.


In [7]:
# Demostraci√≥n CoT
prompt = '''
Eres un experto matem√°tico.
Si tengo 3 manzanas y compro 5 m√°s, y luego regalo 4, ¬øcu√°ntas me quedan?

'''

cot_prompt = '''
Eres un experto matem√°tico.
Si tengo 3 manzanas y compro 5 m√°s, y luego regalo 4, ¬øcu√°ntas me quedan?

Think step by step
'''



Incluso sin utilizar el "think step by step", el modelo ya ha sido entrenado para detectar este tipo de situaci√≥n y aplicar reasoning durante el entrenamiento.

In [8]:
print(ask(prompt))


Primero, tienes 3 manzanas. Luego compras 5 m√°s, as√≠ que tienes:  
3 + 5 = 8 manzanas.  

Luego, regalas 4, por lo que te quedan:  
8 - 4 = 4 manzanas.  

Respuesta: **Te quedan 4 manzanas.**


In [9]:
print(ask(cot_prompt))


Claro, te explicar√© paso a paso:

1. Empiezas con 3 manzanas.
2. Compras 5 m√°s, as√≠ que ahora tienes 3 + 5 = 8 manzanas.
3. Luego, regalas 4 manzanas, as√≠ que ahora tienes 8 - 4 = 4 manzanas.

Respuesta: Te quedan **4 manzanas**.


### Podemos proporcioar al prompt una gu√≠a de como llevar a cabo la tarea (Chain of Thought Guiado)

In [11]:
frase = "El anticuerpo monoclonal Rituximab, utilizado en el tratamiento del linfoma no Hodgkin, act√∫a uni√©ndose al ant√≠geno CD20 presente en la superficie de c√©lulas B malignas, inhibiendo su proliferaci√≥n."

In [12]:
prompt = f'''
Dado el siguiente texto biom√©dico:

{frase}

Identifica primero las entidades relevantes y luego las relaciones entre ellas.
Sigue estos pasos de razonamiento:

1. **Detecta todas las entidades biom√©dicas** mencionadas en el texto (por ejemplo, enfermedades, genes, prote√≠nas, medicamentos, procedimientos).
2. **Clasifica** cada entidad con su tipo (por ejemplo, "ENFERMEDAD", "GEN", "MEDICAMENTO", "PROTEINA", "PROCEDIMIENTO").
3. **Identifica las relaciones** que se mencionan entre las entidades (por ejemplo, "trata", "causa", "inhibe", "asocia con", "codifica", etc.).
4. Escribe el resultado en dos partes:
   - Una lista de entidades (cada una con su texto y tipo).
   - Una lista de relaciones (cada una indicando entidad origen, relaci√≥n y entidad destino).

Devuelve una respuesta en formato JSON como este:

```json
{{
    "entidades": [
        {{
            "texto": "nombre de la entidad",
            "tipo": "tipo de entidad",
            "comentarios": "comentarios sobre la eleccion"
        }}
    ],
    "relaciones": [
        {{
            "origen": "texto de entidad origen",
            "relacion": "tipo de relaci√≥n",
            "destino": "texto de entidad destino"
        }}
    ]
}}
```

Ejemplo:
"El f√°rmaco Imatinib inhibe la actividad de la prote√≠na BCR-ABL, asociada a la leucemia mieloide cr√≥nica."

**Paso a paso:**

**1. Detectar entidades:**
- Imatinib
- BCR-ABL
- leucemia mieloide cr√≥nica

**2. Clasificar entidades:**
- Imatinib ‚Üí MEDICAMENTO
- BCR-ABL ‚Üí PROTEINA
- leucemia mieloide cr√≥nica ‚Üí ENFERMEDAD

**3. Identificar relaciones:**
- Imatinib inhibe BCR-ABL
- BCR-ABL se asocia con leucemia mieloide cr√≥nica

**4. Resultado final en JSON:**

```json
{{
    "entidades": [
        {{ "texto": "Imatinib", "tipo": "MEDICAMENTO", "comentarios": "Seha elegido porque.." }},
        {{ "texto": "BCR-ABL", "tipo": "PROTEINA", "comentarios": "Ejemplo de porque se ha elegido" }},
        {{ "texto": "leucemia mieloide cr√≥nica", "tipo": "ENFERMEDAD", "comentarios": "Ejemplo de porque se ha elegido" }}
    ],
    "relaciones": [
        {{ "origen": "Imatinib", "relacion": "inhibe", "destino": "BCR-ABL" }},
        {{ "origen": "BCR-ABL", "relacion": "asociada a", "destino": "leucemia mieloide cr√≥nica" }}
    ]
}}
```
'''

In [13]:
result = ask(prompt)

In [14]:
import json
json.loads(result)

{'entidades': [{'texto': 'Rituximab',
   'tipo': 'MEDICAMENTO',
   'comentarios': 'Es un anticuerpo monoclonal utilizado en tratamiento.'},
  {'texto': 'linfoma no Hodgkin',
   'tipo': 'ENFERMEDAD',
   'comentarios': 'Es la enfermedad tratada con Rituximab.'},
  {'texto': 'anticuerpo monoclonal',
   'tipo': 'PROTEINA',
   'comentarios': 'Rituximab es un anticuerpo monoclonal.'},
  {'texto': 'ant√≠geno CD20',
   'tipo': 'PROTEINA',
   'comentarios': 'Es la prote√≠na a la que se une Rituximab.'},
  {'texto': 'superficie de c√©lulas B malignas',
   'tipo': 'PROTEINA',
   'comentarios': 'Lugar donde se encuentra el ant√≠geno CD20.'}],
 'relaciones': [{'origen': 'Rituximab',
   'relacion': 'se une a',
   'destino': 'ant√≠geno CD20'},
  {'origen': 'ant√≠geno CD20',
   'relacion': 'est√° presente en',
   'destino': 'superficie de c√©lulas B malignas'},
  {'origen': 'Rituximab',
   'relacion': 'utilizado en el tratamiento de',
   'destino': 'linfoma no Hodgkin'},
  {'origen': 'Rituximab',
   '

## 5. Usos de Prompt Engineering  

- **Pre‚Äëanotaci√≥n de datos**: acelerar el etiquetado en NLP.  


Sin formato, no lo entiende bien:

In [15]:
texto = "Uber planea lanzar coches aut√≥nomos en Madrid el pr√≥ximo a√±o, afirma su CEO Dara Khosrowshahi."
etiquetado_prompt = f'''
Etiqueta las entidades PERSONA, ORGANIZACION y LOCALIZACION en el texto.
Texto: {texto}
'''
print(ask(etiquetado_prompt))


Uber planea lanzar coches aut√≥nomos en LOCALIZACION Madrid el pr√≥ximo a√±o, afirma su PERSONA CEO Dara Khosrowshahi.


In [16]:
texto = "Uber planea lanzar coches aut√≥nomos en Madrid el pr√≥ximo a√±o, afirma su CEO Dara Khosrowshahi."
etiquetado_prompt = f'''
Etiqueta las entidades PERSONA, ORGANIZACION y LOCALIZACION en el texto.
Devuelve un JSON con las entidades y su categor√≠a.
Texto: {texto}
'''
print(ask(etiquetado_prompt))



{
  "entidades": [
    {
      "nombre": "Uber",
      "categor√≠a": "ORGANIZACION"
    },
    {
      "nombre": "Madrid",
      "categor√≠a": "LOCALIZACION"
    },
    {
      "nombre": "Dara Khosrowshahi",
      "categor√≠a": "PERSONA"
    }
  ]
}


Podeos definir json espec√≠fico para asegurar formato:

In [17]:
texto = "Uber planea lanzar coches aut√≥nomos en Madrid el pr√≥ximo a√±o, afirma su CEO Dara Khosrowshahi."
etiquetado_prompt = f'''
Etiqueta las entidades PERSONA, ORGANIZACION y LOCALIZACION en el texto.
Devuelve una estructura json como la siguiente. No a√±adas m√°s informaci√≥n adem√°s del json:
```json
[
    {{
        "texto": "nombre de la entidad extra√≠da",
        "tipo": "categor√≠a asignada"
    }}
]
```

Texto: {texto}
'''
resultado = ask(etiquetado_prompt)


In [18]:
print(resultado)


[
    {
        "texto": "Uber",
        "tipo": "ORGANIZACION"
    },
    {
        "texto": "Madrid",
        "tipo": "LOCALIZACION"
    },
    {
        "texto": "Dara Khosrowshahi",
        "tipo": "PERSONA"
    }
]


In [19]:
eval(resultado)[0]["texto"]

'Uber'

- **Generaci√≥n de datos sint√©ticos**: crear ejemplos adicionales para mejorar modelos.  


In [20]:
sint_prompt = '''
Genera 3 oraciones adicionales que expresen satisfacci√≥n del cliente con un servicio de entrega de comida.
'''
print(ask(sint_prompt))


1. ¬°Estoy muy satisfecho con la rapidez y la calidad de la entrega, definitivamente volver√© a ordenar aqu√≠!  
2. La comida lleg√≥ caliente y en perfectas condiciones, excelente servicio y muy recomendable.  
3. La atenci√≥n del repartidor fue muy amable y la entrega se realiz√≥ en tiempo r√©cord, muy feliz con el servicio.
