## Introducci√≥n general

En este trabajo pr√°ctico se desarrolla una exploraci√≥n sobre el dise√±o y la optimizaci√≥n de prompts para un asistente de IA aplicado a la gesti√≥n institucional de IOMA.  
El objetivo es mostrar c√≥mo, a partir de un mismo caso de uso, la calidad, precisi√≥n y costo de las respuestas del modelo dependen directamente del nivel de detalle y de las t√©cnicas empleadas en la construcci√≥n del prompt.

Para ello se parte de una **base de conocimiento real** (FAQs institucionales) y de una **misma consulta representativa**.  
A lo largo del cuaderno se presentan distintas versiones de prompts, organizadas de manera progresiva:

- **Versi√≥n 1**: prompt m√≠nimo, casi sin reglas.  
- **Versi√≥n 2**: incorporaci√≥n de rol, p√∫blico y tono.  
- **Versi√≥n 3**: primeras reglas y estructura b√°sica.  
- **Versi√≥n 4**: estructura m√°s completa con subsecciones y l√≠mite de extensi√≥n, cerrada exclusivamente a la BASE.  
- **Versi√≥n 5**: prompt mixto, donde el checklist se mantiene atado a la BASE, pero los t√©rminos clave y las buenas pr√°cticas pueden enriquecerse con conocimiento externo.  
- **Versi√≥n 6**: optimizaci√≥n orientada a **reducir costos**, aplicando t√©cnicas de *Fast Prompting* (BASE compacta, reglas breves y salida en JSON conciso).

Cada versi√≥n se acompa√±a con su correspondiente explicaci√≥n, ejecuci√≥n pr√°ctica y c√°lculo de costos, lo que permite comparar la evoluci√≥n en tres ejes:  
1. **Calidad y claridad de la respuesta**.  
2. **Grado de cumplimiento de las reglas definidas** (uso exclusivo de la BASE o apertura a conocimiento externo).  
3. **Uso de tokens y costo asociado** en cada ejecuci√≥n.

De este modo, se evidencia c√≥mo el dise√±o de prompts es un proceso iterativo que combina creatividad, precisi√≥n y eficiencia, y c√≥mo la aplicaci√≥n de t√©cnicas de *Fast Prompting* no solo mejora la confiabilidad de las respuestas, sino que tambi√©n optimiza la **eficiencia econ√≥mica** del sistema.



## Preparaci√≥n y funciones auxiliares

Antes de ejecutar los distintos prompts es necesario preparar la base de conocimiento y definir un conjunto de funciones que permitan seleccionar la FAQ m√°s relevante seg√∫n la consulta realizada.  
Este bloque cumple tres objetivos principales:

1. **Carga y filtrado de la base**  
   - Se importa el archivo CSV con las FAQs.  
   - Se filtran √∫nicamente las que tienen estado "vigente" o "en revisi√≥n".  
   - Se normalizan columnas clave para evitar valores nulos o inconsistencias.

2. **Tokenizaci√≥n y relevancia**  
   - `dividir_en_tokens(texto)`: transforma un texto en una lista de tokens en min√∫scula, eliminando signos de puntuaci√≥n.  
   - `calcular_relevancia(tokens_consulta, fila)`: asigna un puntaje a cada fila de la base comparando los tokens de la consulta con las palabras clave, el t√≠tulo y el contenido. Se da m√°s peso a las coincidencias en palabras clave (√ó3), luego en t√≠tulo (√ó2) y por √∫ltimo en contenido (√ó1).

3. **Selecci√≥n de FAQ**  
   - `buscar_faq(consulta, tabla)`: utiliza las funciones anteriores para identificar qu√© fila de la base tiene mayor relevancia frente a la consulta ingresada.  
   - Si encuentra coincidencias, devuelve la FAQ m√°s relevante; de lo contrario, indica que no hay resultados y que corresponde derivar el caso.

En s√≠ntesis, estas funciones permiten **conectar de forma eficiente la pregunta de un agente con la informaci√≥n normativa m√°s pertinente**, asegurando que cada prompt se construya sobre la BASE adecuada.


In [11]:
import pandas as pd
import re
from textwrap import dedent
import csv
from openai import OpenAI
from dotenv import load_dotenv
import os

# Cargar base de conocimiento
df = pd.read_csv("../data/base_conocimiento_afiliaciones_clean.csv", dtype=str, keep_default_na=False)

# Filtrar por estado
df = df[df["estado"].str.lower().isin(["vigente","en revisi√≥n"])].copy()

# Normalizar columnas
for col in ["id","titulo","contenido","respuesta_validada","palabras_clave"]:
    if col in df.columns:
        df[col] = df[col].fillna("").astype(str)

# Funciones auxiliares
def dividir_en_tokens(texto: str):
    texto = texto.lower()
    return [t for t in re.split(r"[^a-z√°√©√≠√≥√∫√±√º0-9]+", texto) if t]

def calcular_relevancia(tokens_consulta, fila):
    puntaje = 0
    puntaje += 3 * len(set(tokens_consulta) & set(dividir_en_tokens(fila.get("palabras_clave",""))))
    puntaje += 2 * len(set(tokens_consulta) & set(dividir_en_tokens(fila.get("titulo",""))))
    puntaje += 1 * len(set(tokens_consulta) & set(dividir_en_tokens(fila.get("contenido",""))))
    return puntaje

def buscar_faq(consulta: str, tabla: pd.DataFrame):
    toks_consulta = dividir_en_tokens(consulta)
    puntuadas = [(calcular_relevancia(toks_consulta, fila), idx) for idx, fila in tabla.iterrows()]
    puntuadas = [(p,i) for p,i in puntuadas if p>0]
    if not puntuadas:
        return None
    puntuadas.sort(reverse=True)
    return tabla.loc[puntuadas[0][1]]


### Configuraci√≥n inicial
En este bloque se establece la configuraci√≥n general necesaria para trabajar con la API de OpenAI.  
Se cargan las variables de entorno con la clave de acceso, se inicializa el cliente y se define la consulta de prueba que utilizaremos a lo largo de todas las ejecuciones.  
Adem√°s, se selecciona de la base de conocimiento la FAQ m√°s relevante frente a la consulta, sobre la cual se construir√°n los distintos prompts.

In [12]:
# Configuraci√≥n del cliente
load_dotenv()
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

# Consulta de prueba
consulta = "¬øQu√© documentaci√≥n necesito para afiliar a un recien nacido?"

# Selecci√≥n de fila relevante
fila_sel = buscar_faq(consulta, df)
if fila_sel is None:
    raise ValueError("No se encontr√≥ una FAQ relevante. Derivar a Afiliaciones (SLA 24 h).")

print("FAQ seleccionada:", fila_sel.get("id","(sin id)"), "-", fila_sel.get("titulo","(sin t√≠tulo)"))

FAQ seleccionada: faq_004 - Afiliaci√≥n de reci√©n nacido/a


### Bloque 2 ‚Äì Funci√≥n gen√©rica de ejecuci√≥n
### Bloque 2 ‚Äì Funci√≥n gen√©rica de ejecuci√≥n
Aqu√≠ se define una funci√≥n auxiliar `ejecutar_prompt`, que permite reutilizar el mismo flujo de implementaci√≥n con cualquier versi√≥n del prompt.  
La funci√≥n recibe como par√°metros:
- la funci√≥n `construir_prompt_vX` que define la variante del prompt,  
- la fila seleccionada de la base,  
- la consulta planteada.  

De este modo evitamos repetir c√≥digo en cada prueba y podemos ejecutar f√°cilmente todas las versiones de prompt simplemente cambiando la funci√≥n que se pasa como argumento.  

Adem√°s, dentro de la misma funci√≥n se incorpor√≥ el **c√°lculo autom√°tico de costos**, a partir de los tokens de entrada (prompt) y de salida (respuesta) que devuelve la API.  
Esto permite obtener en cada ejecuci√≥n:
- Cantidad de tokens consumidos en el prompt.  
- Cantidad de tokens generados en la respuesta.  
- Total de tokens procesados.  
- üí∞ **Costo estimado en d√≥lares** de esa llamada al modelo.  

De esta manera, no solo se eval√∫a la calidad de las respuestas seg√∫n cada versi√≥n de prompt, sino tambi√©n su **eficiencia econ√≥mica**, aspecto central en la optimizaci√≥n con *Fast Prompting*.



In [39]:
# --- Precios por mill√≥n de tokens  ---
PRECIOS_USD = {
    "gpt-4o-mini": {"in": 0.15, "out": 0.60}
}

def ejecutar_prompt(fn_prompt, fila_sel, consulta,
                    model="gpt-4o-mini", temperature=0.3, max_tokens=400):
    """
    fn_prompt: funci√≥n construir_prompt_vX (ej. construir_prompt_v5)
    fila_sel:  fila seleccionada de la base
    consulta:  string con la pregunta del agente

    Muestra la respuesta del modelo + tokens consumidos y costo estimado (USD).
    """
    # 1) Construcci√≥n del prompt (system = reglas + BASE; user = consulta)
    prompt = fn_prompt(fila_sel, consulta)

    # 2) Llamada al modelo
    resp = client.chat.completions.create(
        model=model,
        messages=[
            {"role": "system", "content": prompt},
            {"role": "user", "content": consulta},
        ],
        temperature=temperature,
        max_tokens=max_tokens,
    )

    # 3) Mostrar respuesta (evitamos eco duplicado retornando al final)
    respuesta = resp.choices[0].message.content
    print("\n--- RESPUESTA DEL MODELO ---\n")
    print(respuesta)

    # 4) C√°lculo de costos con usage
    precios = PRECIOS_USD.get(model, PRECIOS_USD["gpt-4o-mini"])
    pt = getattr(resp.usage, "prompt_tokens", 0)
    ct = getattr(resp.usage, "completion_tokens", 0)
    tt = getattr(resp.usage, "total_tokens", pt + ct)

    costo_in  = (pt / 1_000_000) * precios["in"]
    costo_out = (ct / 1_000_000) * precios["out"]
    costo_tot = costo_in + costo_out

    print("\n--- COSTOS ---")
    print(f"Modelo: {model} | Temp: {temperature} | M√°x. tokens salida: {max_tokens}")
    print(f"Prompt tokens: {pt} | Completion tokens: {ct} | Total: {tt}")
    print(f"Costo entrada (USD): {costo_in:.8f}")
    print(f"Costo salida  (USD): {costo_out:.8f}")
    print(f"üí∞ Costo total (USD): {costo_tot:.8f}")

    # 5) Retornar solo el texto (si quer√©s tambi√©n devolver resp, cambi√° el return)
    return respuesta


### Versi√≥n 1 ‚Äì Prompt b√°sico (m√≠nimo)
Comenzamos con un prompt muy simple, casi sin reglas.  
El asistente solo recibe la pregunta y la base como contexto, y se le pide responder.  
No hay estructura definida ni control sobre la extensi√≥n o la fidelidad de la respuesta.  
Esta versi√≥n nos sirve como **punto de partida** para observar c√≥mo responde el modelo con indicaciones m√≠nimas.


In [40]:
# VERSI√ìN 1 - MUY B√ÅSICO (casi sin reglas)
def construir_prompt_v1(fila, pregunta: str):
    base = (fila.get("contenido") or fila.get("titulo","")).strip()
    return f"""
    Pregunta: {pregunta}
    Base: {base}
    Responde usando la base.
    """
ejecutar_prompt(construir_prompt_v1, fila_sel, consulta)




--- RESPUESTA DEL MODELO ---

Para afiliar a un reci√©n nacido, necesitar√°s presentar la documentaci√≥n correspondiente en la Delegaci√≥n de IOMA que corresponda al domicilio de la persona afiliada titular. Tambi√©n puedes realizar el tr√°mite a trav√©s de la App IOMA Digital/Autogesti√≥n. Aseg√∫rate de tener a mano el documento de identidad del reci√©n nacido y cualquier otro documento que pueda ser requerido.

--- COSTOS ---
Modelo: gpt-4o-mini | Temp: 0.3 | M√°x. tokens salida: 400
Prompt tokens: 86 | Completion tokens: 76 | Total: 162
Costo entrada (USD): 0.00001290
Costo salida  (USD): 0.00004560
üí∞ Costo total (USD): 0.00005850


'Para afiliar a un reci√©n nacido, necesitar√°s presentar la documentaci√≥n correspondiente en la Delegaci√≥n de IOMA que corresponda al domicilio de la persona afiliada titular. Tambi√©n puedes realizar el tr√°mite a trav√©s de la App IOMA Digital/Autogesti√≥n. Aseg√∫rate de tener a mano el documento de identidad del reci√©n nacido y cualquier otro documento que pueda ser requerido.'

### Versi√≥n 2 ‚Äì Rol y tono
En esta segunda versi√≥n agregamos informaci√≥n contextual:  
- Definimos un **rol** (‚ÄúAsistente de Afiliaciones de IOMA‚Äù).  
- Establecemos el **p√∫blico** (agentes administrativos).  
- Indicamos un **tono** (claro, formal e institucional).  

De esta manera empezamos a darle al modelo un marco m√°s controlado, pero a√∫n sin una estructura r√≠gida en la respuesta.


In [41]:
# VERSI√ìN 2 - CON ROL Y TONO
def construir_prompt_v2(fila, pregunta: str):
    base = (fila.get("contenido") or fila.get("titulo","")).strip()
    return f"""
    Rol: Asistente de Afiliaciones de IOMA
    P√∫blico: agentes administrativos
    Tono: claro, formal, institucional

    Pregunta: {pregunta}

    Base de referencia:
    {base}

    Responde de forma clara y breve usando SOLO la base.
    """
ejecutar_prompt(construir_prompt_v2, fila_sel, consulta)


--- RESPUESTA DEL MODELO ---

Para afiliar a un reci√©n nacido, se debe presentar la documentaci√≥n correspondiente en la Delegaci√≥n de IOMA que corresponda al domicilio de la persona afiliada titular, o a trav√©s de la App IOMA Digital/Autogesti√≥n.

--- COSTOS ---
Modelo: gpt-4o-mini | Temp: 0.3 | M√°x. tokens salida: 400
Prompt tokens: 124 | Completion tokens: 48 | Total: 172
Costo entrada (USD): 0.00001860
Costo salida  (USD): 0.00002880
üí∞ Costo total (USD): 0.00004740


'Para afiliar a un reci√©n nacido, se debe presentar la documentaci√≥n correspondiente en la Delegaci√≥n de IOMA que corresponda al domicilio de la persona afiliada titular, o a trav√©s de la App IOMA Digital/Autogesti√≥n.'

### Versi√≥n 3 ‚Äì Estructura b√°sica y reglas
Aqu√≠ damos un salto importante:  
- Se aclara que el modelo debe usar **exclusivamente la BASE** como fuente.  
- Se introduce la regla de que, si falta un dato, debe indicarlo expl√≠citamente.  
- Se exige una **estructura de salida** con checklist y cierre obligatorio.  

De esta forma empezamos a aplicar t√©cnicas de **fast prompting** que reducen la ambig√ºedad y limitan la invenci√≥n de contenido.


In [42]:
# VERSI√ìN 3 - CON ESTRUCTURA Y REGLAS
def construir_prompt_v3(fila, pregunta: str):
    base = (fila.get("contenido") or fila.get("titulo","")).strip()
    return f"""
    Rol: Asistente de Afiliaciones de IOMA
    P√∫blico: agentes en Delegaciones
    Tono: institucional, claro y preciso

    Reglas:
    - Basate EXCLUSIVAMENTE en la Base.
    - Si falta un dato, dec√≠ "No consta en la normativa adjunta".

    Respuesta debe incluir:
    1. Pasos o checklist (en vi√±etas).
    2. Cierre con: "Fuente: base de conocimiento vigente".

    Pregunta: {pregunta}

    BASE:
    {base}
    """

ejecutar_prompt(construir_prompt_v3, fila_sel, consulta)


--- RESPUESTA DEL MODELO ---

Para afiliar a un reci√©n nacido, se requiere la siguiente documentaci√≥n:

- Acta de nacimiento del reci√©n nacido.
- Documento de identidad del afiliado titular (DNI).
- En caso de que el afiliado titular sea el padre o la madre, se deber√° presentar el v√≠nculo familiar (puede ser el DNI o el acta de matrimonio).

Recuerde que el tr√°mite puede iniciarse en la Delegaci√≥n correspondiente al domicilio de la persona afiliada titular, o a trav√©s de la App IOMA Digital/Autogesti√≥n.

Fuente: base de conocimiento vigente.

--- COSTOS ---
Modelo: gpt-4o-mini | Temp: 0.3 | M√°x. tokens salida: 400
Prompt tokens: 181 | Completion tokens: 115 | Total: 296
Costo entrada (USD): 0.00002715
Costo salida  (USD): 0.00006900
üí∞ Costo total (USD): 0.00009615


'Para afiliar a un reci√©n nacido, se requiere la siguiente documentaci√≥n:\n\n- Acta de nacimiento del reci√©n nacido.\n- Documento de identidad del afiliado titular (DNI).\n- En caso de que el afiliado titular sea el padre o la madre, se deber√° presentar el v√≠nculo familiar (puede ser el DNI o el acta de matrimonio).\n\nRecuerde que el tr√°mite puede iniciarse en la Delegaci√≥n correspondiente al domicilio de la persona afiliada titular, o a trav√©s de la App IOMA Digital/Autogesti√≥n.\n\nFuente: base de conocimiento vigente.'

### Versi√≥n 4 ‚Äì Prompt m√°s detallado con subsecciones (cerrado a la BASE)

En esta versi√≥n el prompt se vuelve m√°s completo y estructurado:  

- Se fija un **l√≠mite m√°ximo de extensi√≥n** (‚â§ 350 palabras).  
- Se exige un **cierre exacto** con la frase ‚ÄúFuente: base de conocimiento vigente‚Äù.  
- Se introduce un **contexto ampliado** con dos subsecciones:  
  - **T√©rminos clave** (‚â•3 √≠tems).  
  - **Objetivo y buenas pr√°cticas** (‚â•3 √≠tems).  

La t√©cnica que se aplica aqu√≠ es **prompt estructurado con subsecciones**, donde se gu√≠a al modelo para organizar mejor la salida. 

In [43]:
# VERSI√ìN 4 - M√ÅS DETALLADA (subsecciones y l√≠mites)
def construir_prompt_v4(fila, pregunta: str):
    base = (fila.get("respuesta_validada") or 
            fila.get("contenido") or 
            fila.get("titulo","")).strip()
    return f"""
    Rol: Asistente de Afiliaciones de IOMA
    P√∫blico: agentes en Delegaciones y App IOMA Digital
    Tono: institucional, claro y preciso

    Reglas:
    - Basate EXCLUSIVAMENTE en la BASE que est√° entre <<BASE>> y <<FIN_BASE>>.
    - Si un dato, definici√≥n o recomendaci√≥n NO aparece en la BASE, escrib√≠ literalmente: "No consta en la normativa adjunta".
    - Est√° prohibido inventar o usar informaci√≥n externa.
    - Extensi√≥n total ‚â§ 350 palabras.
    - El cierre debe ser EXACTAMENTE: "Fuente: base de conocimiento vigente".

    La respuesta debe incluir:
    1. Un √∫nico bloque titulado **Checklist de documentaci√≥n requerida** con la lista de √≠tems de la BASE. 
       No repitas la misma lista fuera de esta secci√≥n.
    2. Cierre exacto con la frase indicada.
    3. Contexto ampliado con dos subsecciones:
       - T√©rminos clave: ‚â•3 √≠tems, cada uno en el formato "T√©rmino: definici√≥n".
       - Objetivo y buenas pr√°cticas: ‚â•3 √≠tems, cada uno en el formato "Pr√°ctica: explicaci√≥n".

    Pregunta: "{pregunta}"

    <<BASE>>
    {base}
    <<FIN_BASE>>
    """.strip()

ejecutar_prompt(construir_prompt_v4, fila_sel, consulta)


--- RESPUESTA DEL MODELO ---

**Checklist de documentaci√≥n requerida**
1. Credencial o DNI del afiliado/a titular.
2. DNI del menor o constancia de parto donde figuren madre y padre.
3. Ficha de afiliaci√≥n cumplimentada (no certificada, solo la parte del afiliado).
4. √öltimo recibo de haberes.
5. CUIL si lo posee.
6. Certificado de nacimiento del menor.
7. Si la afiliaci√≥n se realiza sin el DNI del ni√±o/a, deber√° presentarse obligatoriamente una vez obtenido.

**T√©rminos clave:**
- Afiliaci√≥n: Proceso mediante el cual un nuevo miembro es incorporado al sistema de salud de IOMA bajo la cobertura del afiliado/a titular.
- Constancia de parto: Documento que acredita el nacimiento de un menor, incluyendo los datos de los padres.
- CUIL: C√≥digo √önico de Identificaci√≥n Laboral, que identifica a los trabajadores en Argentina y puede ser requerido para tr√°mites administrativos.

**Objetivo y buenas pr√°cticas:**
- Completar la ficha de afiliaci√≥n: Asegurarse de que la ficha est√©

'**Checklist de documentaci√≥n requerida**\n1. Credencial o DNI del afiliado/a titular.\n2. DNI del menor o constancia de parto donde figuren madre y padre.\n3. Ficha de afiliaci√≥n cumplimentada (no certificada, solo la parte del afiliado).\n4. √öltimo recibo de haberes.\n5. CUIL si lo posee.\n6. Certificado de nacimiento del menor.\n7. Si la afiliaci√≥n se realiza sin el DNI del ni√±o/a, deber√° presentarse obligatoriamente una vez obtenido.\n\n**T√©rminos clave:**\n- Afiliaci√≥n: Proceso mediante el cual un nuevo miembro es incorporado al sistema de salud de IOMA bajo la cobertura del afiliado/a titular.\n- Constancia de parto: Documento que acredita el nacimiento de un menor, incluyendo los datos de los padres.\n- CUIL: C√≥digo √önico de Identificaci√≥n Laboral, que identifica a los trabajadores en Argentina y puede ser requerido para tr√°mites administrativos.\n\n**Objetivo y buenas pr√°cticas:**\n- Completar la ficha de afiliaci√≥n: Asegurarse de que la ficha est√© correctamente 

### Versi√≥n 5 ‚Äì Prompt mixto (BASE + conocimiento externo)

En esta versi√≥n se separa expl√≠citamente el **origen de la informaci√≥n** por secci√≥n:

- **Checklist de documentaci√≥n** ‚Üí se extrae **solo** de la BASE (normativa) para garantizar exactitud y trazabilidad.
- **T√©rminos clave** y **Objetivo y buenas pr√°cticas** ‚Üí el modelo puede usar **conocimiento externo** para enriquecer la explicaci√≥n con definiciones y recomendaciones claras, aun cuando la normativa no las explicite.

**T√©cnicas aplicadas:**
- **Delimitadores de contexto** (`<<BASE>> ... <<FIN_BASE>>`) para acotar la secci√≥n normativa.
- **Estructura de salida en JSON** para facilitar validaci√≥n y reuso.
- **√Åmbito por secci√≥n** (section-scoped grounding): se indica qu√© partes deben salir de BASE y cu√°les pueden abrirse a conocimiento externo.

Esta variante muestra c√≥mo combinar respuestas **rigurosas** en lo normativo con **explicaciones pedag√≥gicas** para agentes, manteniendo el control del formato.


In [44]:
def construir_prompt_v5(fila, pregunta: str):
    base = (fila.get("respuesta_validada") or
            fila.get("contenido") or
            fila.get("titulo","")).strip()
    return f"""
    Rol: Asistente de Afiliaciones de IOMA
    P√∫blico: agentes en Delegaciones
    Tono: institucional y claro

    Instrucciones por secci√≥n (√°mbito de informaci√≥n):
    - "checklist": basate EXCLUSIVAMENTE en lo que est√° entre <<BASE>> y <<FIN_BASE>>.
      Si falta un dato, escribir: "No consta en la normativa adjunta".
    - "terminos_clave" y "objetivo_y_buenas_practicas": pod√©s usar tu conocimiento general externo.
      Incluir definiciones y recomendaciones breves, claras y relevantes. Si no hay suficiente
      informaci√≥n externa, escribir "No consta".

    Formato de salida (JSON v√°lido, sin texto adicional):
    {{
      "checklist": ["Documento 1", "Documento 2", "..."],
      "terminos_clave": ["T√©rmino: definici√≥n breve", "T√©rmino: definici√≥n breve", "T√©rmino: definici√≥n breve"],
      "objetivo_y_buenas_practicas": ["Buena pr√°ctica: detalle breve", "Buena pr√°ctica: detalle breve", "Buena pr√°ctica: detalle breve"],
      "cierre": "Fuente: base de conocimiento vigente"
    }}

    Reglas generales:
    - No inventes informaci√≥n normativa en el checklist: debe provenir de <<BASE>>.
    - El JSON debe ser la √∫nica salida (no agregues texto fuera del objeto).
    - Mantener redacci√≥n clara y precisa.

    Pregunta: "{pregunta}"

    <<BASE>>
    {base}
    <<FIN_BASE>>
    """.strip()
ejecutar_prompt(construir_prompt_v5, fila_sel, consulta)



--- RESPUESTA DEL MODELO ---

{
  "checklist": [
    "Credencial o DNI del afiliado/a titular",
    "DNI del menor o constancia de parto donde figuren madre y padre",
    "Ficha de afiliaci√≥n cumplimentada (no certificada, solo la parte del afiliado)",
    "√öltimo recibo de haberes",
    "CUIL si lo posee",
    "Certificado de nacimiento del menor"
  ],
  "terminos_clave": [
    "DNI: Documento Nacional de Identidad, identificaci√≥n oficial en Argentina.",
    "CUIL: C√≥digo √önico de Identificaci√≥n Laboral, n√∫mero que identifica a los trabajadores en el sistema de seguridad social.",
    "Constancia de parto: Documento que acredita el nacimiento de un ni√±o y puede ser emitido por el hospital o cl√≠nica."
  ],
  "objetivo_y_buenas_practicas": [
    "Verificar que toda la documentaci√≥n est√© completa antes de iniciar el proceso de afiliaci√≥n.",
    "Asegurarse de que la ficha de afiliaci√≥n est√© correctamente cumplimentada para evitar demoras.",
    "Informar al afiliado/a titu

'{\n  "checklist": [\n    "Credencial o DNI del afiliado/a titular",\n    "DNI del menor o constancia de parto donde figuren madre y padre",\n    "Ficha de afiliaci√≥n cumplimentada (no certificada, solo la parte del afiliado)",\n    "√öltimo recibo de haberes",\n    "CUIL si lo posee",\n    "Certificado de nacimiento del menor"\n  ],\n  "terminos_clave": [\n    "DNI: Documento Nacional de Identidad, identificaci√≥n oficial en Argentina.",\n    "CUIL: C√≥digo √önico de Identificaci√≥n Laboral, n√∫mero que identifica a los trabajadores en el sistema de seguridad social.",\n    "Constancia de parto: Documento que acredita el nacimiento de un ni√±o y puede ser emitido por el hospital o cl√≠nica."\n  ],\n  "objetivo_y_buenas_practicas": [\n    "Verificar que toda la documentaci√≥n est√© completa antes de iniciar el proceso de afiliaci√≥n.",\n    "Asegurarse de que la ficha de afiliaci√≥n est√© correctamente cumplimentada para evitar demoras.",\n    "Informar al afiliado/a titular sobre la 

### Versi√≥n 6 ‚Äì Prompt optimizado en costos (Fast Prompting)

En esta √∫ltima versi√≥n, el objetivo principal es **optimizar el uso de tokens** para reducir los costos de cada llamada al modelo, manteniendo el control sobre la estructura de salida.

**Caracter√≠sticas principales:**
- **Prompt m√°s breve (lean prompting):** reglas condensadas y redactadas con frases cortas.  
- **BASE compacta:** se limita el texto normativo a un m√°ximo de caracteres, eliminando redundancias.  
- **Formato en JSON conciso:** salida estructurada, f√°cil de validar y con menor extensi√≥n que una redacci√≥n en prosa.  
- **√Åmbito mixto:**  
  - *Checklist* ‚Üí restringido a la BASE.  
  - *T√©rminos clave* y *Buenas pr√°cticas* ‚Üí permitidos con conocimiento externo.  

**T√©cnicas de Fast Prompting aplicadas:**
- **Delimitadores (`<<BASE>> ‚Ä¶ <<FIN_BASE>>`)** para separar con claridad la informaci√≥n normativa.  
- **Output en JSON** para controlar extensi√≥n y validaci√≥n autom√°tica.  
- **Rol + reglas expl√≠citas pero compactas** para ahorrar tokens.  
- **Self-contained instruction:** se especifica de forma clara y m√≠nima qu√© debe y qu√© no debe hacer el modelo.  

El objetivo de esta versi√≥n es mostrar c√≥mo el **dise√±o del prompt** no solo mejora la calidad de las respuestas, sino tambi√©n su **eficiencia econ√≥mica** en escenarios de producci√≥n.

In [45]:
def compactar_texto(s: str, max_chars=800):
    """Compacta espacios y recorta la BASE a un m√°ximo de caracteres."""
    s = re.sub(r"\s+", " ", s).strip()
    return s[:max_chars]

def construir_prompt_v6(fila, pregunta: str):
    base = (fila.get("respuesta_validada") or 
            fila.get("contenido") or 
            fila.get("titulo","")).strip()
    base = compactar_texto(base, 800)  # compactar para ahorrar tokens

    return f"""
    Rol: Asistente de Afiliaciones de IOMA. P√∫blico: agentes. Tono: institucional.

    Instrucciones:
    - "checklist": SOLO de <<BASE>>. Si falta dato: "No consta en la normativa adjunta".
    - "terminos_clave" y "objetivo_y_buenas_practicas": pod√©s usar conocimiento externo.
    - Responder SOLO con JSON v√°lido.

    Formato:
    {{
      "checklist": ["...", "..."],
      "terminos_clave": ["T√©rmino: definici√≥n breve", "...", "..."],
      "objetivo_y_buenas_practicas": ["Buena pr√°ctica: detalle breve", "...", "..."],
      "cierre": "Fuente: base de conocimiento vigente"
    }}

    Pregunta: "{pregunta}"

    <<BASE>>
    {base}
    <<FIN_BASE>>
    """.strip()
_ = ejecutar_prompt(
    construir_prompt_v6,
    fila_sel,
    consulta,
    model="gpt-4o-mini",
    temperature=0.1,   # baja para consistencia
    max_tokens=250     # JSON conciso, menor costo
)



--- RESPUESTA DEL MODELO ---

{
  "checklist": [
    "Credencial o DNI del afiliado/a titular",
    "DNI del menor o constancia de parto donde figuren madre y padre",
    "Ficha de afiliaci√≥n cumplimentada (no certificada, solo la parte del afiliado)",
    "√öltimo recibo de haberes",
    "CUIL si lo posee",
    "Certificado de nacimiento del menor"
  ],
  "terminos_clave": [
    "DNI: Documento Nacional de Identidad, identificaci√≥n oficial en Argentina.",
    "CUIL: C√≥digo √önico de Identificaci√≥n Laboral, n√∫mero que identifica a los trabajadores en el sistema de seguridad social.",
    "Constancia de parto: Documento que acredita el nacimiento de un menor, indicando los datos de los padres."
  ],
  "objetivo_y_buenas_practicas": [
    "Buena pr√°ctica: Asegurarse de que toda la documentaci√≥n est√© completa y actualizada para evitar demoras en el proceso de afiliaci√≥n.",
    "Buena pr√°ctica: Realizar la afiliaci√≥n lo antes posible despu√©s del nacimiento para garantizar la c