## Welcome to the Second Lab - Week 1, Day 3

Today we will work with lots of models! This is a way to get comfortable with APIs.

<table style="margin: 0; text-align: left; width:100%">
    <tr>
        <td style="width: 150px; height: 150px; vertical-align: middle;">
            <img src="../assets/stop.png" width="150" height="150" style="display: block;" />
        </td>
        <td>
            <h2 style="color:#ff7800;">Important point - please read</h2>
            <span style="color:#ff7800;">The way I collaborate with you may be different to other courses you've taken. I prefer not to type code while you watch. Rather, I execute Jupyter Labs, like this, and give you an intuition for what's going on. My suggestion is that you carefully execute this yourself, <b>after</b> watching the lecture. Add print statements to understand what's going on, and then come up with your own variations.<br/><br/>If you have time, I'd love it if you submit a PR for changes in the community_contributions folder - instructions in the resources. Also, if you have a Github account, use this to showcase your variations. Not only is this essential practice, but it demonstrates your skills to others, including perhaps future clients or employers...
            </span>
        </td>
    </tr>
</table>

In [1]:
# Start with imports - ask ChatGPT to explain any package that you don't know

import os
import json
from dotenv import load_dotenv
from openai import AzureOpenAI
from anthropic import Anthropic
from IPython.display import Markdown, display

In [2]:
# Always remember to do this!
load_dotenv(override=True)

True

In [3]:
# Print the key prefixes to help with any debugging

openai_api_key = os.getenv('OPENAI_API_KEY')
openai_endpoint = os.getenv('OPENAI_API_ENDPOINT')
openai_model = os.getenv('OPENAI_MODEL')

anthropic_api_key = os.getenv('ANTHROPIC_API_KEY')
google_api_key = os.getenv('GOOGLE_API_KEY')
deepseek_api_key = os.getenv('DEEPSEEK_API_KEY')
groq_api_key = os.getenv('GROQ_API_KEY')

if openai_api_key:
    print(f"OpenAI API Key exists and begins {openai_api_key[:8]}")
else:
    print("OpenAI API Key not set")
    
if anthropic_api_key:
    print(f"Anthropic API Key exists and begins {anthropic_api_key[:7]}")
else:
    print("Anthropic API Key not set (and this is optional)")

if google_api_key:
    print(f"Google API Key exists and begins {google_api_key[:2]}")
else:
    print("Google API Key not set (and this is optional)")

if deepseek_api_key:
    print(f"DeepSeek API Key exists and begins {deepseek_api_key[:3]}")
else:
    print("DeepSeek API Key not set (and this is optional)")

if groq_api_key:
    print(f"Groq API Key exists and begins {groq_api_key[:4]}")
else:
    print("Groq API Key not set (and this is optional)")

OpenAI API Key exists and begins E2c7izuB
Anthropic API Key not set (and this is optional)
Google API Key not set (and this is optional)
DeepSeek API Key not set (and this is optional)
Groq API Key not set (and this is optional)


In [4]:
request = "Por favor propon una pregunta compleja y con matices que pueda plantear a varios LLM para evaluar su inteligencia"
request += "Responde solo con la pregunta, sin explicaciones."
messages = [{"role": "user", "content": request}]

In [5]:
messages

[{'role': 'user',
  'content': 'Por favor propon una pregunta compleja y con matices que pueda plantear a varios LLM para evaluar su inteligenciaResponde solo con la pregunta, sin explicaciones.'}]

In [6]:
openai = AzureOpenAI(
    azure_endpoint=openai_endpoint,
    api_key=openai_api_key,
    api_version="2025-01-01-preview"
)

response = openai.chat.completions.create(
    model="gpt-4.1-rsv",
    messages=messages,
)
question = response.choices[0].message.content
print(question)


¿Cómo influirían los avances en inteligencia artificial generativa en la percepción global de la verdad y la confianza en las instituciones democráticas, considerando tanto los posibles beneficios como los riesgos éticos y sociales, y qué responsabilidades deberían asumir los distintos actores involucrados (desarrolladores, gobiernos, usuarios) para mitigar impactos negativos?


In [7]:
competitors = []
answers = []
messages = [{"role": "user", "content": question}]

In [8]:
# The API we know well

model_name = "gpt-4.1-rsv"

response = openai.chat.completions.create(model=model_name, messages=messages)
answer = response.choices[0].message.content

display(Markdown(answer))
competitors.append(model_name)
answers.append(answer)

La influencia de los avances en **inteligencia artificial generativa (IAG)** sobre la percepción de la verdad y la confianza en instituciones democráticas es profunda y multifacética. A continuación se detallan los posibles beneficios, riesgos, y responsabilidades de los actores involucrados:

---

**Beneficios potenciales:**

1. **Mejor acceso a la información:** IAG puede facilitar la síntesis y divulgación de información compleja de manera accesible, promoviendo el conocimiento y la participación ciudadana.
2. **Transparencia y análisis**: Herramientas automáticas pueden analizar grandes volúmenes de datos públicos, detectando corrupción o sesgos, y fomentando el escrutinio y la rendición de cuentas.
3. **Inclusión:** IAG puede traducir, adaptar y personalizar información, acercando la política y los procesos democráticos a más personas.

---

**Riesgos éticos y sociales:**

1. **Desinformación y manipulación:** La facilidad para crear textos, imágenes o videos falsos (deepfakes) puede erosionar la confianza en la autenticidad de la información, confundiendo a la ciudadanía y favoreciendo campañas de desinformación.
2. **Polarización:** Algoritmos que refuercen burbujas informativas o compartan contenido sesgado pueden exacerbar divisiones sociales y políticas.
3. **Socavamiento institucional:** Si proliferan noticias falsas sobre procesos electorales, decisiones judiciales, etc., la confianza en instituciones clave puede verse gravemente dañada.
4. **Desplazamiento de la agencia:** Las IAG pueden influenciar decisiones a través de recomendaciones sutiles, limitando la capacidad de pensamiento crítico y elección informada.

---

**Responsabilidades para mitigar impactos negativos:**

1. **Desarrolladores:**
   - Integrar “rótulos” o marcas de agua en los contenidos generados para distinguirlos claramente.
   - Implementar filtros para detectar y evitar la generación de contenidos falsos, discriminatorios, o manipulativos.
   - Promover la transparencia en los sistemas, permitiendo auditorías y explicaciones comprensibles sobre cómo y por qué generan ciertos resultados.

2. **Gobiernos:**
   - Regular el uso y difusión de IAG para evitar la desinformación, sin censurar la libertad de expresión.
   - Colaborar en la educación digital de la ciudadanía, promoviendo el pensamiento crítico y el análisis de fuentes informativas.
   - Apoyar estándares internacionales para compartir mejores prácticas y combatir amenazas globales, dada la naturaleza transnacional de la tecnología.

3. **Usuarios:**
   - Desarrollar hábitos de verificación de información, usando diversas fuentes y herramientas tecnológicas.
   - Participar en la alfabetización mediática y exigir transparencia tanto a proveedores tecnológicos como a los medios de comunicación.
   - Reportar contenidos sospechosos y contribuir a la moderación responsable de plataformas.

---

**Conclusión**

La IA generativa reconfigura la forma en que se construye, percibe y transmite la verdad. Aprovechar sus beneficios y reducir sus riesgos exige un enfoque colaborativo y ético entre desarrolladores, reguladores y sociedad. Solo así es posible fortalecer, y no socavar, la confianza y legitimidad de las instituciones democráticas en la era digital.

In [12]:
# Anthropic has a slightly different API, and Max Tokens is required
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import AssistantMessage, SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential

model_name = "DeepSeek-R1-0528"

messages2 = [UserMessage(content=question)]

deepseek = ChatCompletionsClient(
    endpoint="https://aaif-demo-rsv.services.ai.azure.com/models",
    credential=AzureKeyCredential(openai_api_key),
    api_version="2024-05-01-preview"
)

response = deepseek.complete(
    model=model_name, 
    messages=messages2, 
    max_tokens=1000
)

answer = response.choices[0].message.content

display(Markdown(answer))
competitors.append(model_name)
answers.append(answer)

<think>
Vaya, el usuario plantea una pregunta compleja y de gran actualidad sobre cómo la IA generativa podría afectar nuestra relación con la verdad y la confianza en las democracias. Parece alguien bien informado, probablemente con formación en ciencias sociales o tecnología, que busca un análisis equilibrado más que una respuesta simplista.

El tema tiene múltiples capas: desde la epistemología hasta la gobernanza tecnológica. El usuario menciona específicamente tres dimensiones (beneficios, riesgos, responsabilidades), lo que indica que quiere una estructura clara. También pide soluciones prácticas, no solo diagnóstico.

Sobre los beneficios: hay que destacar cómo la IA puede democratizar el acceso a información compleja, pero sin caer en un optimismo ingenuo. El riesgo de desinformación es lo más urgente - las deepfakes electorales ya son una realidad en Brasil y Filipinas. La parte ética es delicada: ¿cómo hablar de "verdad" cuando los modelos reflejan sesgos de sus datos de entrenamiento?

En responsabilidades, el usuario espera acciones concretas: desde auditorías algorítmicas obligatorias hasta alfabetización digital masiva. Los gobiernos tienen el rol más difícil: regular sin asfixiar la innovación. Curiosamente, el usuario no menciona a los medios tradicionales, actores clave en esta crisis de credibilidad.

Debo evitar tecnicismos innecesarios pero mantener rigor. Un detalle útil: mencionar ejemplos actuales como el Acta de Transparencia de Contenido de la UE. La conclusión debe reforzar que esto no es solo problema técnico, sino de contrato social en la era digital.
</think>
Los avances en IA generativa (como GPT, DALL-E o sistemas de deepfake) transformarán profundamente la percepción de la verdad y la confianza en instituciones democráticas, con impactos duales:

**Beneficios potenciales:**
- **Acceso a información compleja:** Herramientas que explican leyes o políticas en lenguaje accesible, democratizando el conocimiento.
- **Transparencia gubernamental:** Análisis automatizado de grandes volúmenes de datos públicos para detectar corrupción o ineficiencias.
- **Participación ciudadana:** Asistentes que facilitan la redacción de propuestas legislativas o resumen debates parlamentarios.
- **Verificación de hechos:** Sistemas que contrastan discursos políticos con bases de datos verificadas en tiempo real.

**Riesgos críticos:**
- **Erosión de la verdad:** 
  - *Deepfakes hiperrealistas* que falsifican declaraciones de líderes (ejemplo: videos falsos de Zelensky en 2022).
  - *Sesgos algorítmicos* que refuerzan desinformación o narrativas polarizadas.
- **Crisis de confianza institucional:**
  - "**Liar's dividend**": líderes pueden negar declaraciones reales alegando "es IA".
  - Saturación de desinformación que genera **escepticismo generalizado** hacia todas las fuentes.
- **Manipulación democrática:** Microtargeting con discursos personalizados que socavan el debate público coherente.

**Responsabilidades por actor:**

| **Actor**         | **Responsabilidades Clave**                                                                 |
|-------------------|--------------------------------------------------------------------------------------------|
| **Desarrolladores** | - Auditorías éticas de sesgos <br> - Marcas de agua para contenido generado (ej: C2PA) <br> - Limitaciones en usos políticos no verificados |
| **Gobiernos**     | - Leyes de transparencia algorítmica (ej: UE AI Act) <br> - Protección legal contra deepfakes maliciosos <br> - Inversión en alfabetización digital masiva |
| **Plataformas**   | - Detección proactiva de contenido sintético <br> - Desambiguación de fuentes (humanas vs IA) <br> - Algoritmos que priorizan verificabilidad |
| **Ciudadanía**    | - Educación crítica en medios (detección de deepfakes) <br> - Verificación cruzada de fuentes <br> - Participación en auditorías ciudadanas |

**Estrategias de mitigación:**
1. **Infraestructuras de verificación:** Bases de datos inalterables para contenido oficial (blockchain).
2. **Neuroderechos:** Protección legal contra manipulación cognitiva mediante IA.
3. **Alianzas globales:** Acuerdos como el *P

In [13]:
model_name = "o4-mini-rsv"

response = openai.chat.completions.create(model=model_name, messages=messages)
answer = response.choices[0].message.content

display(Markdown(answer))
competitors.append(model_name)
answers.append(answer)

Los avances en inteligencia artificial (IA) generativa tienen el potencial de transformar el acceso a la información, la comunicación y la participación cívica; pero al mismo tiempo plantean desafíos muy serios en términos de veracidad y confianza en las instituciones democráticas. A continuación se exponen sus posibles impactos, así como las responsabilidades clave de cada actor para mitigar riesgos:

1. Impactos en la percepción de la verdad y la confianza democrática  
   Beneficios potenciales  
   • Ampliación del acceso a la información: generación de resúmenes, traducciones y explicaciones adaptadas a distintos niveles de conocimiento.  
   • Mayor participación ciudadana: herramientas de debate y deliberación en línea que pueden facilitar foros inclusivos y personalizados.  
   • Transparencia inteligente: auditorías automáticas de datos públicos, informes generados por IA que identifiquen discrepancias en presupuestos o políticas.  
   • Innovación educativa y cultural: creación de contenidos didácticos, simulaciones históricas o recreaciones virtuales que fortalecen la ciudadanía crítica.  

   Riesgos y desafíos  
   • Desinformación y deepfakes: contenido fabricado difícil de distinguir de la realidad, socavando la confianza en medios e instituciones.  
   • Polarización y cámaras de eco: algoritmos que refuerzan sesgos y favorecen narrativas extremas, minando el consenso democrático.  
   • Ataques dirigidos: generación automatizada de mensajes fraudulentos o campañas de manipulación a gran escala.  
   • Erosión de la autoridad informativa: duda creciente sobre la fiabilidad de documentos oficiales, discursos políticos o datos estadísticos.  

2. Responsabilidades de los distintos actores  
   a) Desarrolladores de IA generativa  
     • Ética y “privacy by design”: incorporar desde el diseño mecanismos de protección de datos y principios éticos (no maleficencia, justicia, transparencia).  
     • Transparencia algorítmica: documentar y publicar los criterios de entrenamiento, límites de uso y procedimientos de corrección de sesgos.  
     • Herramientas de detección y marcado: facilitar APIs o plug-ins que identifiquen contenido sintético y permitan etiquetar claramente cuándo un texto, imagen o vídeo ha sido generado por IA.  
     • Auditorías independientes: someter modelos a pruebas externas de veracidad, sesgos y robustez frente a ataques de manipulación.  

   b) Gobiernos y reguladores  
     • Marcos normativos claros: legislar estándares mínimos de trazabilidad, identificación y responsabilidad legal para contenidos generados automática o semiautomáticamente.  
     • Colaboración internacional: promover acuerdos multilaterales que unifiquen criterios sobre deepfakes, desinformación y protección de datos.  
     • Inversión en alfabetización digital: impulsar programas educativos de pensamiento crítico, detección de noticias falsas y uso responsable de la IA.  
     • Supervisión y sanciones: asegurar que existan organismos capaces de investigar y penalizar el uso malicioso de tecnología (por ejemplo, campañas de desinformación en procesos electorales).  

   c) Usuarios y sociedad civil  
     • Espíritu crítico: practicar la verificación de fuentes, confrontar información y desconfiar de contenidos excesivamente sensacionalistas o coincidentes con prejuicios personales.  
     • Participación activa: apoyar iniciativas de fact-checking, denunciar deepfakes o cuentas automatizadas (bots) y ejercer la ciudadanía digital responsable.  
     • Consumo informado: preferir medios y plataformas que adopten estándares de transparencia en IA y revisen activamente la fiabilidad de sus contenidos.  
     • Colaboración en código abierto: contribuir, cuando sea posible, a proyectos comunitarios de detección de contenido sintético o bases de datos de deepfakes conocidos.  

3. Hacia un ecosistema responsable  
   • Enfoque multisectorial: la solución a gran escala requiere diálogo continuo entre empresas tecnológicas, academia, sociedad civil y poderes públicos.  
   • Fomento de la investigación social y ética: además de aspectos técnicos, estudiar en profundidad cómo la IA afecta dinámicas de confianza, participación y cohesión social.  
   • Cultura de la rendición de cuentas: cada actor debe rendir cuentas públicamente sobre decisiones de diseño, adopción de normas y resultados de auditorías.  

Conclusión  
Si bien la IA generativa ofrece oportunidades inéditas para mejorar la transparencia, el acceso a la información y la participación democrática, su potencial de distorsión de la verdad exige una gobernanza proactiva y compartida. Solo mediante la cooperación estrecha entre desarrolladores, gobiernos y ciudadanos —y un compromiso real con la ética y la educación digital— podremos aprovechar los beneficios sin sacrificar la confianza en nuestras instituciones democráticas.

## For the next cell, we will use Ollama

Ollama runs a local web service that gives an OpenAI compatible endpoint,  
and runs models locally using high performance C++ code.

If you don't have Ollama, install it here by visiting https://ollama.com then pressing Download and following the instructions.

After it's installed, you should be able to visit here: http://localhost:11434 and see the message "Ollama is running"

You might need to restart Cursor (and maybe reboot). Then open a Terminal (control+\`) and run `ollama serve`

Useful Ollama commands (run these in the terminal, or with an exclamation mark in this notebook):

`ollama pull <model_name>` downloads a model locally  
`ollama ls` lists all the models you've downloaded  
`ollama rm <model_name>` deletes the specified model from your downloads

<table style="margin: 0; text-align: left; width:100%">
    <tr>
        <td style="width: 150px; height: 150px; vertical-align: middle;">
            <img src="../assets/stop.png" width="150" height="150" style="display: block;" />
        </td>
        <td>
            <h2 style="color:#ff7800;">Super important - ignore me at your peril!</h2>
            <span style="color:#ff7800;">The model called <b>llama3.3</b> is FAR too large for home computers - it's not intended for personal computing and will consume all your resources! Stick with the nicely sized <b>llama3.2</b> or <b>llama3.2:1b</b> and if you want larger, try llama3.1 or smaller variants of Qwen, Gemma, Phi or DeepSeek. See the <A href="https://ollama.com/models">the Ollama models page</a> for a full list of models and sizes.
            </span>
        </td>
    </tr>
</table>

In [None]:
!ollama pull llama3.2

In [15]:
from openai import OpenAI

ollama = OpenAI(base_url='http://localhost:11434/v1', api_key='ollama')
model_name = "llama3.2"

response = ollama.chat.completions.create(model=model_name, messages=messages)
answer = response.choices[0].message.content

display(Markdown(answer))
competitors.append(model_name)
answers.append(answer)

Los avances en inteligencia artificial generativa tienen el potencial de transformar la forma en que percibimos la verdad y la confianza en las instituciones democráticas. A continuación, se presentan algunos de los desafíos y oportunidades que plantea este tema:

**Posibles beneficios:**

1. **Mejora de la precisión**: La inteligencia artificial generativa puede ayudar a mejorar la precisión en la toma de decisiones y la identificación de patrones, lo que podría llevar a una mayor confianza en las instituciones democráticas.
2. **Análisis más exhaustivos**: Los sistemas de inteligencia artificial generativa pueden analizar grandes cantidades de datos con mayor rapidez y eficiencia que los seres humanos, lo que podría ayudar a identificar patrones y tendencias que no son evidentes para el ojo humano.
3. **Apoyo a la toma de decisiones**: La inteligencia artificial generativa puede proporcionar apoyo informado a las tomas de decisiones, ayudando a priorizar opciones y evaluar riesgos.

**Posibles riesgos éticos y sociales:**

1. **Manipulación de información**: Los sistemas de inteligencia artificial generativa pueden ser utilizados para manipular la opinión publica o producir noticias falsas, lo que podría erosionar la confianza en las instituciones democráticas.
2. **Biases incorporados**: La inteligencia artificial generativa puede perpetuar y amplificar los sesgos existentes en la sociedad, lo que podría llevar a decisiones irrelevantes para ciertos grupos o comunidades.
3. **Vulnerabilidad a ataques cibernéticos**: Los sistemas de inteligencia artificial generativa pueden ser vulnerables a ataques cibernéticos y manipulación por parte de actores maliciosos.

**Responsabilidades y mitigaciones:**

1. Desarrolladores:
 * Garantizar que los algoritmos sean transparentes y explicables.
 * Implementar controles de seguridad robustos para prevenir ataques cibernéticos.
 * Promover la diversidad y la inclusión en el desarrollo de la inteligencia artificial generativa.
2. Gobiernos y autoridades:
 * Regulacón ética de la inteligencia artificial generativa.
 * Establecer estándares claros para la transparencia y la explicabilidad de los algoritmos.
 * Investigar y monitorear el impacto social de la inteligencia artificial generativa en las instituciones democráticas.
3. Usuarios:
 * Ser conscientes del potencial de sesgo en la información generada por la inteligencia artificial.
 * Utilizar críticamente la información generada y verificar su precisión.
 * Apoyar políticas y prácticas que promuevan la transparencia y la rendición de cuentas.

**Conclusión:**

Los avances en inteligencia artificial generativa plantean importantes desafíos y oportunidades para las instituciones democráticas. Es fundamental que los actores involucrados asuman responsabilidades y tomen medidas para mitigar impactos negativos, como la manipulación de información, el perpetuado de sesgos y la vulnerabilidad a ataques cibernéticos. La transparencia, la explicabilidad y la inclusión son clave para garantizar que estos sistemas se desarrollen y apliquen de manera responsable y ética.

In [16]:
# So where are we?

print(competitors)
print(answers)


['gpt-4.1-rsv', 'DeepSeek-R1-0528', 'o4-mini-rsv', 'llama3.2']
['La influencia de los avances en **inteligencia artificial generativa (IAG)** sobre la percepción de la verdad y la confianza en instituciones democráticas es profunda y multifacética. A continuación se detallan los posibles beneficios, riesgos, y responsabilidades de los actores involucrados:\n\n---\n\n**Beneficios potenciales:**\n\n1. **Mejor acceso a la información:** IAG puede facilitar la síntesis y divulgación de información compleja de manera accesible, promoviendo el conocimiento y la participación ciudadana.\n2. **Transparencia y análisis**: Herramientas automáticas pueden analizar grandes volúmenes de datos públicos, detectando corrupción o sesgos, y fomentando el escrutinio y la rendición de cuentas.\n3. **Inclusión:** IAG puede traducir, adaptar y personalizar información, acercando la política y los procesos democráticos a más personas.\n\n---\n\n**Riesgos éticos y sociales:**\n\n1. **Desinformación y manipula

In [17]:
# It's nice to know how to use "zip"
for competitor, answer in zip(competitors, answers):
    print(f"Competitor: {competitor}\n\n{answer}")


Competitor: gpt-4.1-rsv

La influencia de los avances en **inteligencia artificial generativa (IAG)** sobre la percepción de la verdad y la confianza en instituciones democráticas es profunda y multifacética. A continuación se detallan los posibles beneficios, riesgos, y responsabilidades de los actores involucrados:

---

**Beneficios potenciales:**

1. **Mejor acceso a la información:** IAG puede facilitar la síntesis y divulgación de información compleja de manera accesible, promoviendo el conocimiento y la participación ciudadana.
2. **Transparencia y análisis**: Herramientas automáticas pueden analizar grandes volúmenes de datos públicos, detectando corrupción o sesgos, y fomentando el escrutinio y la rendición de cuentas.
3. **Inclusión:** IAG puede traducir, adaptar y personalizar información, acercando la política y los procesos democráticos a más personas.

---

**Riesgos éticos y sociales:**

1. **Desinformación y manipulación:** La facilidad para crear textos, imágenes o vid

In [18]:
# Let's bring this together - note the use of "enumerate"

together = ""
for index, answer in enumerate(answers):
    together += f"# Response from competitor {index+1}\n\n"
    together += answer + "\n\n"

In [19]:
print(together)

# Response from competitor 1

La influencia de los avances en **inteligencia artificial generativa (IAG)** sobre la percepción de la verdad y la confianza en instituciones democráticas es profunda y multifacética. A continuación se detallan los posibles beneficios, riesgos, y responsabilidades de los actores involucrados:

---

**Beneficios potenciales:**

1. **Mejor acceso a la información:** IAG puede facilitar la síntesis y divulgación de información compleja de manera accesible, promoviendo el conocimiento y la participación ciudadana.
2. **Transparencia y análisis**: Herramientas automáticas pueden analizar grandes volúmenes de datos públicos, detectando corrupción o sesgos, y fomentando el escrutinio y la rendición de cuentas.
3. **Inclusión:** IAG puede traducir, adaptar y personalizar información, acercando la política y los procesos democráticos a más personas.

---

**Riesgos éticos y sociales:**

1. **Desinformación y manipulación:** La facilidad para crear textos, imágenes 

In [20]:
judge = f"""You are judging a competition between {len(competitors)} competitors.
Each model has been given this question:

{question}

Your job is to evaluate each response for clarity and strength of argument, and rank them in order of best to worst.
Respond with JSON, and only JSON, with the following format:
{{"results": ["best competitor number", "second best competitor number", "third best competitor number", ...]}}

Here are the responses from each competitor:

{together}

Now respond with the JSON with the ranked order of the competitors, nothing else. Do not include markdown formatting or code blocks."""


In [21]:
print(judge)

You are judging a competition between 4 competitors.
Each model has been given this question:

¿Cómo influirían los avances en inteligencia artificial generativa en la percepción global de la verdad y la confianza en las instituciones democráticas, considerando tanto los posibles beneficios como los riesgos éticos y sociales, y qué responsabilidades deberían asumir los distintos actores involucrados (desarrolladores, gobiernos, usuarios) para mitigar impactos negativos?

Your job is to evaluate each response for clarity and strength of argument, and rank them in order of best to worst.
Respond with JSON, and only JSON, with the following format:
{"results": ["best competitor number", "second best competitor number", "third best competitor number", ...]}

Here are the responses from each competitor:

# Response from competitor 1

La influencia de los avances en **inteligencia artificial generativa (IAG)** sobre la percepción de la verdad y la confianza en instituciones democráticas es p

In [22]:
judge_messages = [{"role": "user", "content": judge}]

In [None]:
# Judgement time!

openai = AzureOpenAI(
    azure_endpoint=openai_endpoint,
    api_key=openai_api_key,
    api_version="2025-01-01-preview"
)

response = openai.chat.completions.create(
    model="o4-mini-rsv",
    messages=judge_messages,
)

results = response.choices[0].message.content
print(results)


In [None]:
# OK let's turn this into results!

results_dict = json.loads(results)
ranks = results_dict["results"]
for index, result in enumerate(ranks):
    competitor = competitors[int(result)-1]
    print(f"Rank {index+1}: {competitor}")

<table style="margin: 0; text-align: left; width:100%">
    <tr>
        <td style="width: 150px; height: 150px; vertical-align: middle;">
            <img src="../assets/exercise.png" width="150" height="150" style="display: block;" />
        </td>
        <td>
            <h2 style="color:#ff7800;">Exercise</h2>
            <span style="color:#ff7800;">Which pattern(s) did this use? Try updating this to add another Agentic design pattern.
            </span>
        </td>
    </tr>
</table>

<table style="margin: 0; text-align: left; width:100%">
    <tr>
        <td style="width: 150px; height: 150px; vertical-align: middle;">
            <img src="../assets/business.png" width="150" height="150" style="display: block;" />
        </td>
        <td>
            <h2 style="color:#00bfff;">Commercial implications</h2>
            <span style="color:#00bfff;">These kinds of patterns - to send a task to multiple models, and evaluate results,
            are common where you need to improve the quality of your LLM response. This approach can be universally applied
            to business projects where accuracy is critical.
            </span>
        </td>
    </tr>
</table>