## Welcome to the Second Lab - Week 1, Day 3

Today we will work with lots of models! This is a way to get comfortable with APIs.

<table style="margin: 0; text-align: left; width:100%">
    <tr>
        <td style="width: 150px; height: 150px; vertical-align: middle;">
            <img src="../assets/stop.png" width="150" height="150" style="display: block;" />
        </td>
        <td>
            <h2 style="color:#ff7800;">Important point - please read</h2>
            <span style="color:#ff7800;">The way I collaborate with you may be different to other courses you've taken. I prefer not to type code while you watch. Rather, I execute Jupyter Labs, like this, and give you an intuition for what's going on. My suggestion is that you carefully execute this yourself, <b>after</b> watching the lecture. Add print statements to understand what's going on, and then come up with your own variations.<br/><br/>If you have time, I'd love it if you submit a PR for changes in the community_contributions folder - instructions in the resources. Also, if you have a Github account, use this to showcase your variations. Not only is this essential practice, but it demonstrates your skills to others, including perhaps future clients or employers...
            </span>
        </td>
    </tr>
</table>

In [5]:
# Start with imports - ask ChatGPT to explain any package that you don't know

import os
import json
from dotenv import load_dotenv
from openai import OpenAI
from anthropic import Anthropic
from IPython.display import Markdown, display

In [6]:
# Always remember to do this!
load_dotenv(override=True)

True

In [7]:
# Print the key prefixes to help with any debugging

openai_api_key = os.getenv('OPENAI_API_KEY')
anthropic_api_key = os.getenv('ANTHROPIC_API_KEY')
google_api_key = os.getenv('GOOGLE_API_KEY')
deepseek_api_key = os.getenv('DEEPSEEK_API_KEY')
groq_api_key = os.getenv('GROQ_API_KEY')

if openai_api_key:
    print(f"OpenAI API Key exists and begins {openai_api_key[:8]}")
else:
    print("OpenAI API Key not set")
    
if anthropic_api_key:
    print(f"Anthropic API Key exists and begins {anthropic_api_key[:7]}")
else:
    print("Anthropic API Key not set (and this is optional)")

if google_api_key:
    print(f"Google API Key exists and begins {google_api_key[:2]}")
else:
    print("Google API Key not set (and this is optional)")

if deepseek_api_key:
    print(f"DeepSeek API Key exists and begins {deepseek_api_key[:3]}")
else:
    print("DeepSeek API Key not set (and this is optional)")

if groq_api_key:
    print(f"Groq API Key exists and begins {groq_api_key[:4]}")
else:
    print("Groq API Key not set (and this is optional)")

OpenAI API Key exists and begins sk-proj-
Anthropic API Key not set (and this is optional)
Google API Key not set (and this is optional)
DeepSeek API Key not set (and this is optional)
Groq API Key not set (and this is optional)


In [8]:
request = "Please come up with a challenging, nuanced question that I can ask a number of LLMs to evaluate their intelligence. "
request += "Answer only with the question, no explanation."
messages = [{"role": "user", "content": request}]

In [9]:
messages

[{'role': 'user',
  'content': 'Please come up with a challenging, nuanced question that I can ask a number of LLMs to evaluate their intelligence. Answer only with the question, no explanation.'}]

In [10]:
openai = OpenAI()
response = openai.chat.completions.create(
    model="gpt-5-mini",
    messages=messages,
)
question = response.choices[0].message.content
print(question)


You're a senior advisor to the United Nations charged with drafting a comprehensive 15-year international agreement to govern the development and deployment of advanced general-purpose AI (systems capable of performing a wide range of human-level cognitive tasks). The agreement must minimize catastrophic and systemic risks, prevent abusive uses (including mass surveillance and autonomous weaponization), preserve and accelerate beneficial innovation, and ensure equitable global benefits—especially for low- and middle-income countries. In a single coherent proposal, (1) specify the core elements of the treaty (including clear definitions, a governance structure, obligations for states and private actors, verification and enforcement mechanisms, incentives and funding, technical safety and transparency standards, and an implementation timeline), (2) explain why each element is necessary and how it mitigates particular risks or trade-offs, (3) anticipate five major objections or attack vec

In [12]:
competitors = []
answers = []
messages = [{"role": "user", "content": question}, {"role": "user", "content": "Respond in russian"}]

## Note - update since the videos

I've updated the model names to use the latest models below, like GPT 5 and Claude Sonnet 4.5. It's worth noting that these models can be quite slow - like 1-2 minutes - but they do a great job! Feel free to switch them for faster models if you'd prefer, like the ones I use in the video.

In [14]:
# The API we know well
# I've updated this with the latest model, but it can take some time because it likes to think!
# Replace the model with gpt-4.1-mini if you'd prefer not to wait 1-2 mins

model_name = "gpt-5-nano"

response = openai.chat.completions.create(model=model_name, messages=messages)
answer = response.choices[0].message.content

display(Markdown(answer))
competitors.append(model_name)
answers.append(answer)

Ниже представлен единый по существу и координированный проект предложения международного соглашения на 15 лет по ответственному развитию и применению продвинутых систем общего назначения искусственного интеллекта (AGI). Документ рассчитан на минимизацию катастрофических и системных рисков, запрет abusive uses (массовый надзор, автономное оружие и пр.), сохранение и ускорение полезных инноваций и обеспечение глобальных выгод, особенно для стран с низким и средним уровнем дохода.

1) Ядро соглашения: основополагающие элементы

1.1. Определения и сфера применения
- Определение AGI: система искусственного интеллекта, способная автономно выполнять широкий спектр когнитивных задач на уровне или выше человеческого в нескольких доменах, с использованием междоменного переноса знаний, самообучения и долгосрочного принятия решений, включая адаптивность к изменяющимся условиям и возможность самоулучшения в пределах безопасной и контролируемой рамки.
- Неприменение: узконаправленные (narrow) ИИ-системы, не достигающие критерия AGI по объему задач и адаптивности.
- Сфера: все организации (государственные и негосударственные) и их поставщики услуг/инфраструктуры, включая исследовательские лаборатории, облачных провайдеров, производителей аппаратного обеспечения и крупных пользователей.

1.2. Цели соглашения
- Предотвращение катастрофических рисков и системных уязвимостей.
- Запрет массового слежения и автономного применения оружия.
- Содействие безопасной, транспарентной и подотчетной инновационной экосистеме.
- Гепрегулирование справедливого доступа к преимуществам AGI, включая LMIC.
- Развитие глобальных стандартов безопасности, этики и прозрачности.

1.3. Управляющая структура
- Учреждение: Глобальная комиссия по безопасности и управлению AGI (Global AI Safety and Governance Authority, GASGA), созданная в составе Организации Объединённых Наций или как наднациональный орган, действующий в рамках подписанного договора.
- Структура GASGA:
  - Исполнительный совет: представители государств-участников; председательские и ко‑председательские роли по ротации.
  - Ресурсные комитеты: специалисты по безопасности, правам человека, транспарентности, экономическим эффектам, развитию в регионах.
  - Совещательный статус: академические институты, гражданское общество, индустрия, региональные организации.
  - Механизм рассмотрения исков и споров: независимый арбитражный орган GASGA.
- Принятие решений: градации между консенсусом и квалифицированным большинством; обязательность правовых рекомендаций GASGA для участников.
- Обязательная отчетность и независимый надзор: регулярные аудиты, публикации по безопасностям и рискам; доступ к аудитам для общественного мониторинга.

1.4. Обязательства государств
- Право и обязанность обеспечить безопасное внедрение AGI внутри своей юрисдикции, внедрить национальные рамки управления рисками, лицензирования и аудита.
- Запрет на применение AGI для массового слежения и автономного оружия; запрет на развитие систем, которые создают необратимую угрозу существованию, базовым правам человека и международному миру.
- Обязательства по экспортному контролю и двойному использованию: строгие процедуры лицензирования и технических ограничений на передаче гаджетов, баз данных и моделей.
- Обязанности по сотрудничеству: обмен опытом, участие в международных тестах, совместные программы безопасной разработки, участие в региональных и глобальных проектах по безопасной разработке.
- Обязательства по финансированию: создание национальных и региональных фондов для исследований в области безопасности AGI, поддержки стран с низким и средним доходом.

1.5. Обязательства частного сектора и НКО
- Разработчики и поставщики AGI-услуг обязаны:
  - внедрять принципы безопасного проектирования («safety-by-design»), качественную верификацию, независимые аудиты и документацию процессов.
  - ежегодно предоставлять GASGA независимую сертификацию безопасности для каждого выпуска AGI-систем, подлежавшего коммерциализации.
  - соблюдать принципы приватности, защиты данных, недопущение дискриминации и ответственного использования.
  - публиковать описания возможностей и ограничений моделей (модель‑карты, технические спецификации, данные о тестах).
  - участвовать в международных тестах и верификациях, делиться результатами тестирования и исправлять выявленные проблемы.
- Привилегии и обязательства: возможность участия в испытательных «sandbox» и пилотных проектах с упрощенным надзором для ускорения инноваций, но без компрометации безопасности.

1.6. Верификация и принуждение
- Верификация: независимые аудиты, сертификация безопасности, проверки соответствия, система отчетности и «картам безопасности».
- Департаменты контроля: национальные органы, работающие в сотрудничестве с GASGA; международные инспекции по согласованию.
- Санкции: экономические и политические меры, запреты на доступ к рынкам, лицензирования, временные ограничения на развертывания, до устранения нарушений.
- Разрешение споров: многоступенчатая система GASGA, арбитраж и периодические переговоры; в случае длительных конфликтов — обращение в Совбез ООН.

1.7. Инцентивы и источники финансирования
- Глобальный фонд AGI для стран с низким и средним доходом: финансирование НКО, академических и исследовательских инициатив.
- Налоговые и субсидии на безопасные разработки, страхование ответственности, кредитование «безопасного внедрения».
- Прямые гранты на открытую разработку стандартов, инструментов аудита и тестов для меньших участников рынка.
- Механизмы совместного финансирования для региональных инициатив, обмен опытом, обучение и техническая помощь.

1.8. Технические стандарты безопасности и транспарентности
- Требования к совместимости и совместной работе безопасных систем:
  - Оценка согласованности целей (goal alignment) и ценностной согласованности (value alignment).
  - Контроль над распределением и управлением данными, защита приватности, проверяемость данных.
  - Робустность к дрейфу распределения, устойчивость к манипуляциям и отказоустойчивость.
  - Прозрачность: модели и их ограничения; методики тестирования; внешняя верификация.
  - Документация: «модель-карты» (описание, диапазоны применимости, риски, способы смягчения).
  - Пребывание в рамках этических и правовых норм, недопустимость дискриминации и вредных последствий для прав человека.
- Промежуточные и ежегодные требования для обновления стандартов по мере технологического прогресса.

1.9. План внедрения и временная шкала
- Модель на 15 лет, с фазами:
  - Год 1–2: ратификация, создание GASGA, базовые национальные рамки, начальные пилоты, разработка общемировых стандартов.
  - Год 3–5: унификация базовых стандартов, запуск районных и глобальных аудитов, начало финансовой поддержки для LMIC, расширение обязательств для частного сектора.
  - Год 6–8: расширение сертификаций, активная диверсификация источников финансирования, усиленные экспортные режимы и контроль за оборотом технологий двойного использования.
  - Год 9–12: нарастающее равенство доступа к возможностям AGI в разных регионах, систематическая оценка воздействия и корректировка политики.
  - Год 13–15: устойчивое функционирование глобальной системы, периодические обзоры и обновления, подготовка к следующему раунду регулирования в связи с новыми технологическими прорывами.
- Пересмотр и адаптация: регулярные (каждые 3–5 лет) обновления договора на основе новой научной информации и практического опыта.

2) Обоснование каждого элемента и их роль в управлении рисками

- Определения и сфера применения: устранение лазеек в трактовке, отделение AGI от узконаправленного ИИ, обеспечение охвата всех релевантных акторов и инфраструктур.
- Глобальная управляющая структура GASGA: единая координационная рамка снижения риска «регуляторной конкуренции» между странами, устранение деструктивной конкуренции, ускорение обмена знаниями и безопасных практик.
- Обязательства государств: ответственность за безопасность на своей территории, предотвращение злоупотреблений и принуждение к соблюдению на государственном и отраслевом уровнях.
- Обязательства частного сектора: принципы прозрачности и подотчетности, снижение рисков эксплуатации систем в ущерб людям, обеспечение возможности независимого аудита и общественного надзора.
- Верификация и принуждение: предотвращение «локального» отсутствия ответственности, создание реалистичных и проверяемых механизмов, которые не завышают затраты для добросовестных игроков и не создают лазейки.
- Финансирование и стимулы: устранение барьеров для участия LMIC, поддержка безопасного и устойчивого инновационного процесса, минимизация неравенств в распределении выгод.
- Технические стандарты безопасности и транспарентности: унифицируют принципы безопасного проектирования, повышают доверие к системам AGI, облегчают независимый аудит и проверку.
- План внедрения: позволяет управлять рисками в долгосрочной перспективе, поддерживает адаптивность к быстро меняющимся технологиям и экономическим условиям.
- Механизм прозрачности: публикации, отчеты и аудиты снижают риск скрытых угроз и улучшают доверие между государствами, бизнесом и гражданским обществом.
- Меры по развитию в LMIC: компенсации, обучение, доступ к инновациям, чтобы сохранить глобальную кооперацию и избежать «цикла неравенства».

3) Пять основных возражений и конкретные ответы/соглашения (для разных стейкхолдеров)

- Возражение 1. Со стороны могущественных государств: потеря стратегического преимущества и суверенного контроля, сверхрегуляторные ограничения.
  Ответ/аккомодации:
  - Включение принципа суверенного пространства: государства сохраняют право на собственные гибкие режимы внедрения в рамках базового глобального стандарта.
  - Введение поэтапной гармонизации, с «ускоренными дорожными картами» для безопасных пилотных программ, куда можно допускать исключения при условии строгого надзора.
  - Согласование механизмов взаимного признания сертификаций и совместных рамок экспортного контроля, чтобы не блокировать легитимные исследования и сотрудничество.

- Возражение 2. Со стороны стартапов и малого бизнеса: тяжелые издержки на сертификацию, бюрократия и риск «перегрузки» регуляторами.
  Ответ/аккомодации:
  - Тонкая настройка регуляторной нагрузки через «градацию по риску» и размеру компании; расширение «sandbox»-площадок и ускоренная сертификация для небольших разработчиков.
  - Предоставление финансовой и технической поддержки: гранты, доступ к консорциумам сертификации, совместные инфраструктурные проекты.
  - Прозрачные руководящие принципы и готовые инструменты для внедрения безопасного проектирования, документации и аудита.

- Возражение 3. Со стороны гражданского общества: опасения по поводу массовых правонарушений, слежки и нарушения приватности.
  Ответ/аккомодации:
  - Четкие запреты на массовый надзор, сильная защита приватности, независимый надзор за государственным использованием AGI.
  - Обязательность публикаций по характеристикам систем и механизмам аудита; участие гражданского общества в региональных форумах и обзорах.
  - Программы защиты и возврата контроля: возможность человеко-центрированной остановки системы и «kill-switch» в критических случаях.

- Возражение 4. Со стороны авторитарных режимов: ограничения, которые мешают жесткому контролю над информацией и внешнеполитическим влияниям.
  Ответ/аккомодации:
  - Принцип равного применения норм ко всем государствам; механизмы разрешения на особые режимы, где это безопасно и чётко ограничено.
  - Включение механизмов человеческих прав в базовые требования и регулярные проверки по соблюдению прав человека и гражданских свобод.
  - Разрешение на совместную работу в гуманитарных и экстренных целях без доступа к чувствительным данным или системной слежке.

- Возражение 5. Со стороны технических исследователей: опасения по поводу «прозрачности» и риска раскрытия технологической информации.
  Ответ/аккомодации:
  - Установление принципа прозрачности без риска нарушения безопасности: публикация методологий тестирования, моделей, карточек безопасности без раскрытия коммерчески чувствительных деталей.
  - Разрешение на безопасную публикацию и открытые регистры для оценки рисков, с процедурами «рисковый порог» и ограничениями для особо чувствительных материалов.
  - Платформа международного обмена методологиями аудита и тестирования с защитой интеллектуальной собственности и данных.

4) Пять измеряемых показателей для ежегодного отслеживания

- М1. Уровень сертификации безопасности: доля развертываний AGI, прошедших независимую сертификацию в год.
- М2. Глобальная доступность для LMIC: индекс доступа LMIC к вычислительным мощностям, данным и API AGI (доля LMIC-организаций, получающих доступ, сумма выданных лицензий и грантов).
- М3. Прозрачность и аудит: число опубликованных «модель‑карт» и документаций по системам, число внешних аудиторских отчётов и их публикация.
- М4. Соответствие правам человека: доля развертываний с применением приватности и защиты данных (privacy-preserving measures), соответствие запретам на массовый надзор и автономное оружие (независимый мониторинг).
- М5. Эгалитарность и участие в управлении: число стран-участников GASGA, доля региональных комитетов и исследовательских центров в рамках сотрудничества; количество LMIC-инициатив в рамках глобальных проектов по безопасной разработке.

5) Три наиболее вероятные сценарии провала договора и конкретные планы устойчивости

- Провал 1. Значительная несогласованность крупных игроков: несоблюдение норм, обход через лазейки, «регуляторная конкуренция».
  Контингент и меры:
  - Мониторинг риска и раннее выявление; введение секций санкций, торговых ограничений и запретов на доступ к рынкам для нарушителей.
  - Ужесточение надзора через расширение глобальных аудитов и инспекций, усиление роли GASGA в принятии решений.
  - Расширение коалиций, взаимная проверка и автоматическое включение новых стран в группу участников; ускорение правовых механизмов для устранения лазеек.

- Провал 2. Фрагментация норм и разночтения в национальных системах: различие в регуляторной архитектуре разрушает объективную гармонизацию.
  Контингент и меры:
  - Разработка и принятие общих руководящих документов, базовых норм и минимальных стандартов, которые являются обязательными.
  - Введение механизмов взаимного признания сертификаций, региональных «поясов безопасной разработки» в рамках региональных соглашений, а также программы поддержки странные реформ.
  - Создание открытого канала коммуникаций и периодических форумов, где стороны согласуют изменения и решают разночтения.

- Провал 3. Быстрое технологическое развитие выходит за пределы существующих регуляторных рамок: риск «догонять» регуляцию и задержки инноваций.
  Контингент и меры:
  - Включение динамических процедур ревизии норм; регулярные (каждые 12–18 месяцев) обновления базовых стандартов.
  - Введение временных «краевых» мер безопасности (эмерджент-режим) — при угрозе мгновенной опасности — временная приостановка определённых функций или ограничение использования до устранения рисков.
  - Создание реактивной команды GASGA по мониторингу технологического прогресса и оперативного информирования государств и организаций, чтобы не допускать непредвиденного роста опасности.

6) Резюме и практические шаги к реализации

- Ратификация и учредительные действия: подписание договора и создание GASGA; формирование национальных органов под эгидой GASGA.
- Разработка и внедрение базовых стандартов безопасности и транспарентности; запуск пилотных проектов в региональном масштабе; создание фонда для поддержки LMIC.
- Организация ежегодной отчетности, аудитов, публикаций и форумов по безопасной разработке AGI.
- Налаживание взаимного признания сертификаций и регулирование экспорта и двойного использования технологий.
- Мониторинг и пересмотр: регулярные оценки рисков, адаптация политики на основе научной эвиденции.

Дополнительные примечания
- Гибкость и адаптация: соглашение должно быть гибким документом, который может расширяться по мере появления новых угроз и возможностей, оставаясь привязано к базовым принципам безопасности, прав человека и справедливости.
- Баланс инноваций и защиты: основные принципы должны поддерживать стимулы к инновациям, но без компрометации безопасности и приватности.

Если требуется, могу подготовить более детальные разделы по каждому элементу, а также черновой текст текста договора на дипломатическом языке, включая формулировки для дипломатических нотаций и правовых положений.

In [None]:
# Anthropic has a slightly different API, and Max Tokens is required

model_name = "claude-sonnet-4-5"

claude = Anthropic()
response = claude.messages.create(model=model_name, messages=messages, max_tokens=1000)
answer = response.content[0].text

display(Markdown(answer))
competitors.append(model_name)
answers.append(answer)

In [None]:
gemini = OpenAI(api_key=google_api_key, base_url="https://generativelanguage.googleapis.com/v1beta/openai/")
model_name = "gemini-2.5-flash"

response = gemini.chat.completions.create(model=model_name, messages=messages)
answer = response.choices[0].message.content

display(Markdown(answer))
competitors.append(model_name)
answers.append(answer)

In [None]:
deepseek = OpenAI(api_key=deepseek_api_key, base_url="https://api.deepseek.com/v1")
model_name = "deepseek-chat"

response = deepseek.chat.completions.create(model=model_name, messages=messages)
answer = response.choices[0].message.content

display(Markdown(answer))
competitors.append(model_name)
answers.append(answer)

In [None]:
# Updated with the latest Open Source model from OpenAI

groq = OpenAI(api_key=groq_api_key, base_url="https://api.groq.com/openai/v1")
model_name = "openai/gpt-oss-120b"

response = groq.chat.completions.create(model=model_name, messages=messages)
answer = response.choices[0].message.content

display(Markdown(answer))
competitors.append(model_name)
answers.append(answer)


## For the next cell, we will use Ollama

Ollama runs a local web service that gives an OpenAI compatible endpoint,  
and runs models locally using high performance C++ code.

If you don't have Ollama, install it here by visiting https://ollama.com then pressing Download and following the instructions.

After it's installed, you should be able to visit here: http://localhost:11434 and see the message "Ollama is running"

You might need to restart Cursor (and maybe reboot). Then open a Terminal (control+\`) and run `ollama serve`

Useful Ollama commands (run these in the terminal, or with an exclamation mark in this notebook):

`ollama pull <model_name>` downloads a model locally  
`ollama ls` lists all the models you've downloaded  
`ollama rm <model_name>` deletes the specified model from your downloads

<table style="margin: 0; text-align: left; width:100%">
    <tr>
        <td style="width: 150px; height: 150px; vertical-align: middle;">
            <img src="../assets/stop.png" width="150" height="150" style="display: block;" />
        </td>
        <td>
            <h2 style="color:#ff7800;">Super important - ignore me at your peril!</h2>
            <span style="color:#ff7800;">The model called <b>llama3.3</b> is FAR too large for home computers - it's not intended for personal computing and will consume all your resources! Stick with the nicely sized <b>llama3.2</b> or <b>llama3.2:1b</b> and if you want larger, try llama3.1 or smaller variants of Qwen, Gemma, Phi or DeepSeek. See the <A href="https://ollama.com/models">the Ollama models page</a> for a full list of models and sizes.
            </span>
        </td>
    </tr>
</table>

In [None]:
!ollama pull llama3.2

In [13]:
ollama = OpenAI(base_url='http://localhost:11434/v1', api_key='ollama')
model_name = "llama3.2"

response = ollama.chat.completions.create(model=model_name, messages=messages)
answer = response.choices[0].message.content

display(Markdown(answer))
competitors.append(model_name)
answers.append(answer)

Я могу предоставить своиthoughtы по теме международного соглашения governing развития и развертывания продвигающихся обобщенных цифровых интеллектуальных систем (SYS сочетающих в себе широкий спектр кognитивных способностей, наparable с человеческими).

**Предложение международного договора**

1. **Коренные элементы соглашения:**
* Описание: «Международный договор о цифровых интеллектуальных системах» (МДС).
* Очарность: Овощеенглинец, латышь, немецкий, испанский и арабский языки.
* Договор обусловлен следующими критериями:
 + Зазначение цифровых интеллектуальных систем для защиты человечества и окружающей среды от рисков их применения.
 + Сортирумент и установка границ ее применения
 + Руководство по применению цифры в области здравоохранения, образовательной и технологической деятельности
* Ожидаемые результаты:
  • Предотвращение злоупотреблений и рисков из-за применения SYS.
  • Наклада развития нации в области изложения и использования(sys), а также содействие его освоению для выгоды всех участвующих государств-членов, не обогащаясь ни одной группой отдельных лиц или национальностей.
2. Занимая свою позицию, МДС будет способствовать:
 + Побудет содействеством разумного и устойчивого развития цифровых интеллектуальных систем в сочетаении с необходимостью почетной защиты и расширения их приложений для всеобщего блага.
 + Понизит затраты, связанные с злоупотреблениями SYS, включая стоимость правонарушений, морального вреда и экономических последствий их применения.

3. **Коренные элементы соглашения:**
*_defines_the_term_of_a_digital_intellectual_system_: А digital _системa_ (DIS) или_а цифровые интеллектуальные системы (SYS)_ — это сложно системное изобретение с вычислительной мощностью, способная справедливости и с точки зрения управления и адаптируйся к реалиях нашего современной цифрового мира, ориентированной на индивидуализм. DIS должно быть способным преодолеить границы традиционных государственных рамок, обеспечивая его общую доступность для всех заинтересованных сторон.
*  **Государственная структура**: Международный договор имеет вид Долгосрочной Контекстной Акции (МКЕ).
*  Ожидаемая дата начала работы: 2027 год.
*  Ожидаемая дата завершения: 2042 год.

4. **Обязательности для государств и частных участников**: States и Private Actors (PA) будут обязаны:

* подписать заявление на МКЕ
* предоставлять отчеты о достижениях по цифровым интеллектуальным системам в их национальной территории на каждые 3 года.
* обеспечить безопасность их цифrovoi_intellectual_systems, и использовать его исключительно с целью всеобщей выгоды для человека, окружающей среды и социальной безопасности.

5. **Верификация и принятия мер по enforcement**: Более того, в accord MMD будет предусмотрено:
*   Патентное право не защищает младше 5 лет after his publication (с учетом расположения внешней электронной карты)
* Стороны должны предоставлять отчеты по достижениям, что позволит отслеживать успехи и выlesenные линейных прогресс, как для Мировой организции МКЕ, так и государстве-члену.
*   International Organization for Standardization (ISO) будет вnehлтам в состав МГД для предоставления рекомендаций по безопасности цифровых интеллектуальных систем.

6.  Ин센ы и финансирование: International Organization for Standardization (ISO), World Health Organization (WHO), United Nations Educational, Scientific and Cultural Organization (UNESCO) и andere важные международныеOrganizacii будут предоставлять рекомендации по безопасности цифровых интеллектуальных систем.
* International Organization of Standardization will provide recommendations for the Safe implementation of these systems. The above Recommendations should be based on ISO/IEC 27001,2019 standards.
* International organization of standardisation to do is: to implement rules and standards in conformity with ISO/IEC 27002.
### Модель управления.
M КЕ будет управлять по принципам «Сердечная и инклюзивная» MDR – как бы это было невозможно.

In [None]:
# So where are we?

print(competitors)
print(answers)


In [None]:
# It's nice to know how to use "zip"
for competitor, answer in zip(competitors, answers):
    print(f"Competitor: {competitor}\n\n{answer}")


In [None]:
# Let's bring this together - note the use of "enumerate"

together = ""
for index, answer in enumerate(answers):
    together += f"# Response from competitor {index+1}\n\n"
    together += answer + "\n\n"

In [None]:
print(together)

In [None]:
judge = f"""You are judging a competition between {len(competitors)} competitors.
Each model has been given this question:

{question}

Your job is to evaluate each response for clarity and strength of argument, and rank them in order of best to worst.
Respond with JSON, and only JSON, with the following format:
{{"results": ["best competitor number", "second best competitor number", "third best competitor number", ...]}}

Here are the responses from each competitor:

{together}

Now respond with the JSON with the ranked order of the competitors, nothing else. Do not include markdown formatting or code blocks."""


In [None]:
print(judge)

In [None]:
judge_messages = [{"role": "user", "content": judge}]

In [None]:
# Judgement time!

openai = OpenAI()
response = openai.chat.completions.create(
    model="gpt-5-mini",
    messages=judge_messages,
)
results = response.choices[0].message.content
print(results)


In [None]:
# OK let's turn this into results!

results_dict = json.loads(results)
ranks = results_dict["results"]
for index, result in enumerate(ranks):
    competitor = competitors[int(result)-1]
    print(f"Rank {index+1}: {competitor}")

<table style="margin: 0; text-align: left; width:100%">
    <tr>
        <td style="width: 150px; height: 150px; vertical-align: middle;">
            <img src="../assets/exercise.png" width="150" height="150" style="display: block;" />
        </td>
        <td>
            <h2 style="color:#ff7800;">Exercise</h2>
            <span style="color:#ff7800;">Which pattern(s) did this use? Try updating this to add another Agentic design pattern.
            </span>
        </td>
    </tr>
</table>

<table style="margin: 0; text-align: left; width:100%">
    <tr>
        <td style="width: 150px; height: 150px; vertical-align: middle;">
            <img src="../assets/business.png" width="150" height="150" style="display: block;" />
        </td>
        <td>
            <h2 style="color:#00bfff;">Commercial implications</h2>
            <span style="color:#00bfff;">These kinds of patterns - to send a task to multiple models, and evaluate results,
            are common where you need to improve the quality of your LLM response. This approach can be universally applied
            to business projects where accuracy is critical.
            </span>
        </td>
    </tr>
</table>