# A Survey of AI Agent Protocols

**Yingxuan Yang, Huacan Chai, Yuanyi Song, Siyuan Qi, Muning Wen, Ning Li, Junwei Liao, Haoyi Hu, Jianghao Lin, Gaowei Chang (†), Weiwen Liu, Ying Wen, Yong Yu, Weinan Zhang**  
*Shanghai Jiao Tong University*  
† *ANP Community*  

**Contact:** zoeyyx@sjtu.edu.cn, chiangel@sjtu.edu.cn, wnzhang@sjtu.edu.cn  

\*Corresponding author.

## Abstract

대규모 언어 모델(LLM)의 급속한 발전은 고객 서비스, 콘텐츠 생성, 데이터 분석, 심지어 헬스케어에 이르기까지 다양한 산업 분야에서 LLM 에이전트의 폭넓은 배포로 이어졌다. 그러나 LLM 에이전트의 활용이 증가함에 따라 중대한 문제가 등장했다. 이들 에이전트가 외부 도구나 데이터 소스와 소통할 수 있는 표준화된 방식이 없다는 것이다. 이러한 표준 프로토콜의 부재는 에이전트 간의 협업이나 확장성을 어렵게 만들며, 복잡하고 현실적인 과제를 해결하는 능력도 제한한다. LLM 에이전트를 위한 통합된 통신 프로토콜은 이러한 문제를 해결할 수 있다. 통합 프로토콜은 에이전트와 도구 간의 원활한 상호작용을 가능하게 하고, 협업을 촉진하며, 집단 지능의 형성을 유도할 수 있다.

본 논문에서는 기존 에이전트 프로토콜에 대한 최초의 종합적 분석을 제공하며, 문맥 중심(context-oriented) 프로토콜과 에이전트 간(inter-agent) 프로토콜, 범용(general-purpose) 프로토콜과 도메인 특화(domain-specific) 프로토콜을 구분하는 체계적인 이차원 분류 체계를 제안한다. 또한 보안성, 확장성, 지연 시간 등의 핵심 요소를 기준으로 기존 프로토콜의 성능을 비교 분석하였다. 나아가 차세대 에이전트 프로토콜이 갖추어야 할 중요한 연구 방향과 특성들을 식별함으로써 향후 프로토콜의 발전 방향을 조망한다. 이러한 특성에는 적응성, 프라이버시 보장, 집단 기반 상호작용이 포함되며, 계층형 아키텍처 및 집단 지능 기반 인프라로의 전환 추세도 포함된다. 본 연구는 지능형 에이전트를 위한 견고한 통신 인프라를 설계, 평가 또는 통합하려는 연구자와 엔지니어 모두에게 실질적인 참고 자료가 되기를 기대한다.

Key Words: AI Agent Protocol, AI Agent, Agent Protocol Evaluation, LLMs

## 1 Introduction 

대규모 언어 모델(LLM)의 급속한 발전과 함께, LLM 에이전트¹는 자동화된 고객 서비스, 콘텐츠 생성, 데이터 분석, 의료 지원 등 다양한 산업 분야에서 점점 더 널리 활용되고 있으며(OpenAI et al., 2024; Gottweis et al., 2025; Yang et al., 2025a; Guo et al., 2024; Zhou et al., 2024), 이는 우리의 일상 업무와 삶을 변화시키고 있다. 에이전트의 잠재력을 완전히 활용하기 위해, 에이전트와 외부 개체 간의 통신을 용이하게 하기 위한 다양한 아키텍처가 등장하였다. 이러한 외부 개체에는 에이전트가 직접 제어하지 않는 다양한 데이터 소스 및 도구뿐 아니라, 다른 온라인 에이전트도 포함된다.

그러나 적용 시나리오의 범위가 확장되고 서로 다른 구조를 가진 다양한 벤더의 에이전트가 등장하면서, 에이전트와 외부 개체 간의 상호작용 규칙은 점점 더 복잡해지고 있다. 이러한 진화 과정의 핵심 병목은 표준화된 프로토콜의 부재이다. 이로 인해 앞서 언급한 자원들과의 상호운용성이 저해되고(Qu et al., 2025; Patil et al., 2023; Liu et al., 2024), 에이전트가 외부 기능을 효과적으로 활용하는 데 한계가 생긴다. 또한, 표준 프로토콜이 없다는 점은 서로 다른 제공자나 아키텍처를 가진 에이전트 간의 원활한 협업을 어렵게 만들며, 에이전트 네트워크의 확장성을 제한한다. 궁극적으로 이는 에이전트가 더 복잡한 현실 문제를 해결할 수 있는 능력을 제한하게 된다.

이러한 문제는 초기 인터넷이 호환되지 않는 시스템과 제한된 연결성으로 인해 분절되어 있었던 컴퓨팅 역사 속 중대한 시기를 떠올리게 한다. 오늘날 LLM 에이전트 환경도 유사한 고립 상태에 놓여 있다. TCP/IP와 HTTP 프로토콜이 기술적 문제 해결을 넘어, 전례 없는 글로벌 연결성과 혁신, 가치 창출의 시대를 열었던 것처럼, 에이전트 시스템을 위한 통합 프로토콜도 단순히 상호운용성 문제를 해결하는 것을 넘어서, 보다 근본적인 전환을 이끌 수 있다. 그것은 바로 지능이 연결된 네트워크의 창출이다(Rajaei, 2024; Yang et al., 2024; Chen et al., 2024; Yang et al., 2025b).

이러한 표준화는 다양한 형태의 지능이 시스템 간을 자유롭게 흐르도록 하며, 내장형 지능을 가진 도구와 특화된 에이전트가 원활히 상호작용함으로써, 개별 구성요소를 능가하는 집단 지능의 새로운 형태를 창출할 수 있게 한다. 이 지능 네트워크는 "도구 지능"과 "에이전트 지능" 간의 인위적인 장벽을 허물고, 이들이 동적으로 결합되고 증폭되며 상호보완될 수 있도록 만든다. 특화된 에이전트들은 복잡한 문제를 해결하기 위해 일시적 연합을 구성할 수 있고, 지능형 도구는 다수의 에이전트 능력을 동시에 확장할 수 있으며, 이와 같은 표준화된 상호작용으로부터 전혀 새로운 인지 아키텍처가 탄생할 수 있다. 그 결과는 단순한 자동화의 효율성 향상을 넘어, 기존의 고립된 시스템으로는 해결할 수 없는 과제들을 다룰 수 있는 분산형 협력 지능의 새로운 패러다임이 될 것이다.

이와 같은 한계를 해결하기 위해, 현재의 연구들은 프로토콜 표준화를 지속적으로 추진하고 있다. 예를 들어, 에이전트와 자원 간 통신에 있어 Anthropic은 Model Context Protocol(MCP)(Anthropic, 2024)을 제안했다. MCP는 LLM 에이전트와 외부 자원 간의 문맥 획득을 표준화하여, 에이전트가 외부 데이터 및 도구와 효과적으로 통신할 수 있게 함으로써, 에이전트의 지식을 증강시키고 복잡한 현실 문제를 보다 효율적으로 해결할 수 있도록 해준다. 이와 유사하게, Agent Network Protocol(ANP)(Chang, 2024), Agent-to-Agent(A2A)(Google, 2025)와 같은 프로토콜들은 다양한 제공자와 구조를 가진 에이전트들이 다중 에이전트 시나리오에서 협업할 수 있도록 지원한다.

하지만 이러한 프로토콜들이 빠르게 발전하고 있음에도 불구하고, 에이전트 프로토콜에 대한 체계적인 분석과 서베이가 부족하여, 사용자와 개발자는 실제 다양한 프로토콜을 활용하는 데 있어 많은 어려움을 겪는다. 사용자와 개발자에게 가장 시급한 과제는, 다양한 프로토콜 간의 유사점과 차이점을 분석하고 분류하는 것이며, 각 프로토콜의 성능 특성을 비교 분석하는 것이다.

이 서베이에서는 기존의 에이전트 프로토콜에 대한 최초의 포괄적인 분석을 제공한다. 우리는 다양한 프로토콜에 대한 정밀한 조사를 통해, 현재 존재하는 프로토콜을 체계적으로 분류하고, 그에 대한 명확한 프레임워크를 제시함으로써, 사용자와 개발자가 특정 시나리오에 가장 적합한 프로토콜을 선택할 수 있도록 돕는다.

¹ 본 논문에서는 간결한 표현을 위해 멀티모달 LLM 개념(Caffagni et al., 2024)을 LLM 개념에 통합하여 다룬다.

<img src="./images/fig_01_01.png" width=800>

그림 1: 에이전트 인터넷 생태계의 계층형 아키텍처.  
다양한 주요 차원(보안, 확장성, 지연 시간 등)에 걸쳐 여러 프로토콜의 성능을 분석함으로써, 향후 에이전트 프로토콜에 대한 연구와 실용적 적용에 유용한 통찰을 제공한다. 마지막으로 우리는 LLM 에이전트 프로토콜의 미래적 전망을 탐색하며, 적응성, 프라이버시 보호, 그룹 기반 상호작용과 같은 진화하는 에이전트 생태계를 지원하기 위해 차세대 프로토콜이 갖추어야 할 주요 특성을 제시한다.

요약하자면, 본 연구는 다음과 같은 중요한 기여를 한다:

- 에이전트 프로토콜에 대해 최초로 체계적인 이차원 분류(context-oriented vs. inter-agent, general-purpose vs. domain-specific)를 제안하여 명확한 조직적 프레임워크를 제공한다.
- 현재의 에이전트 프로토콜을 효율성, 확장성, 보안성, 신뢰성 등 주요 기준에 따라 정성적으로 분석하여, 다양한 적용 환경에서의 상대적 강점과 한계를 밝혀낸다.
- 진화 가능한 구조, 프라이버시 인식, 그룹 협업 중심의 프로토콜로의 전환, 계층형 아키텍처와 집단 지능 인프라의 등장 등 단·중·장기적 관점에서 에이전트 프로토콜의 발전 방향과 주요 트렌드를 제시한다.

---

## 2 Preliminaries 

이 섹션에서는 이후의 서베이와 분석을 이해하는 데 필수적인 기초 개념들을 소개한다. 먼저 LLM 에이전트를 정의하고, 이들의 핵심 특징을 논의한다. 이후, 에이전트 프로토콜의 개념과 LLM 생태계 내에서의 근본적인 역할을 소개한다.

### 2.1 Definition and Characteristics of LLM agents

LLM 에이전트는 대형 언어 모델의 정교한 언어 처리 능력을 자율적인 의사결정 프레임워크와 결합함으로써 인공지능 분야에서 주목할 만한 발전을 나타낸다 (Yao et al., 2022; Tang et al., 2023; Hong et al., 2024). 구체적으로, 이들 에이전트는 순차적 추론이 요구되는 복잡한 텍스트 출력을 생성할 수 있는 고도화된 시스템이며, 미래 지향적인 계획 수립, 과거 상호작용에 대한 문맥적 기억 유지, 외부 도구 사용을 통해 상황에 맞는 응답과 원하는 커뮤니케이션 스타일에 적응하는 능력을 보인다.

<img src="./images/fig_01_02.png" width=800>

Figure 2: 에이전트 프로토콜 발전 흐름 개요.

LLM 에이전트를 일반적인 대형 언어 모델과 구별 짓는 것은 이들의 아키텍처 구성과 운영 능력이다. 일반적인 LLM은 입력 프롬프트에 따라 텍스트 생성을 중심으로 작동하는 반면, 에이전트는 실제 환경에서 자율적으로 작동하도록 설계된다. LLM 에이전트의 핵심 아키텍처는 일반적으로 다음 구성 요소로 이루어진다:

- **파운데이션 모델**: LLM 기반 에이전트의 중심은 파운데이션 모델(Zhao et al., 2025; Yin et al., 2024)이며, 일반적으로 대형 언어 모델 또는 멀티모달 대형 모델로, 추론, 언어 이해, 멀티모달 정보 해석 등의 기본 능력을 제공한다.
- **메모리 시스템**: LLM 에이전트는 단기 및 장기 메모리 컴포넌트를 구현하여 상호작용 간 문맥을 유지하고, 향후 사용을 위한 관련 정보를 저장한다 (Zhang et al., 2024; Yang et al., 2025b). 이러한 이중 메모리 시스템은 대화를 지속적으로 유지하고 시간이 지남에 따라 지식을 축적하는 것을 가능하게 한다.
- **계획(Planning)**: 계획 기능은 에이전트 연구의 핵심 요소로, 복잡한 작업을 더 작고 관리 가능한 하위 작업으로 분해할 수 있도록 한다. 이러한 계획 메커니즘은 전략적인 문제 해결을 가능하게 하며, 에이전트의 의사결정 과정을 더 해석 가능하고 투명하게 만든다.
- **도구 사용**: LLM은 수학적 추론, 논리 연산, 훈련 범위를 벗어난 지식 측면에서 한계가 있지만, 에이전트는 외부 도구와 API를 통합함으로써 이러한 제약을 극복한다 (Wang et al., 2023; Schick et al., 2023; Qu et al., 2025; Liu et al., 2024). 체계적인 도구 호출을 통해, 에이전트는 복잡한 질의에 대해 기능성과 정확도를 크게 확장한다.
- **행동 실행**: API 호출, 데이터베이스 질의, 외부 시스템과의 상호작용 등을 통해 환경과 직접 상호작용하며 행동을 실행하는 능력도 포함된다 (Liu et al., 2023; Yang et al., 2025a).

위의 아키텍처 컴포넌트는 현대 LLM 에이전트의 기초 구조를 형성한다. 이러한 구조를 바탕으로, 최근 학계와 산업계 모두에서 에이전트의 역량과 활용 시나리오가 크게 확장되었다.

**산업적 발전**  
산업 환경에서는 주요 기술 기업들이 이러한 아키텍처 원칙을 활용하여 점점 더 정교한 에이전트 플랫폼을 개발하고 있으며, 여기에 기업 규모의 기능을 추가하고 있다. Microsoft는 1,400개 이상의 엔터프라이즈 시스템과 통합되며 OpenAI 외의 다양한 LLM 옵션을 사용할 수 있는 포괄적인 에이전트 생태계를 구축하여 선도적인 입지를 차지하고 있다 (VentureBeat, 2024). 이들의 자율 에이전트는 특히 영업 자동화, 고객 서비스, 비즈니스 프로세스 최적화 등에서 최소한의 인간 개입으로 복잡한 워크플로우를 처리할 수 있다. IBM 또한 에이전트 기술을 수용하고 있으며, 자사의 연구는 기업용 AI 개발자들 사이에서 거의 보편적인 채택 의도를 보여준다 (IBM Newsroom, 2024). IBM은 단순한 함수 호출 시스템과 강력한 추론 능력을 갖춘 진정한 자율 에이전트를 구분하는 데 주력하고 있으며, 이는 고급 계획 및 추론 컴포넌트가 의미 있는 에이전트 응용을 위해 필수적이라는 업계의 인식을 반영한다. Coze(TrustedBy.ai, 2024)와 같은 플랫폼을 통해 비기술 사용자도 다양한 커뮤니케이션 채널에서 정교한 에이전트를 개발 및 배포할 수 있게 되면서, 에이전트 개발의 민주화가 가속화되고 있다. 이러한 개발 도구의 접근성 증가는 특화된 기업용 애플리케이션부터 소비자 중심 구현까지 에이전트 도입을 폭넓게 확산시켰다.

**학계 연구 동향**  
학계는 점점 더 복잡한 분석 작업을 위한 특화 모델을 통해 에이전트의 추론 능력 강화에 주력하고 있다. 추론 중심 또는 o1 유형 모델(Jaech et al., 2024)의 개발은 다단계 논리 과정을 요구하는 복잡한 문제 해결 시나리오를 에이전트가 다룰 수 있도록 하는 중요한 진보를 나타낸다. 또 다른 핵심 연구 방향은 여러 명의 특화된 에이전트가 협력하여 복잡한 작업을 수행하는 멀티 에이전트 아키텍처이다 (Yang et al., 2024; Guo et al., 2024; Yang et al., 2025b; Rajaei, 2024). 이러한 시스템은 각기 다른 하위 작업에 최적화된 에이전트들에게 인지적 부하를 분산시키며, 단일 에이전트 방식보다 복잡하고 개방형 문제를 더 잘 처리할 수 있는 성능을 보여준다.

**신흥 구현 프레임워크**  
에이전트 시스템의 실제 구현은 에이전트 구축을 위한 사전 구성된 컴포넌트를 제공하는 특화 프레임워크들을 통해 촉진되고 있다. LangChain과 그 확장인 LangGraph는 정교한 추론, 계획, 멀티 에이전트 조정을 지원하는 모듈형 아키텍처를 제공하며, 에이전트 개발의 업계 표준이 되었다 (LangChain, 2024). Microsoft의 Semantic Kernel 프레임워크는 전통적인 소프트웨어 개발과 AI 기능의 연결에 초점을 맞추고 있으며 (Microsoft Learn, 2024), 기존의 엔터프라이즈 시스템에 대한 전체적인 구조 개편 없이도 에이전트 기능을 통합할 수 있게 한다. 이러한 통합 중심 접근법은 기존 워크플로우를 대체하기보다는 향상시키고자 하는 기업들에게 특히 유용하다.

이러한 진보는 LLM 에이전트가 실험적 개념에서 다양한 응용 도메인에 실질적인 가치를 창출하는 시스템으로 급속히 발전했음을 보여준다. 기술이 지속적으로 성숙함에 따라, 더욱 정교한 추론, 계획, 행동 실행 능력의 통합은 자율 에이전트가 기업 및 소비자 환경 모두에서 더욱 중요한 역할을 하게 될 것임을 시사한다.
### 2.2 Definition and Developments of Agent Protocols 

에이전트 프로토콜은 에이전트 간, 그리고 에이전트와 외부 시스템 간의 구조화된 통신을 위한 규칙, 형식, 절차를 정의하는 표준화된 프레임워크이다. API, 그래픽 사용자 인터페이스(GUI), XML 기반 상호작용 등 기존의 상호작용 메커니즘과 비교할 때, 프로토콜은 Table 1에 요약된 바와 같이 상당한 장점을 지닌다. API는 효율적이지만 유연성과 표준화가 부족한 경우가 많고, GUI는 사용자 친화적이고 표준화된 인터페이스를 제공하지만 효율성이 떨어지며 AI 친화적이지 않다.

Table 1: 에이전트를 위한 다양한 상호작용 방식의 속성 비교

| 방식 | 사용 시나리오 | 효율성 | 운영 범위 | 표준화 여부 | AI 친화성 |
| --- | --- | --- | --- | --- | --- |
| API | 서버 간 통합 | ✔✔ | ✘ | ✘ | ✘ |
| GUI | 컴퓨터/모바일 사용 | ✘ | ✔ | ✔ | ✘ |
| XML | 브라우저 사용 | ✘ | ✔ | ✘ | ✘ |
| Protocol | 에이전트 간 상호작용 | ✔✔ | ✔✔ | ✔✔ | ✔✔ |

프로토콜은 높은 효율성, 넓은 운영 범위, 강력한 표준화, AI 시스템과의 본질적 호환성이라는 이점을 모두 결합한다. 브라우저 기반 상호작용을 주로 목적으로 하는 XML 기반 방식 또한 효율성과 표준화 측면에서 부족하다. 또한, 브라우저 사용에 초점을 맞춘 많은 AI 어시스턴트들은 HTML 및 기타 프로그래밍 언어, 유사한 기술들을 활용하여 LLM과 웹사이트 간 상호작용을 구현하지만, 이러한 접근 방식은 유연성과 복잡성 측면에서 한계가 있어 다양한 시나리오에 적용하기 어렵다. 따라서, 에이전트 프로토콜은 복잡하고 동적인 상호작용을 지원하며, 다양한 에이전트 생태계 내에서 확장 가능한 유일한 수단으로 부각되며, 에이전트 기반 시스템 통신에 적합한 접근법으로 간주된다.

프로토콜은 일관된 정보 교환을 가능하게 하는 기초 문법으로 작용하며, 내부 아키텍처가 상이한 이기종 에이전트 시스템 간에도 원활한 협업을 가능하게 한다. 이들 프로토콜의 주요 가치는 상호운용성을 가능하게 하고, 표준화된 상호작용을 보장하며, 에이전트가 새로운 도구, API, 서비스 등을 손쉽게 통합하고 기능을 확장할 수 있도록 해준다는 점에 있다. 더불어, 표준화된 프로토콜은 보안과 거버넌스를 유지할 수 있는 고유한 메커니즘을 제공하여, 명확히 정의된 안전한 운영 파라미터 내에서 에이전트의 행동을 관리한다. 상호작용 논리의 복잡성을 추상화함으로써, 프로토콜은 에이전트 개발의 복잡도를 대폭 낮추고, 개발자들이 핵심 기능 향상에 집중할 수 있도록 한다. 어쩌면 가장 혁신적인 측면은, 프로토콜이 특화된 에이전트들이 일시적 연합을 구성해 복잡한 문제를 해결할 수 있는 집단 지능의 형성을 가능하게 한다는 것이다. 표준화된 통신 채널을 통해 인사이트를 공유하고 행동을 조율함으로써, 분산된 에이전트 시스템은 단일 아키텍처로는 불가능한 결과를 달성할 수 있으며, 다양한 특화 시스템들에 분산된 추론 능력을 통해 완전히 새로운 인지 아키텍처를 구현할 수 있다.

현재의 에이전트 프로토콜 생태계는 다양한 전략적 패러다임을 포함하고 있다. 예를 들어, Anthropic의 Model Context Protocol (MCP) (Anthropic, 2024)와 같은 모델 중심 프로토콜은 대형 기술 제공자가 생태계 영향력 및 자산 통제를 추구하는 방식을 대표한다. Google의 Agent-to-Agent (A2A) (Google, 2025)와 같은 엔터프라이즈 중심 프로토콜은 내부 기업 환경 내 통합, 보안, 거버넌스를 우선시한다. 한편, Chang (2024)이 제안한 Agent Network Protocol (ANP)과 같은 오픈 네트워크 프로토콜은 분산화된 비전을 추구하며, 공급자나 기술 스택에 관계없이 에이전트 간의 광범위한 상호운용성을 장려하는 개방형 에이전트 인터넷을 구축하려는 목표를 가진다. 이러한 발전은 다양한 응용 도메인 전반에 걸쳐 에이전트 기반 협업 지능을 촉진하는 데 있어 프로토콜이 핵심적인 역할을 한다는 점을 보여준다.

---

## 3 Protocol Taxonomy 

LLM 에이전트의 급속한 수요 변화에 대응하여 다양한 에이전트 프로토콜이 등장하였다. 그러나 기존 연구는 이러한 프로토콜에 대한 체계적인 분류가 부족하다. 이 격차를 해소하기 위해, 우리는 Figure 3에 제시된 것처럼 에이전트 프로토콜을 위한 2차원 분류 체계를 제안한다. 첫 번째 차원인 객체 지향성(object orientation)에서는 프로토콜을 컨텍스트 지향형(context-oriented)과 에이전트 간(inter-agent) 유형으로 구분하고, 두 번째 차원인 응용 시나리오(application scenario)에서는 범용형(general-purpose)과 도메인 특화형(domain-specific)으로 세분화한다.

<img src="./images/fig_01_03.png" width=800>

Figure 3: 객체 지향성과 응용 시나리오라는 두 차원에서 다양한 에이전트 프로토콜을 분류한 그림. 자세한 내용은 Table 2를 참고하라.

### 3.1 Context-Oriented Protocols 

LLM의 고도화된 언어 이해 및 추론 능력에도 불구하고, LLM 에이전트는 복잡한 질의나 의도에 대응하기 위해 LLM이 내재한 지식만으로는 충분하지 않다. 목표를 달성하기 위해 필요한 컨텍스트를 얻기 위해, LLM 에이전트는 일반적으로 언제, 어떤 외부 도구를 호출할지를 자율적으로 판단하고, 이를 통해 행동을 실행해야 한다 (Liu et al., 2025). 예를 들어, 사용자가 특정 날짜와 장소의 날씨에 대해 질문하는 경우, LLM 에이전트는 실제 날씨 API를 참조하여 관련 데이터를 검색하고 해당 컨텍스트를 확보해 답변을 생성한다. 개발 초기에는 포맷화된 함수 호출 데이터셋을 통해 LLM 에이전트의 도구 사용 능력을 파인튜닝하는 방식이 주로 사용되었다 (Qu et al., 2025; Schick et al., 2023; Liu et al., 2024). 이러한 접근은 함수 호출과 컨텍스트 요구 능력을 빠르게 향상시킬 수 있지만, 표준화되고 통합된 컨텍스트 지향 프로토콜의 부재로 인해 여러 도전에 직면하게 된다.

LLM 생태계에서 표준 프로토콜의 부재는 도구 호출과 인터페이스 양면 모두에서 심각한 단편화를 초래하였다. LLM 제공자들은 각기 고유한 도구 사용 표준을 구현함으로써, 기본 모델 간 프롬프트 형식이 달라지는 문제가 발생한다. 이와 유사하게, 데이터·도구·서비스 제공자들도 각자의 호출 인터페이스를 구현하여 호환성을 더욱 악화시킨다. 이러한 단편화는 사용자 및 개발자에게 부담을 가중시키며, 프롬프트 수준의 커스터마이징과 다양한 명세 관리를 요구하게 되어, 상호운용성을 저해하고 시스템 복잡도를 높이며 개발 및 유지 비용을 상승시킨다.

이러한 문제에 대응하여, 여러 컨텍스트 지향 에이전트 프로토콜이 제안되었다. 이들 프로토콜은 컨텍스트 획득을 위한 표준화된 방식을 제공함으로써, 에이전트와 컨텍스트 제공자 간의 교환에서 단편화를 줄이는 데 기여한다. 응용 시나리오에 따라, 컨텍스트 지향 에이전트 프로토콜은 범용형(general-purpose) 또는 도메인 특화형(domain-specific)으로 분류될 수 있다.

Table 2: 주요 에이전트 프로토콜 개요

| 유형 | 시나리오 | 프로토콜 | 제안자 | 적용 시나리오 | 핵심 기술 | 개발 단계 |
| --- | --- | --- | --- | --- | --- | --- |
| ContextOriented | GeneralPurpose | MCP <br> Anthropic (2024) | Anthropic | 에이전트와 리소스 연결 | RPC, OAuth | 공식 표준 |
|  | DomainSpecific | agent.json <br> WikiCzechM (2025) | Wildcard AI | 웹사이트 정보를 에이전트에 제공 | /.well-known | 초안 작성 중 |
|  |  | A2A <br> Google (2025) | Google | 에이전트 간 통신 | RPC, OAuth | 상용화 단계 |
|  |  | ANP <br> Cheng (2024) | ANP 커뮤니티 | 에이전트 간 통신 | JSON-LD, DID | 상용화 단계 |
|  |  | AITP <br> NEAR (2025) | NEAR 재단 | 에이전트 간 통신 | 블록체인, HTTP | 초안 작성 중 |
|  |  | AComP <br> AI and Data (2025) | IBM | 멀티 에이전트 시스템 통신 | OpenAPI | 초안 작성 중 |
|  |  | AComP <br> Cisco (2025) | Langchain | 멀티 에이전트 시스템 통신 | OpenAPI, JSON | 초안 작성 중 |
|  |  | Agent <br> Marro et al. (2024) | 옥스퍼드대학교 | 에이전트 간 메타 프로토콜 | 프로토콜 문서 | 개념 단계 |
|  |  | LMOS <br> Eclipse (2025) | Eclipse 재단 | 사물인터넷과 에이전트 통신 | WOT, DID | 상용화 단계 |
|  |  | Agent Protocol <br> AIEngineerFoundation (2025) | AI Engineer 재단 | 컨트롤러-에이전트 상호작용 | RESTful API | 상용화 단계 |
|  | DomainSpecific | LOKA <br> Ranjan et al. (2025) | CMU | 분산형 에이전트 시스템 | DECP | 개념 단계 |
|  |  | PXP <br> Srinivasan et al. (2024) | BITS Pilani | 인간-에이전트 상호작용 | - | 개념 단계 |
|  |  | CrowdEx <br> Bao et al. (2025) | GIST.KR | 로봇-에이전트 상호작용 | - | 개념 단계 |
|  |  | SPPs <br> Gajcieniec et al. (2024) | 리버풀대학교 | 로봇-에이전트 상호작용 | - | 개념 단계 |

범용 프로토콜은 단일화된 인터페이스를 통해 다양한 에이전트와 컨텍스트 제공자를 지원하는 것을 목표로 하며, 도메인 특화 프로토콜은 특정 사용 사례에 대한 최적화에 중점을 둔다.

#### 3.1.1 General-Purpose Protocols

범용 에이전트 프로토콜은 통합된 프로토콜 패러다임을 통해 다양한 엔터티를 수용하도록 설계되어, 다양한 통신 시나리오를 용이하게 한다.

MCP (Anthropic, 2024) 이러한 유형의 에이전트 프로토콜 중에서, Model Context Protocol(MCP)은 선구적이고 널리 인정받는 프로토콜로, An에 의해 처음 제안되었다. 따라서 이 섹션에서는 MCP를 소개하고, 그 원칙과 적용 사례를 자세히 다룬다.

MCP는 외부 데이터, 도구, 서비스 등으로 구성된 리소스에 LLM 에이전트를 보다 간단하고 신뢰성 있게 연결하기 위한 범용의 오픈된 컨텍스트 지향 프로토콜이다 (Anthropic, 2024). MCP의 높은 표준화 수준은 다양한 기반 LLM 및 도구 제공자들로 인해 발생하는 단편화를 효과적으로 해결하며, 시스템 통합을 크게 향상시킨다. 동시에, MCP의 표준화는 LLM 에이전트의 도구 사용에 있어 높은 확장성을 제공하여, 새로운 도구의 통합을 더욱 쉽게 만든다. 또한 MCP의 클라이언트-서버 아키텍처는 도구 호출을 LLM 응답으로부터 분리시켜, 데이터 유출의 위험을 감소시킨다.

이후 논의에서는 MCP 프로토콜의 기본 구조와 프로세스를 소개한다. MCP 프로토콜을 통한 도구 사용은 Host, Client, Server, Resource라는 네 가지 뚜렷한 구성 요소로 특징지어진다.

* **Host**는 사용자와 상호작용하고, 사용자 질의에 대한 이해 및 추론을 수행하며, 도구를 선택하고 전략적 컨텍스트 요청을 개시하는 LLM 에이전트를 의미한다. 하나의 Host는 여러 Client에 연결될 수 있다.
* **Client**는 Host에 연결되어 사용 가능한 리소스에 대한 설명을 제공한다. 또한 Server와 일대일 연결을 형성하며, 데이터 요청, 도구 호출 등을 포함한 실행 컨텍스트 요청을 시작하는 역할을 한다.
* **Server**는 리소스에 연결되어 있으며, Client와 일대일 연결을 형성하고, 리소스로부터 요구되는 컨텍스트를 Client에 제공한다.
* **Resource**는 로컬 파일 시스템과 같은 데이터, Git과 같은 도구, 검색 엔진과 같은 서비스를 지칭하며, 로컬 또는 원격으로 제공될 수 있다.

완전한 MCP 호출 사이클의 초기 단계에서, Host는 사용자 질의에 직면했을 때, LLM의 이해 및 추론 능력을 활용하여 응답에 필요한 컨텍스트를 추론한다. 동시에 Host에 연결된 여러 Client는 사용 가능한 리소스에 대한 자연어 설명을 제공한다. 이 정보를 기반으로, Host는 어느 리소스로부터 컨텍스트를 요청할지를 결정하고, 해당 Client에 전략적 컨텍스트 요청을 보낸다. 요청 단계에서는 Client가 대응되는 Server에 실행 컨텍스트 요청을 전송하며, 이는 데이터 수정, 도구 호출 등의 작업을 포함할 수 있다. Server는 요청을 수신하면 지정된 리소스에 대해 작업을 수행하고, 획득한 컨텍스트를 Client에 전달하며, Client는 이를 Host에 전달한다. 응답 단계에서 Host는 획득한 컨텍스트를 결합하여 사용자 질의에 대한 응답을 구성하며, 이를 통해 사이클이 완료된다.

MCP는 도구 사용을 특정 LLM 제공자나 컨텍스트 제공자의 인터페이스와 분리시켜, LLM 생태계의 단편화를 해결하기 위한 공개 표준 호출 프로토콜을 도입한다. 도구 호출을 MCP와 정렬함으로써, LLM 제공자는 독자적인 포맷 구현 없이 더 나은 상호 운용성을 확보하고 모델 간 원활한 전환이 가능해진다. 동시에 컨텍스트 제공자는 MCP를 한 번 통합함으로써, MCP 호환 LLM 에이전트 누구나 자신들의 서비스를 사용할 수 있도록 할 수 있다. 이 표준화는 개발 및 유지보수 비용에 중대한 영향을 미치며, 확장성과 플랫폼 간 호환성 또한 향상시킨다.

또한 MCP는 함수 호출 방식으로 LLM 응답 내에 도구 호출이 결합되어 있을 때 발생할 수 있는 데이터 보안 위험을 줄인다.

구체적으로, 컨텍스트를 요청할 때, LLM은 완전한 실행 가능한 함수 호출을 생성하며, 이 호출은 외부 도구에 의해 실행된다. 하지만 컨텍스트에 개인 사용자 정보를 요구하는 경우(예: 계정 인증 정보), LLM은 사용자의 입력을 요청하고 이를 함수 호출에 포함시킬 수 있다. 이와 같은 경우, 클라우드 기반 LLM 사용자는 민감한 정보를 클라우드로 업로드해야 하며, 이는 심각한 보안 위험을 초래한다. 따라서 이러한 보안 문제를 완화하기 위해 도구 호출을 LLM 응답과 분리하는 것이 현재 LLM 에이전트가 직면한 과제 중 하나이다.

MCP는 도구 호출을 LLM 응답에서 분리함으로써 컨텍스트 획득 시 개인 정보 보호와 보안을 향상시킨다. 민감한 사용자 데이터를 포함할 수 있는 함수 호출을 직접 실행하는 대신, LLM은 필요한 리소스와 파라미터를 지정하고, 실제 컨텍스트 요청의 생성과 실행은 로컬 Client가 담당한다. 이 Client는 필요한 사용자 인증도 로컬에서 처리한다. 이로써 민감한 정보는 오프라인에 저장될 수 있으며, 데이터 유출의 위험이 줄어든다. 이러한 아키텍처는 사용자에게 LLM과 공유되는 컨텍스트 데이터에 대한 제어 권한을 부여하며, 개인 정보 문제를 완화하면서도 도구의 효율성을 유지할 수 있도록 한다.

MCP는 LLM 에이전트와 외부 리소스 간의 상호작용을 표준화하는 중요한 진전을 나타낸다. 컨텍스트 획득과 도구 호출을 위한 통합 프로토콜을 제공함으로써, MCP는 기반 LLM 제공자 및 리소스 인터페이스 전반의 단편화를 줄여준다. 클라이언트-서버 아키텍처는 상호 운용성, 확장성, 개인 정보 보호를 강화하며, 이는 견고하고 안전한 LLM 에이전트 시스템을 구축하는 데 있어 기본적인 프레임워크가 된다.

#### 3.1.2 Domain-Specific Protocols

범용 에이전트 프로토콜 외에도, 특정 도메인에 중점을 두어 해당 영역 내에서 목표 지향적인 향상을 가능하게 하는 프로토콜들이 존재한다.
**agents.json** (WildCardAI, 2025)은 전통적인 API와 AI 에이전트 간의 간극을 해소하기 위해 고안된 오픈소스 기계판독형 계약 형식이다.

OpenAPI 표준 위에 구축된 이 스펙은 웹사이트가 구조화된 JSON 파일을 통해 AI 호환 인터페이스, 인증 방식, 다단계 워크플로우를 선언할 수 있게 해주며, 보통 `/.well-known/agents.json` 경로에 호스팅된다.
전통적인 OpenAPI 사양이 인간 개발자를 위한 것인 반면, **agents.json**은 *flows* (사전 정의된 API 호출 시퀀스)와 *links* (액션 간 데이터 종속성 매핑)와 같은 구조를 도입함으로써 대형 언어 모델(LLM)이 보다 신뢰성 있게 오케스트레이션할 수 있도록 돕는다.
이 설계는 **상태 비저장(statelessness)**, 기존 API에 대한 **최소한의 수정**, LLM 소비에 최적화된 구조를 강조한다.
에이전트 상호작용을 위한 명확하고 표준화된 스키마를 제공함으로써, **agents.json**은 통합을 간소화하고, 프롬프트 엔지니어링 필요성을 줄이며, 에이전트 기반 환경에서 API의 발견성과 사용성을 향상시킨다.

### 3.2 Inter-Agent Protocols

대형 언어 모델(LLM)과 에이전트 기술의 발전과 함께, 단일 에이전트의 한계를 극복하고 보다 복잡한 작업을 해결하려는 관심이 증가하고 있다. 특히 \*\*다중 에이전트 협업(multi-agent collaboration)\*\*에 대한 관심이 크게 확대되었다.
일부 대규모, 복잡하며 본질적으로 분해 가능하거나 분산된 작업에서는, 다중 에이전트 방식이 효율성을 높이고 비용을 줄이며, 장애 허용성과 유연성을 제공하여 전체 성능 면에서 단일 에이전트 시스템을 능가할 수 있다 (Stone and Veloso, 2000; Dorri et al., 2018).
에이전트 간 상호작용은 \*\*다중 에이전트 시스템(MAS)\*\*에서 핵심적인 구성 요소이다. 그러나 현재 대부분의 MAS 프레임워크는 에이전트를 시스템 구조에 직접 내장하면서도, 상호작용 방식에 대한 명확한 표준 없이 구현되고 있으며, 이는 MAS의 발전을 저해할 수 있다.
따라서 에이전트 간의 상호작용을 규율하는 **표준화된 프로토콜**, 즉 **Inter-Agent Protocol**의 수립 필요성이 점점 커지고 있다.

이 프로토콜은 **에이전트 검색(agent discovery)**, **정보 공유**, **통신 방식 및 인터페이스의 표준화**와 같은 문제를 효과적으로 해결해야 하며, 에이전트 간 상호작용을 위한 통합 프로토콜을 제공해야 한다.
실제 응용에서는, 서로 다른 플랫폼에 배포되었거나, 서로 다른 벤더에 속한 에이전트들이 서로 다른 기술과 역량을 보유하고 있으며, 사용자 요청을 충족시키기 위해 상호 운용해야 할 수도 있다.
토론, 협상, 논쟁, 협업 등 다양한 형태의 통신이 발생할 수 있으며, 이 모두는 두 개 이상의 에이전트 간 정보 교환을 수반한다.
**Inter-Agent Protocol**은 이러한 상호작용 시나리오를 가능하게 하고 관리하는 데 있어 핵심적인 역할을 한다.

컨텍스트 지향 에이전트 프로토콜과 마찬가지로, 에이전트 간 프로토콜도 적용 시나리오에 따라 **범용(general-purpose)** 및 \*\*도메인 특화(domain-specific)\*\*로 분류할 수 있다.

#### 3.2.1 General-Purpose Protocols

이미 여러 가지 에이전트 간 프로토콜이 제안되었으며, 여기에는 Agent Network Protocol (ANP) (Chang, 2024), Google의 Agent2Agent Protocol (A2A) (Google, 2025), Agent Interaction & Transaction Protocol (NEAR, 2025), Agent Connect Protocol (AConP) (Cisco, 2025), Agent Communication Protocol (AComP) (AI and Data, 2025) 등이 포함된다. 이들 모두는 에이전트 간 상호작용에 초점을 맞춘 프로토콜을 구축하지만, 문제 영역, 응용 시나리오, 구현 전략에 따라 차이를 보인다. 다음은 위 프로토콜에 대한 설명이다.

Agent Network Protocol (Chang, 2024)  
Agent Network Protocol (ANP)는 이기종 도메인에 걸친 다양한 에이전트 간 상호운용성을 가능하게 하기 위해 오픈소스 기술 커뮤니티에서 개발된 오픈소스 에이전트 프로토콜이다. 이 프로토콜의 비전은 에이전트 간의 표준화된 연결 메커니즘을 정의하고 수십억 개의 에이전트가 참여하는 개방적이고, 안전하며, 효율적인 협업 네트워크를 구축하는 것이다. 인간 상호작용이 인터넷의 출현을 이끈 것처럼, 에이전트 네트워크 내에서의 합의 또한 유사한 영감을 바탕으로 한다. 그러나 이러한 네트워크를 실현하려면, 에이전트의 고유한 통신 및 조정 요구에 맞춘 인프라 설계가 필요하다. ANP의 핵심 원칙은 다음과 같다.

- 상호연결성: 모든 에이전트 간의 통신을 가능하게 하여 데이터 사일로를 제거하고, AI가 완전한 컨텍스트 정보를 접근할 수 있도록 한다.

| Inter-Agent Protocol | Core Problem | Application Scenarios | Key Techniques | Development Stage |
| :-- | :-- | :-- | :-- | :-- |
| ANP <br> (Agent Network Protocol) | Cross-Domain Agent <br> Communication | Agent on the Internet | JSON-LD, DID | Landing |
| A2A <br> (Agent2Agent Protocol) | Complex Problem Solving of <br> Agents | Inter Agent <br> Collaboration | RPC, OAuth | Landing |
| AITP <br> (Agent Interaction & <br> Transaction Protocol) | Agent Communication and <br> Value Exchange | Agents Secure Transactions <br> and Interactions | Blockchain, HTTP | Drafting |
| AConP <br> (Agent Connect Protocol) | Standardize Interface to Invoke <br> and Configure Agents | Agents on Local Area <br> Networks | OpenAPI, JSON | Drafting |
| AComP <br> (Agent Communication <br> Protocol) | Standardize practical, valuable <br> communication features | Agents on Local Area <br> Networks | OpenAPI | Drafting |

- 네이티브 인터페이스: 에이전트는 인터넷 접근 시 화면 캡처나 수동 클릭과 같은 인간의 상호작용 방식에 제한되지 않고, API와 프로토콜을 통해 디지털 세계와 상호작용해야 하며, 머신 간 통신에 최적화되어야 한다.
- 효율적인 협업: 자동 조직화 및 자동 협상 메커니즘을 활용하여 더 비용 효율적이고 효과적인 협업 네트워크를 구축할 수 있다.

ANP는 세 가지 핵심 계층으로 구성된다:

- **신원 및 암호화 통신 계층**: 이 계층은 W3C DID(Decentralized Identifiers) 표준을 활용하여 탈중앙화된 신원 인증 메커니즘을 수립하고, 신뢰 기반이 없는 종단 간 암호화 통신을 가능하게 한다. 이를 통해 서로 다른 플랫폼에 존재하는 에이전트 간에도 안전하게 인증이 가능하다.
- **메타 프로토콜 계층**: 프로토콜 중의 프로토콜로 기능하며, Agora(Marro et al., 2024)와 같은 자연어를 사용하여 에이전트가 자율적으로 통신 프로토콜을 협상하고 조정할 수 있게 한다. 상호작용 요구 사항 변화에 따라 프로토콜을 동적으로 적응시킬 수 있도록 지원한다.
- **응용 프로토콜 계층**: 인터넷상에서 다른 에이전트가 해당 에이전트를 발견할 수 있도록 하고, 해당 에이전트가 제공하는 정보, 기능, 인터페이스를 기술하며, 도메인 특화 작업을 수행하는 응용 프로토콜을 정의하는 계층이다.

워크플로우는 다음과 같이 단순히 설명할 수 있다. 로컬 에이전트는 표준화된 탐색 경로를 통해 다른 에이전트 목록을 검색한 후, 목록에 참조된 에이전트 설명 파일에 접근한다. 설명 파일에 포함된 정보를 바탕으로, 해당 인터페이스를 사용하여 상호작용을 시작하고, 요청을 적절한 형식으로 구성하고, 인증 자격 정보를 첨부하여 요청을 전송한 후, 이에 대한 응답을 처리한다.  

ANP의 의의 측면에서 보면, 이는 에이전트 네트워크 통신을 위한 혁신적인 솔루션을 제안하며, 에이전트 인터넷이라는 창의적인 개념을 도입한다. 향후 방향으로는, 플랫폼 간 신원 인증을 최적화하여 확장성과 실용성을 향상시키고, 데이터 교환 효율성과 신뢰성을 높이기 위한 적합한 에이전트 통신 프로토콜을 탐색하며, 탈중앙 신원 관리 및 경제적 인센티브 메커니즘 분야에서 블록체인 기술의 적용 가능성을 조사하는 것이 포함된다.

Agent2Agent Protocol (Google, 2025)  
Agent2Agent (A2A) 프로토콜은 Google이 제안한 일종의 에이전트 협업 프로토콜로, 기반 프레임워크나 벤더 구현 방식과 상관없이 원활한 에이전트 협업을 가능하게 하는 것을 목표로 한다. 다양한 환경에서 에이전트 통합을 단순화하며, 보안성과 기업 수준의 에이전트 생태계를 구축하는 데 필요한 핵심 기능들을 제공한다. 이 기능에는 역량 탐색, 사용자 경험 협상, 작업 및 상태 관리, 보안 협업 등이 포함된다. 따라서 A2A는 복잡한 에이전트 간 협업을 지원하도록 특별히 설계되었다. A2A의 핵심 원칙은 다음과 같다.

- 단순성: A2A는 기존 표준의 재사용을 강조한다. 예를 들어, 전송 계층으로 HTTP(S), 메시징 포맷으로 JSON-RPC 2.0, 스트리밍 방식으로는 Server-Sent Events(SSE)를 채택한다. 이와 같은 경량 프로토콜 설계는 학습 곡선과 구현 복잡성을 모두 낮춘다.
- 기업 수준 준비성: 인증, 권한, 보안, 프라이버시, 추적성, 가시성을 내장 설계 요소로 고려하였다. 에이전트는 실제 운영 환경에서도 강건하고 안전하게 사용할 수 있는 기업용 애플리케이션으로 다룰 수 있다.
- 비동기 우선 아키텍처: A2A는 Task라는 개념 중심으로 설계되며, 인간이 개입하는 다중 턴 상호작용 시나리오를 포함한 장시간 실행되는 비동기 워크플로우를 지원한다. 폴링, SSE 기반 업데이트, 푸시 알림 등 다양한 비동기 패턴을 지원하여 실시간 피드백, 알림, 작업 상태 업데이트를 가능하게 한다.
- 모달리티 비종속성: A2A는 텍스트, 파일, 폼, 오디오/비디오 스트림 및 iframe 등 다양한 미디어 포맷을 기본적으로 지원하며, 이는 에이전트 환경의 멀티모달 특성을 반영한다.
- 불투명 실행: A2A의 에이전트 상호작용은 사고, 계획, 도구 공유를 요구하지 않는다. 초점은 컨텍스트, 상태, 지시사항, 데이터에 맞춰져 있으며, 구현 프라이버시와 지적 재산을 보호한다. 단, 작업 관련 메타데이터는 공유되므로 반투명 협업 형태를 띄며, 이는 자원 노출의 위험을 수반할 수 있다.

A2A 프로토콜에서 정의된 핵심 개념에는 Agent Card, Task, Artifact, Message, Parts 등이 있으며, 이들은 에이전트 및 협업 워크플로우의 구조화를 담당한다.

A2A는 클라이언트 에이전트와 원격 에이전트 간의 통신을 지원한다. 클라이언트 에이전트는 작업을 구성하고 전달하는 역할을 하며, 원격 에이전트는 해당 작업을 수행하여 올바른 정보를 제공하거나 적절한 조치를 취하는 역할을 한다. 워크플로우는 다음과 같다. 먼저, 원격 에이전트는 JSON 형식의 "Agent Card"를 사용하여 자신의 기능을 광고하고, 클라이언트 에이전트는 이를 통해 작업을 수행할 수 있는 최적의 에이전트를 식별한다. 그런 다음 A2A를 활용하여 서로 통신하며 작업을 수행한다. 작업 객체는 즉시 완료되거나 장시간 실행될 수 있다. 마지막으로, 작업의 출력 결과는 원격 에이전트에 의해 artifact 형식으로 응답된다.

A2A는 에이전트 통신을 위한 표준화된 프로토콜을 도입하여 에이전트 상호운용성을 발전시킨다. 이는 엔터프라이즈 환경 내에서 원활한 에이전트 협업을 가능하게 하며, 보다 광범위하고 포괄적인 에이전트 협업을 위한 기반을 마련한다. 이러한 진보는 향후 상호운용 가능한 다중 에이전트 시스템 개발을 위한 기술적 경로와 개념적 프레임워크를 제공한다.

Agent Interaction & Transaction Protocol (AITP) (NEAR, 2025)  
AITP는 AI 에이전트가 신뢰 경계를 넘어 안전하게 통신할 수 있도록 하며, 구조화된 상호작용을 위한 확장 가능한 메커니즘을 제공한다. 이 프로토콜은 서로 다른 조직이나 개인에 속한 에이전트 간의 자율적이고 안전한 통신, 협상 및 가치 교환을 지원한다. 예를 들어, 항공권 예약 시나리오에서 개인 비서 에이전트는 항공사 웹사이트를 탐색하는 대신, AITP를 사용하여 항공사 예약 에이전트와 직접 상호작용하며 항공편, 승객, 결제 정보를 교환할 수 있다. AITP에서 에이전트는 Threads를 통해 통신하며, 이는 Transport 계층을 통해 전송되며, 특정 작업에 맞게 조정된 Capabilities를 통해 구조화된 데이터를 교환한다.

AITP의 특징은 신뢰 경계를 넘는 에이전트 상호작용을 명시적으로 목표로 하며, 블록체인을 기반으로 신원, 보안, 데이터 무결성과 같은 문제를 해결한다는 점이다.

Agent Connect Protocol (AConP) (Cisco, 2025)  
Agent Connect Protocol(AConP)은 에이전트를 호출하고 구성하기 위한 표준 인터페이스를 정의한다. 이 프로토콜은 에이전트 검색, 실행(run), 중단 및 재개, 스레드 실행(thread run), 출력 스트리밍 등 다섯 가지 핵심 측면을 포함하는 호출 가능한 API 집합을 제공한다. 이 API들은 에이전트와 상호작용하는 데 필요한 사용 흐름을 구성한다. 에이전트를 호출하는 데 필요한 정보는 Agent ACP Descriptor에 저장되며, 이 디스크립터는 에이전트를 고유하게 식별하고, 기능을 설명하며, 해당 기능을 어떻게 사용할 수 있는지를 명시한다. 엄밀히 말하면, AConP는 에이전트 간 상호작용을 직접적으로 지원한다기보다는, 에이전트와 연결하여 사용하는 표준 인터페이스를 정의한다. 그러나 ACP Descriptor와 API 집합을 조합하여 사용하면, 에이전트들 간의 연결 및 협업도 AConP를 통해 가능하다.

Agent Communication Protocol (AComP) (AI and Data, 2025)  
AComP는 에이전트 간의 통신 방식을 표준화하여 자동화, 에이전트 간 협업, UI 통합, 개발자 도구 등을 가능하게 하기 위해 설계된 프로토콜이다. 이 프로토콜은 처음부터 엄격한 사양을 강제하기보다는, 실용적이고 유용한 기능을 먼저 구현하고, 그 가치를 입증한 기능부터 점진적으로 표준화하여 광범위한 채택과 장기적인 호환성을 확보한다. AComP의 도입 배경은, 현재 에이전트 시스템이 다양한 통신 표준을 사용함에 따라 복잡성, 통합 어려움, 벤더 종속성이 발생하고 있다는 점이다. 이러한 문제를 해결하기 위해, AComP는 자연어 입력을 처리하고 외부 호스팅 모델에 의존하는 에이전트에 특화된 상호작용을 표준화하는 것을 목표로 한다. AComP는 에이전트 생태계 전반에서 통합을 단순화하고 효과적인 협업을 촉진하고자 하지만, 아직 설계 단계에 있다.

Agora (Marro et al., 2024)  
LLM 에이전트가 등장하기 이전에도, 컴퓨터 과학 분야의 연구자들은 수십 년 동안 에이전트를 위한 통신 패러다임 설계에 대해 탐구해 왔다 (Gilbert, 2019). LLM 에이전트의 출현은 에이전트 통신 프로토콜에 대한 논의를 다시 활발하게 만들었다. LLM은 자연어 지시를 따르는 능력(Wei et al., 2022)과 구조화된 데이터를 처리하는 능력(Collins et al., 2022) 모두에서 놀라운 발전을 보였다. 동시에, 다양한 실제 작업에서도 뛰어난 성능을 보이고 있다 (Pyatkin et al., 2022; Zhong and Wang, 2023; Wei et al., 2022). Hu et al. (2022)와 Marro et al. (2024)에 따르면, 특화된 LLM은 범용 LLM에 비해 우수한 성능을 보이며, 이기종 LLM 기반 에이전트 네트워크의 상당한 가능성을 보여준다. 이기종 LLM의 주요 차별점은 아키텍처, 기능, 사용 정책에 있다. 그러나 이기종 LLM 기반의 에이전트 네트워크는 Agent Communication Trilemma에 직면한다. 이는 다양성(versatility), 효율성(efficiency), 이식성(portability) 사이의 균형을 유지하기 어렵다는 문제이다.

- 다양성(Versatility): 에이전트 간 통신은 다양한 유형과 형식의 메시지를 지원해야 하며, 이는 광범위한 작업과 시나리오를 포괄하는 유연성을 의미한다.
- 효율성(Efficiency): 에이전트를 운영하고 통신을 수행하는 데 필요한 계산 비용은 최소화되어야 하며, 시스템이 효율적으로 작동해야 한다.
- 이식성(Portability): 통신 프로토콜의 구현은 인간 프로그래머의 노력을 최소화하여 수많은 에이전트가 통신 네트워크에 쉽게 참여할 수 있도록 해야 한다.

LLM 에이전트 통신에서는 이 세 요소가 Agent Communication Trilemma를 형성한다. 다양성을 위해 다양한 메시지 형식과 유형을 지원하면, 프로토콜 복잡성 및 구현 난이도와 비용이 증가하고 이식성이 낮아진다. 효율성은 계산 비용 및 네트워크 비용을 줄이고, 자연어 모호성을 줄이기 위해 필요한데, 자연어 기반 통신은 계산 오버헤드를 크게 증가시킨다. 이식성은 구현과 배포의 용이성을 요구하지만, 유연하고 복잡한 프로토콜은 많은 프로그래밍 노력을 요구하므로, 다양한 에이전트 간 적용을 어렵고 느리게 만든다. 이 세 요소는 상호 의존적이기 때문에 동시에 최적화하는 것이 어렵다.

이 문제를 해결하기 위해 Agora는 LLM의 자연어 이해, 코드 생성, 자율 협상 능력을 활용하여, 에이전트가 상황에 따라 다양한 통신 프로토콜을 채택할 수 있게 한다. 빈번한 통신은 구조화된 프로토콜을 사용하여 효율성을 확보하고, 드문 통신은 LLM이 생성한 루틴을 기반으로 구조화된 데이터를 사용한다. 매우 희소한 통신이나 실패 상황에서는 자연어로 전환하며, 이 과정은 프로토콜 협상에도 사용될 수 있다. Agora는 Protocol Documents(PDs)를 도입하는데, 이는 일반 텍스트 형식의 프로토콜 설명으로, 에이전트가 인간 개입 없이 자율적으로 프로토콜을 협상, 구현, 적응, 생성할 수 있게 한다.

Agora는 전통적인 구조화된 프로토콜, LLM 루틴, 자연어 통신 등 다양한 통신 방식을 지원하여 시나리오에 따라 적응할 수 있도록 설계되었다. 빈번한 통신 작업에는 계산과 지연을 최소화하기 위해 효율적인 전통 프로토콜과 LLM 루틴을 우선시하며, 자연어는 필요한 경우에만 사용하여 다양성과 효율성을 균형 있게 유지한다. 이 설계는 에이전트가 인간 프로그래밍에 대한 의존 없이 자율적으로 프로토콜을 협상, 구현, 사용할 수 있도록 하며, PD를 통해 다양한 시나리오와 LLM을 지원하는 프로토콜 공유를 가능하게 함으로써 호환성과 확장성을 높여 Agent Communication Trilemma를 효과적으로 해결한다.

#### 3.2.2 Domain-Specific Protocols

도메인 특화 프로토콜은 지능형 에이전트와 그 상대 간의 상호작용을 규율하는 맞춤형 통신 및 조정 메커니즘으로, 각각의 운영 도메인에서 발생하는 고유한 요구 사항과 제약을 해결하도록 설계되었다. 이러한 프로토콜은 견고하고 해석 가능하며 윤리적으로 정렬된 행동을 보장한다. 이 절에서는 도메인 특화 프로토콜을 세 가지 주요 범주로 분류한다: (1) 인간-에이전트 상호작용 프로토콜(Human-Agent Interaction Protocols)은 상호 이해성과 신뢰를 촉진하는 데 초점을 맞춘다; (2) 로봇-에이전트 상호작용 프로토콜(Robot-Agent Interaction Protocols)은 물리적 환경에서의 공간 추론 및 행동 조정을 강조한다; (3) 시스템-에이전트 상호작용 프로토콜(System-Agent Interaction Protocols)은 확장 가능하고 상호 운용 가능하며 안전한 다중 에이전트 생태계를 촉진한다. 각 범주는 해당 도메인에서의 통신, 신원, 의사결정, 작업 수행의 특수성을 다루는 전문화된 프로토콜 프레임워크를 포함한다.

##### 3.2.2.1 Human-Agent Interaction Protocol

Human-Agent Interaction Protocol은 인간 사용자와 지능형 에이전트 간의 의미 있고 투명하며 상황 인식적인 커뮤니케이션을 가능하게 하기 위해 설계되었다. 해석 가능성, 협업, 윤리적 의사결정이 중요한 도메인에서는, 이러한 프로토콜이 기계의 행동을 인간의 의도와 기대에 정렬시키는 데 필요한 구조를 제공한다. 이 범주는 인간과 에이전트 간의 인지적 정렬(예: 예측 및 추론 과정의 이해 가능성)과 규범적 정렬(예: 윤리적이고 책임 있는 상호작용)을 모두 강조한다. 다음은 이러한 목표를 달성하기 위한 두 가지 보완적 접근을 설명하는 프로토콜이다. PXP 프로토콜은 작업 지향 대화에서 상호 이해 가능성에 중점을 두며, LOKA 프로토콜은 이기종 다중 에이전트 시스템에서 신원, 신뢰 및 윤리적 조정을 위한 탈중앙화 기반을 구축한다.

**PXP Protocol (Srinivasan et al., 2024)**  
PXP(Predict and eXplain Protocol)는 도메인 특화 인간-에이전트 상호작용 프로토콜의 핵심으로, 인간 전문가와 LLM 기반 기계 에이전트 간의 양방향 해석 가능 상호작용을 가능하게 한다. 이 프로토콜은 유한 상태 기계(finite-state machine) 모델을 사용하여, 에이전트가 네 가지 태그(RATIFY, REFUTE, REVISE, REJECT)로 라벨링된 메시지를 통해 통신하도록 한다. 이러한 태그는 에이전트 간에 교환되는 예측 및 설명에 대한 동의 또는 불일치를 기준으로 결정된다. PXP의 구현은 블랙보드 시스템과 사람-기계 에이전트를 번갈아가며 스케줄링하는 방식으로 구성된다. 이 프로토콜은 영상의학 진단 및 약물 합성 경로 계획이라는 두 가지 도메인에서 실험적으로 검증되었으며, 인간-LLM 상호작용에서의 단방향 및 양방향 해석 가능성을 포착할 수 있는 능력을 입증하며, 효과적인 인간-LLM 협업 시스템 설계 가능성을 뒷받침한다.

**LOKA Protocol (Ranjan et al., 2025)**  
LOKA(Layered Orchestration for Knowledgeful Agents) 프로토콜은 AI 에이전트 생태계에서 신원, 책임성, 윤리적 정렬 문제를 해결하기 위해 설계된 포괄적인 탈중앙화 프레임워크를 소개한다. LOKA는 Universal Agent Identity Layer(UAIL)를 제안하여, AI 에이전트에 고유하고 검증 가능한 신원을 부여하고, 이를 통해 안전한 인증, 책임성, 상호운용성을 가능하게 한다. 이 기반 위에, 다양한 에이전트 간의 의미적 조정을 가능하게 하는 의도 중심 통신 프로토콜(intent-centric communication protocols)을 포함한다. 핵심 기능 중 하나는 Decentralized Ethical Consensus Protocol(DECP)로, 이는 에이전트가 공유된 윤리 기준을 바탕으로 상황에 맞는 결정을 내릴 수 있게 한다. 이 프로토콜은 Decentralized Identifiers(DIDs), Verifiable Credentials(VCs), 양자 이후 암호(Post-Quantum Cryptography) 등 신흥 표준을 기반으로 하며, 디지털 및 물리적 도메인 전반에서 책임 있고 투명하며 자율적인 AI 생태계를 위한 확장 가능하고 미래 지향적인 설계 청사진을 제공한다.

##### 3.2.2.2 Robot-Agent Interaction Protocol

Robot-Agent Interaction Protocol은 특히 구현된 로봇들이 서로 및 동적인 환경과 상호작용해야 하는 물리적 환경에서의 조정, 인식, 공간 추론의 문제를 다룬다. 이러한 프로토콜은 분산된 의사결정, 실시간 환경 적응, 복잡한 다중 에이전트 시스템에서의 안전한 내비게이션을 가능하게 한다. 센서 입력의 불확실성, 부분 관측성, 제한된 통신 대역폭을 고려하면서도 견고한 집단 행동을 지원해야 한다. 이 절에서는 두 가지 대표적인 접근 방식을 소개한다: CrowdES 프로토콜은 로봇이 존재하는 환경에서 실제 군중 역학을 시뮬레이션하고 이에 적응하는 데 초점을 맞추며, Spatial Population Protocol은 분산된 시스템에서 익명 로봇 간의 기하학적 합의를 달성하기 위한 분산 솔루션을 제공한다.

**CrowdES (Bae et al., 2025)**  
CrowdES 프레임워크는 지속적이고 현실적인 군중 행동 생성을 위한 새로운 상호작용 프로토콜을 제시하며, 특히 로봇-에이전트 상호작용에 적합하다. 이 프로토콜은 군중 생성기(crowd emitter)와 군중 시뮬레이터(crowd simulator)를 통합하여 환경을 동적으로 채우고 다양한 이동 패턴을 시뮬레이션한다. Crowd emitter는 입력 이미지에서 추출한 공간 레이아웃에 기반하여 에이전트 유형과 이동 속도 같은 속성을 diffusion model을 통해 개별적으로 할당한다. Crowd simulator는 마코프 체인 기반 상태 전환 메커니즘을 활용하여 충돌 회피, 집단 상호작용과 같은 중간 행동을 포함한 상세 경로를 생성한다. 이 프로토콜은 군중 행동의 실시간 제어와 커스터마이징을 가능하게 하여, 로봇이 동적이고 이기종적인 환경 내에서 내비게이션하고 상호작용할 수 있도록 한다. 구현은 agent placement를 위한 diffusion model과 행동 보강을 위한 동적 시스템 전환 기술을 활용하여, 사실성과 유연성을 모두 확보한다.

**Spatial Population Protocols (Gąsieniec et al., 2024)**  
Spatial Population Protocols(SPPs)는 익명 로봇들 사이의 분산 로컬라이제이션 문제(DLP)를 해결하기 위해 제안되었다. 이 프로토콜은 로봇들이 임의의 초기 위치 및 좌표계에서 시작하더라도, 쌍별(pairwise) 상호작용을 통해 통일된 좌표계에 대한 합의에 도달할 수 있도록 한다. 핵심 혁신은 각 로봇이 하나 또는 고정된 수의 좌표만을 기억하면서, 상호작용 중 다른 로봇과의 거리 또는 벡터를 쿼리할 수 있다는 점이다. 이 프로토콜은 다음 세 가지 변형으로 구현된다:

- **자기 안정 거리 쿼리 프로토콜(Self-stabilising Distance Query Protocol)**: 쌍별 거리 정보를 기반으로 라벨을 조정하며, $O(n)$ 병렬 시간 내에 $\epsilon$-안정성에 도달한다. 무작위 구성을 잘 처리하지만 특정 어려운 경우에는 한계가 있다.
- **리더 기반 거리 쿼리 프로토콜(Leader-based Distance Query Protocol)**: 리더를 기준점으로 삼아 좌표계를 고정하고, 다중 접촉 전파(epidemic) 과정을 통해 $O(n)$보다 빠른 준선형 시간(sublinear time)에 안정화된다.
- **자기 안정 벡터 쿼리 프로토콜(Self-stabilising Vector Query Protocol)**: 벡터 쿼리를 활용하여 $O(\log n)$ 병렬 시간 내에 초고속 안정화가 가능하며, 더 풍부한 기하 정보를 이용한 상호작용의 효율성을 보여준다.

이러한 프로토콜은 로봇-에이전트 상호작용에 견고한 기반을 제공하며, 분산 시스템에서의 효율적이고 정확한 로컬라이제이션을 가능하게 한다.

##### 3.2.2.3 System-Agent Interaction Protocol

System-Agent Interaction Protocol은 복잡한 디지털 생태계 내에서 AI 에이전트를 조정하고 관리하며 통합하기 위한 기초 인프라를 제공한다. 이 범주는 에이전트 탐색, 상호운용성, 수명 주기 관리, 안전한 통신 등의 과제를 해결하는 프로토콜을 포함한다. 특히, Language Model Operating System(LMOS)은 개방성과 확장성을 강조하며, 다중 에이전트 시스템 구축 및 운영을 위한 포괄적인 프레임워크를 제공한다. agents.json 명세는 AI와 호환 가능한 인터페이스 및 워크플로우를 선언하는 표준화된 기계 판독 가능 형식을 도입하여, 기존 API와 AI 에이전트 간의 원활한 통합을 가능하게 한다. 한편, Agent Protocol은 프레임워크 독립적인 통신 표준을 정의하여, 제어 콘솔이 에이전트의 운영을 효과적으로 관리할 수 있도록 한다. 이들 프로토콜은 상호운용 가능하고 확장 가능하며 안전한 AI 에이전트 생태계의 개발 및 배포를 위한 견고한 기반을 제공한다.

**LMOS (Eclipse, 2025)**  
Eclipse 재단 주도로 개발된 Language Model Operating System(LMOS) 프로토콜은 Internet of Agents(IoA)를 구축하기 위한 기반 아키텍처를 제공한다. 이는 분산형, 상호운용 가능하며 확장 가능한 생태계로, AI 에이전트와 도구가 기반 기술에 상관없이 게시, 탐색, 상호 연결될 수 있도록 한다. Matter/Thread, ActivityPub과 같은 개방형 프로토콜에서 영감을 받아, LMOS는 다음 세 개의 계층으로 구성된다: (1) **응용 프로토콜 계층**: JSON-LD 및 시맨틱 모델을 사용하여 에이전트 탐색과 상호작용을 표준화한다; (2) **전송 프로토콜 계층**: HTTP, MQTT, AMQP와 같은 통신 프로토콜에 대한 상황 인식적 협상을 가능하게 한다; (3) **신원 및 보안 계층**: W3C DID를 통한 보안성 있고 검증 가능한 신원을 보장하며, OAuth2 등의 인증 체계를 지원한다. 주요 구성 요소에는 탈중앙화된 에이전트/도구 설명, 메타데이터 전파 메커니즘, 그룹 관리 프로토콜, 유연한 에이전트 통신 인터페이스가 포함된다. LMOS는 ARC, LangChain, LlamaIndex와 같은 도구와 통합된 오픈소스 클라우드 네이티브 플랫폼으로 구현된다. 고객 서비스, 제조업 등의 도메인에서, 에이전트가 도구 및 조직 간 문제 해결과 운영 최적화를 자율적으로 조정하는 유스케이스에 활용된다.

**Agent Protocol (AiEngineerFoundation, 2025)**  
Agent Protocol은 오픈소스 기반의 프레임워크 독립적 통신 표준으로, 제어 콘솔과 AI 에이전트 간의 원활한 상호작용을 가능하게 하기 위해 설계되었다. OpenAPI v3를 기반으로 하며, 에이전트의 시작, 중지, 모니터링 등 핵심 수명주기 작업을 실행하기 위한 통합 인터페이스를 정의한다. 이 프로토콜은 작업 실행을 위한 **Runs**, 다중 턴 상호작용 관리를 위한 **Threads**, 장기 기억을 위한 **Store**와 같은 핵심 추상화를 도입한다. 이러한 기능을 표준화함으로써, Agent Protocol은 다양한 시스템에 걸쳐 이기종 에이전트를 조정할 수 있는 역량을 개발자에게 제공하고, 다중 에이전트 환경에서 상호운용성, 확장성, 운영 투명성을 증진시킨다.

Inter-Agent Protocol과 Context-Oriented Protocol 사이에는 일정한 관계가 존재한다. 컨텍스트 지향 상호작용 내에서는, 인터랙티브 도구들이 자율성이 낮은 에이전트로 간주될 수 있다. 반대로, 에이전트 간 상호작용에서는, 통신하는 에이전트들이 특정 지능 작업을 수행하기 위해 설계된 더 높은 자율성을 가진 도구로 해석될 수 있다. MCP와 같은 프로토콜을 통해 연결되는 기존의 도구들과는 달리, 도구로서 작동하는 에이전트는 작업의 발신자 역할도 수행할 수 있다. 연결된 에이전트는 이어서 다른 에이전트나 기존 도구에 요청을 발행하고 상호작용할 수 있다. 이 추상화 수준에서, 도구는 본질적으로 에이전트가 보유한 특정 기술 또는 기능을 나타낸다. 장기적으로 볼 때, 컨텍스트 지향 상호작용과 자율 에이전트 상호작용이라는 두 패러다임은 점차 설계와 응용에서 수렴하며, 점점 더 동질화될 가능성이 있다.

---

## 4 Protocol Evaluation and Comparison

에이전트 통신 프로토콜의 급속한 발전 속도에서, 정적인 성능 또는 기능 비교는 빠르게 시대에 뒤처지게 된다. 예를 들어, MCP는 2024년 11월에 처음 소개되었을 당시 HTTP 및 인증 메커니즘을 지원하지 않았지만, 2025년 초에는 HTTP Server-Sent Events(SSE)와 인증 기능을 포함하게 되었고, 이후에는 HTTP Streaming으로 전환되었다. 이는 인터넷 시대의 TCP/IP에서 HTTP로의 발전을 반영하며, 기능, 성능, 보안의 지속적인 향상을 나타낸다.

따라서 이 절에서는 특정 평가 기준을 제안하기보다는, LLM 에이전트 통신 프로토콜을 설계하고 평가할 때 고려해야 할 핵심 차원과 과제를 식별하는 데 초점을 맞춘다. 인터넷 프로토콜의 발전 과정에서 관찰된 7가지 핵심 지표(상호운용성, 성능 효율성, 신뢰성, 확장성, 보안성, 진화 가능성, 단순성)에 영감을 받아, 이러한 차원이 LLM 에이전트 프로토콜에 어떻게 적용될 수 있는지를 살펴본다. 다음의 표 4에 나타나 있듯이, 이러한 평가 차원을 구체화함으로써, LLM 에이전트 프로토콜의 효과적인 설계와 평가에 필수적인 고려사항을 포괄적으로 이해하고, 지능형 에이전트 시스템의 발전에 기여하는 것을 목표로 한다.

### 4.1 Efficiency

효율성은 에이전트 프로토콜을 평가할 때 중요한 차원으로, 처리량 관리, 지연 시간 최소화, 핸드셰이크 오버헤드 최적화, 메시지 헤더 크기 축소 등의 측면에서 효율성을 측정한다. 에이전트 시대의 효율성은 전통적인 인터넷 프로토콜의 지표를 넘어서서, 의미 기반 처리, 동적 작업 조정(Liu et al., 2022), 토큰 사용 비용과 같은 고유한 요구 사항을 포함한다. 이상적인 프로토콜은 지연 시간이 짧고 작업을 신속하게 완료하며 자원 오버헤드가 최소화되어야 하며, 복잡한 다중 에이전트 시스템에 적응할 수 있어야 한다.

**Latency**  
효율성을 평가하는 핵심 지표 중 하나는 통신 지연 시간으로, 메시지가 전송되어 수신되고 파싱될 때까지의 시간을 측정한다. 에이전트 프로토콜에서는 지연 시간이 네트워크 전송(Jiang et al., 2018)뿐 아니라, 의미 처리와 프로토콜 고유의 오버헤드에 의해서도 영향을 받는다. HTTP와 같은 전통적 프로토콜이 데이터 전송에만 초점을 맞춘 반면, 에이전트 프로토콜은 추가 계층을 처리해야 한다. 테스트는 낮은 대역폭, 높은 지연 시간 등의 다양한 네트워크 조건에서 왕복 시간(round-trip time)을 측정하는 방식으로 수행된다.

**Throughput**  
처리량은 초당 처리되는 메시지 또는 작업 수로 정량화되며, 에이전트 시스템에서 동시 상호작용을 얼마나 잘 처리할 수 있는지를 평가한다. 메시지에 복잡한 메타데이터가 포함될 수 있기 때문에, 전통적인 간단한 페이로드를 처리하는 프로토콜보다 처리량이 낮을 수 있다. 이를 평가하기 위해 TPS-N(동시성 수준 $N$에서의 초당 처리량)이라는 지표를 제공한다.

$$
\text{TPS-N} = \frac{\text{\#Processed Messages}}{\text{Elapsed Time}}
$$

**Table 4: Overview of protocol evaluation from different dimensions.**

| Dimension | Description | Key Metric |
| --- | --- | --- |
| Efficiency | 빠르고 자원 효율적인 통신 | - Latency <br> - Throughput <br> - Resource Utilization |
| Scalability | 도구/에이전트/네트워크 복잡도 증가에 따른 성능 안정성 | - Node Scalability <br> - Link Scalability <br> - Capability Negotiation |
| Security | 인증, 접근 제어, 데이터 보호를 통한 신뢰성 있는 상호작용 | - Authentication Mode Diversity <br> - Role/ACL Granularity <br> - Context Desensitization Mechanism |
| Reliability | 일관되고 정확하며 장애 허용이 가능한 통신 | - Packet Retransmission <br> - Flow and Congestion Control <br> - Persistent Connections |
| Extensibility | 기존 시스템을 방해하지 않고 새로운 기능으로 진화 가능 | - Backward Compatibility <br> - Flexibility & Adaptability <br> - Customization & Extension |
| Operability | 실제 시스템에 구현, 운영, 통합하는 용이성 | - Protocol Stack Code Volume <br> - Deployment & Configuration Complexity <br> - Observability |
| Interoperability | 다양한 플랫폼, 시스템, 네트워크 환경 간의 원활한 상호작용 | - Cross-System & Cross-Browser Compatibility <br> - Cross-Network & Cross-Platform Adaptability |

**Resource Utilization**  
자원 활용도는 헤더 크기와 토큰 사용량(LLM 기반 작업의 경우)을 포함하여, CPU, 메모리, 대역폭 등의 계산 자원 소비를 측정한다. 토큰 소비량은 의미 기반 처리나 동적 조정 등 LLM 기반 작업에서 소비되는 토큰 수를 측정하는 고유한 항목이다. 테스트는 일반적인 작업(예: 작업 할당, 도구 질의)에 대해 LLM 모니터링 도구를 통해 토큰 사용량을 프로파일링하여 수행된다.

### 4.2 Scalability

Scalability는 노드(에이전트 또는 도구) 수나 연결(링크) 수가 기하급수적으로 증가하더라도 에이전트 프로토콜이 성능과 가용성을 유지할 수 있는 능력을 의미하며, 점점 더 복잡하고 대규모화되는 다중 에이전트 시스템에서도 견고하게 동작할 수 있도록 보장해야 한다. 에이전트 시대의 확장성은 IP 주소 할당이나 캐싱과 같은 전통적인 인터넷 프로토콜의 관심사를 넘어서, 증가하는 에이전트 수, 동적 도구 통합, 고밀도 통신 네트워크의 효율적 처리 등을 포함한다. 확장 가능한 에이전트 프로토콜은 수천에서 수백만 개의 에이전트를 지원하고, 다양한 워크로드를 수용하며, 성능 저하 없이 새로운 기능을 통합할 수 있어야 한다.

**Node Scalability**  
Node scalability는 도구, 플러그인 또는 에이전트의 수 $N$이 증가함에 따라 프로토콜이 성능을 유지할 수 있는지를 측정하며, 대규모 네트워크를 지원할 수 있는 능력을 반영한다. IP와 같은 전통적인 인터넷 프로토콜은 CIDR (Fuller and Li, 1993)을 통해 주소 확장성을 관리하지만, 에이전트 프로토콜은 동적 노드 탐색과 조정도 처리해야 한다. 노드 확장성은 $N$이 증가함에 따른 성능 저하 곡선(예: 지연 시간, 처리량)을 분석하여 평가할 수 있다.

**Link Scalability**  
Link scalability는 통신 링크 수가 증가할 때 프로토콜의 성능을 측정하며, 잦은 상호작용이 이루어지는 고밀도 네트워크에서 중요하다. 이는 링크 밀도가 증가함에 따라 처리량, 지연 시간 등의 성능 지표를 추적함으로써 측정된다. 예를 들어, 1,000개의 에이전트가 완전 연결된 메시 네트워크와 희소 네트워크의 성능 차이를 비교할 수 있다. 에이전트 프로토콜은 각 연결에서 작업 수명 주기 관리, 인증 등의 링크 특화 오버헤드로 인해 계산 비용이 증가하는 문제에 직면한다.

**Capability Negotiation**  
Capability negotiation은 에이전트 간 또는 에이전트-도구 간의 통신 프로토콜, 기능, 작업 할당에 대한 동적 합의를 프로토콜이 얼마나 잘 지원하는지와, 네트워크 규모 증가에 따라 이러한 기능이 어떻게 확장되는지를 측정한다. 이를 위해 "Capability Negotiation Score (CNS)"라는 지표를 제공하며, 노드 수가 증가할 때 협상 성공률과 소요 시간을 측정하여 평가한다.

$$
\text{CNS} = \frac{\# \text{Successful Negotiations} / \# \text{Negotiation Attempts}}{\text{Average Negotiation Time}}
$$

### 4.3 Security

보안은 에이전트 프로토콜을 평가할 때의 핵심 차원으로, 에이전트 간 또는 에이전트-도구 간 상호작용이 신원 인증, 암호화, 무결성 검증을 통해 안전하게 보호되는지를 보장한다. 에이전트 시대의 보안은 SSL/TLS나 OAuth 같은 전통적인 인터넷 프로토콜 메커니즘을 넘어, 동적이며 탈중앙화되고 의미 기반으로 구동되는 에이전트 생태계의 고유한 과제를 해결해야 한다. 안전한 에이전트 프로토콜은 신뢰할 수 있는 신원 검증, 데이터 기밀성 보호, 메시지 무결성 보장, 세분화된 접근 제어를 제공해야 한다.

**Authentication Mode Diversity**  
Authentication mode diversity는 프로토콜이 지원하는 인증 메커니즘의 다양성을 평가하며, 다양한 사용 사례 및 보안 요구사항에 대한 유연성을 가능하게 한다. 이 지표는 지원되는 인증 방식의 수와 그것이 에이전트 간 또는 에이전트-도구 간 시나리오에 얼마나 적용 가능한지를 통해 측정할 수 있다.

**Role/ACL Granularity**  
Role/Access Control List(ACL) granularity는 프로토콜이 필드 수준, 엔드포인트 수준, 작업 수준 등 다양한 수준에서 권한을 명확히 정의하고 적용할 수 있는 능력을 측정한다. 이 지표는 역할 정의와 ACL 구성의 정밀도를 분석함으로써 평가되며, 예를 들어 어떤 에이전트가 도구의 응답 내 특정 데이터 필드 또는 특정 작업 엔드포인트에 접근 가능한지를 통해 측정한다.

**Context Desensitization Mechanism**  
Context desensitization mechanism은 에이전트 간 또는 에이전트-도구 간 상호작용에서 민감한 데이터를 익명화하거나 편집함으로써, 노출 위험을 최소화하는 프로토콜의 능력을 평가한다. 이 지표는 데이터 마스킹, 토큰화, 선택적 데이터 공유 등의 비식별화 기술이 존재하는지와 그 효과를 기반으로 평가된다.

### 4.4 Reliability

에이전트 프로토콜의 신뢰성은 다중 에이전트 시스템에서 에이전트 간의 안정적이고 정확한 통신을 보장하는 능력을 의미한다. 이는 인터넷 프로토콜이 신뢰할 수 있는 데이터 전송을 강조하는 것과 유사하게, 에이전트 프로토콜도 에이전트 간 메시지가 정확하고 완전하며 적시에 전달되도록 한다. 메시지 확인, 재전송, 흐름 제어, 혼잡 제어 등의 메커니즘을 통해 통신 중 발생할 수 있는 문제를 해결하며, 이는 인터넷 프로토콜이 네트워크상에서 신뢰성 있는 데이터 전송을 보장하는 방식과 유사하다. 또한, 에이전트 프로토콜은 개별 에이전트나 통신 링크가 실패하더라도 시스템 안정성을 유지할 수 있도록 장애 허용성과 복구 메커니즘을 통합한다. 이는 인터넷 프로토콜이 네트워크 장애에 적응하고 데이터 패킷을 우회시켜 신뢰성을 유지하는 방식과 유사하다.

**Packet Retransmission**  
TCP의 재전송 메커니즘과 유사하게, 에이전트 프로토콜은 타이머 기반 패킷 재전송을 구현할 수 있다. 송신 에이전트가 메시지를 보낸 후 일정 시간 내에 수신 에이전트로부터 확인 응답(ACK)을 받지 못하면, 자동으로 재전송을 수행한다. 또한, 수신 에이전트는 ACK 메시지에서 손실된 패킷을 송신 에이전트에 알릴 수 있으며, 송신자는 해당 패킷을 재전송함으로써 데이터 전송의 완전성과 정확성을 확보한다. 이 메커니즘은 네트워크 문제나 전송 실패를 감지했을 때 프로토콜이 메시지를 자동으로 재시도한 횟수를 나타내는 자동 재시도 횟수(ARC)로 평가할 수 있다.

$$
\mathrm{ARC} = \#\text{ message retransmissions when delivery fails}
$$

**Flow and Congestion Control**  
에이전트 프로토콜은 TCP와 유사한 흐름 및 혼잡 제어 메커니즘을 통합한다. 흐름 제어의 경우, 수신자는 가용한 수신 윈도우 크기를 송신자에게 전달하며, 송신자는 이를 기반으로 전송 속도를 동적으로 조정하여 버퍼 오버플로우 및 데이터 손실을 방지한다. 동시에 혼잡 제어는 슬로우 스타트(slow start), 혼잡 회피(congestion avoidance)와 같은 전략을 사용한다. 송신자는 작은 혼잡 윈도우로 네트워크 용량을 탐색하며, 피드백을 통해 점진적으로 윈도우 크기를 증가시킨다. 패킷 손실이나 지연 증가와 같은 혼잡 징후가 감지되면, 송신자는 혼잡 윈도우를 줄여 전송 속도를 감소시킨다. 이러한 제어 능력은 링크 용량 변화, 새로운 흐름의 병목 링크 진입 등에서 안정적인 전송률에 도달하는 데 걸리는 시간인 수렴 시간(CT)으로 평가할 수 있다.

$$
\mathrm{CT} = \text{clock time to reach a stable state when link changes}
$$

**Persistent Connections**  
에이전트 프로토콜은 에이전트 간 지속적인 연결을 설정할 수 있으며, 이는 여러 데이터 전송 동안 통신 채널을 유지하도록 한다. 각 상호작용마다 새 연결을 생성하는 대신, 지속 연결은 연결 설정 및 해제에 따른 오버헤드를 제거하여 지연 시간을 줄이고 전송 효율을 향상시킨다. 연결 안정성은 단위 시간당 예기치 않은 연결 끊김 횟수를 나타내는 예기치 않은 연결 끊김률(UDR)과, 전체 메시지 중 지정된 시간 내에 수신자에게 도달하지 못한 메시지 비율인 메시지 손실률(MLR)로 평가할 수 있다.

$$
\begin{aligned}
& \mathrm{UDR} = \frac{\# \text{unexpected disconnections}}{\text{unit time}} \\
& \mathrm{MLR} = \frac{\# \text{messages failing to reach the recipient}}{\# \text{messages sent}}
\end{aligned}
$$

### 4.5 Extensibility

에이전트 프로토콜의 확장성은 기존 시스템과의 호환성을 유지하면서도 새로운 기능을 추가하거나 기존 기능을 수정하여 새로운 요구사항이나 기술 발전에 유연하게 대응할 수 있는 능력을 의미한다. 이는 HTTP의 커스텀 헤더, IP 패킷의 옵션 필드처럼 인터넷 프로토콜이 진화해온 방식과 유사하게, 에이전트 프로토콜도 기존 시스템과의 호환성을 유지하면서 새로운 기능을 도입할 수 있는 유연한 프레임워크를 제공한다. 이를 통해 다중 에이전트 시스템의 요구가 커지고 변화함에 따라 프로토콜은 장기적으로 적합성과 효율성을 유지할 수 있다.

**Backward Compatibility**  
에이전트 프로토콜은 시간이 지남에 따라 진화하며, 이러한 변화 과정에서도 기존 기능과 응용이 영향을 받지 않도록 하위 호환성을 유지한다. 사용자는 기존 시스템에 큰 수정 없이도 새 버전의 프로토콜을 쉽게 도입할 수 있다. 하위 호환성은 프로토콜의 주요 버전 업그레이드 이후에도 이전 클라이언트가 서버와 정상적으로 상호작용할 수 있는 비율을 나타내는 업그레이드 성공률(USR)로 평가할 수 있다.

$$
\mathrm{USR} = \frac{\# \text{normal interactions after a major upgrade}}{\# \text{total interactions after a major upgrade}}
$$

**Flexibility and Adaptability**  
에이전트 프로토콜은 유연한 설계를 채택하여 기존 IT 스택과의 통합이 용이하며, 새로운 기술 발전 및 응용 시나리오에 맞게 프로토콜을 적응시킬 수 있다. 개발자는 필요에 따라 새로운 필드나 의미론을 추가하여 프로토콜을 확장할 수 있다. 모달리티 비종속 설계는 프로토콜의 확장성을 더욱 강화하며, 개발자가 텍스트 기반 통신 모드와의 호환성을 유지하면서 새로운 통신 모드를 정의할 수 있게 한다. 유연성과 적응성은 변경 로그에 명시된 새로운 기능을 자동으로 테스트하고 그 통과율을 계산하는 자동 테스트 통과율(ATPR)로 평가할 수 있다.

$$
\mathrm{ATPR} = \frac{\# \text{new features passing the test}}{\# \text{new features}}
$$

**Customization and Extension**  
에이전트 프로토콜은 특정 응용 요구를 충족하기 위해 개발자가 커스텀 필드를 추가할 수 있도록 하며, 이러한 필드는 기존 기능에 영향을 주지 않으면서도 다른 에이전트가 이를 발견하고 상호작용할 수 있도록 지원한다. 또한 표준화된 플러그인 시스템을 통해 기능 확장을 지원한다. 플러그인은 새로운 필드나 의미론을 도입하면서도 핵심 프로토콜과의 호환성을 유지할 수 있다.

### 4.6 Operability

에이전트 프로토콜의 운용성은 그것이 얼마나 쉽게 구현, 운영, 유지보수될 수 있는지를 의미한다. 인터넷 프로토콜이 널리 채택될 수 있도록 단순성과 명확성을 강조한 것처럼, 에이전트 프로토콜도 구현 용이성과 사용 편의성을 우선시한다. 명세는 간결하고 명확하여 개발자가 시스템에 빠르게 통합할 수 있게 하며, 프레임워크에 독립적이기 때문에 여러 프로그래밍 언어와 플랫폼을 지원하여 구현 복잡도를 줄이고 기술적 장벽을 낮춘다. 또한, 프로토콜은 포괄적인 문서, SDK, 클라이언트 라이브러리를 제공하여 개발자가 프로토콜을 효율적으로 구현할 수 있도록 지원한다. 계층적 아키텍처와 모듈화된 설계를 통해 개발자는 구성 요소를 독립적으로 구현 및 유지보수할 수 있어 유연성이 높고 운영 복잡도는 낮다. 운용성에 대한 정량적 평가지표는 에이전트 프로토콜 구현에 필요한 의존 구성 요소 수를 나타내는 의존 구성 요소 수(NDC)이다.

$$
\mathrm{NDC} = \# \text{dependency components required}
$$

**Protocol Stack Code Volume**  
에이전트 프로토콜은 경량 API 명세로 설계되어 있으며, 간결한 로직과 명확한 의미론을 가진 일련의 엔드포인트 및 사전 정의된 응답 모델을 정의한다. 코드 양이 적고 이해 및 구현이 용이하며, 개발자는 학습 곡선 없이도 빠르게 시스템에 통합할 수 있다. 예를 들어, 에이전트 프로토콜의 핵심 구성 요소인 Runs, Threads, Store 모듈은 전체 수명주기 관리, 상태 제어, 영속적 저장 기능을 제공하여 개발자가 비즈니스 로직 구현에 집중할 수 있도록 한다.

**Deployment and Configuration Complexity**  
에이전트 프로토콜은 프레임워크 독립적 접근 방식을 채택하고 있으며, 다양한 프로그래밍 언어 및 플랫폼을 지원한다. 이는 개발자가 선호하는 언어나 프레임워크를 활용하여 프로토콜을 구현할 수 있도록 하며, 또한 포괄적인 문서, SDK, 클라이언트 라이브러리를 제공하여 배포 및 구성 과정을 단순화한다.

**Observability**  
에이전트 프로토콜은 가시성(observability)을 강조하며, 메시지 처리량, 지연 시간, 오류율과 같은 성능 지표를 추적할 수 있는 모니터링 도구를 제공하여 운영자가 시스템 상태를 파악할 수 있도록 한다. 예를 들어, LMOS 플랫폼의 가시성 모듈은 엔터프라이즈 수준의 모니터링 기능을 제공하여 규제 요건을 충족시키며, 프로토콜은 개발자가 통신 중 문제를 진단하고 해결할 수 있도록 디버깅 도구 및 인터페이스도 제공한다. 이는 에이전트 프로토콜의 안정적인 운영을 보장하고, 운용성을 향상시킨다.
### 4.7 Interoperability

Agent Protocol의 상호운용성은 다양한 시스템, 프레임워크, 브라우저 및 기타 환경 간의 원활한 통신을 가능하게 하는 능력을 의미한다. 이는 인터넷 프로토콜이 다양한 장치와 시스템 간의 데이터 전송을 보장하기 위해 네트워크 통신에 대한 표준을 정의하는 방식과 유사하게, Agent Protocol은 다양한 플랫폼에서 개발된 에이전트들이 효과적으로 상호작용할 수 있도록 표준화된 통신 규칙과 데이터 포맷을 정의한다. 이를 통해 구현 방식이 서로 다른 에이전트들이 서로를 발견하고, 통신하며, 협력할 수 있게 하며, 이는 마치 서로 다른 시스템과 브라우저가 인터넷을 통해 정보를 주고받는 방식과 유사하다. 상호운용성은 Schema Compatibility Test Pass Rate (SCTPR)로 평가할 수 있으며, 이는 버전 충돌이나 데이터 포맷 문제 없이 에이전트가 얼마나 효과적으로 통신할 수 있는지를 반영한다.

Schema Compatibility Pass Rate (SC-PR) $=\frac{\# \text{성공한 테스트 케이스}}{\# \text{전체 스키마 호환성 테스트 케이스}}$

**시스템 간 및 브라우저 간 호환성**  
Agent Protocol은 서로 다른 운영 체제(예: Windows, macOS, Linux)와 브라우저(예: Chrome, Firefox, Safari)에서 실행되는 에이전트 간의 원활한 통신을 보장한다. 플랫폼 간의 차이를 추상화하는 표준화된 API 및 통신 인터페이스를 제공함으로써, 운영 체제나 브라우저 환경에 관계없이 동일한 프로토콜과 데이터 포맷을 사용해 상호작용할 수 있다. 예를 들어, Windows에서 Chrome을 사용해 개발된 에이전트가 macOS에서 Safari를 사용하는 다른 에이전트와 통신할 수 있다. 이러한 시스템 및 브라우저 간 호환성은 에이전트가 특정 플랫폼 특성에 적응할 필요를 제거하여 광범위한 상호운용성을 가능하게 한다.

**네트워크 간 및 플랫폼 간 적응성**  
Agent Protocol은 로컬 네트워크(LAN), 광역 네트워크(WAN), 인터넷을 포함한 다양한 네트워크 환경을 지원한다. 네트워크 조건이 변화하더라도 안정적인 통신을 보장할 수 있도록 적응할 수 있다. 또한 다양한 프로그래밍 언어 및 플랫폼을 지원하므로, 개발자는 선호하는 언어와 프레임워크를 사용해 에이전트를 구현할 수 있다. 예를 들어, Python으로 개발된 에이전트가 Java로 개발된 다른 에이전트와 상호작용할 수 있다. 이러한 플랫폼 및 언어 간 호환성은 기술 스택이 다른 환경에서도 에이전트 간의 통신과 협력을 가능하게 하여 상호운용성을 증대시킨다.

### 4.8 Evaluation over Protocol Evolution: Case Studies

에이전트 통신 프로토콜을 설계하고 평가하는 과정에서, 그 진화 경로를 관찰하면 기능성, 성능, 보안 측면에서 프로토콜이 새로운 요구사항과 도전에 어떻게 적응하는지를 파악할 수 있다. 아래 분석은 두 가지 대표적인 사례 — 프로토콜의 반복(iteration)과 시스템 수준 진화(system evolution) — 를 통해, 에이전트 프로토콜이 실제 환경에서 어떻게 지속적으로 발전해 나가는지를 설명한다.

**MCP의 반복**  
MCP v1.0에서 v1.2로의 전환은 HTTP 스트리밍과 인증(Auth)에 대한 지원을 도입하였다. 이 변화는 다음과 같은 영향을 가져왔다:

- **상호운용성 향상**: HTTP 지원이 추가됨으로써, MCP는 보다 광범위한 외부 시스템 및 서비스와 통합될 수 있어 프로토콜의 호환성과 적용 가능성이 향상되었다.
- **보안성 강화**: 토큰 기반 인증 메커니즘이 도입되어 데이터 전송의 보안성과 신원 검증의 신뢰성이 확보되었다.
- **성능 영향**: HTTP 스트리밍은 보다 효율적인 데이터 전송을 가능하게 했지만, 새로운 지연 요소(latency)가 발생할 수 있어 스트리밍 지연 성능에 대한 재평가와 최적화가 필요했다.

이러한 반복(iteration)은 기능 확장, 성능 최적화, 보안성 향상 간의 균형을 맞추는 프로토콜 설계의 다차원적인 트레이드오프(trade-off)를 보여준다.

**MCP에서 ANP 및 A2A로의 진화**  
MCP에서 ANP를 거쳐 A2A로의 발전은 단일 기능 중심의 프로토콜에서 보다 복잡하고 다층적인 협력 아키텍처로의 전환을 나타낸다:

- **MCP**: LLM을 위한 구조화된 컨텍스트와 툴 통합 제공에 중점을 두며, 모델과 외부 리소스 간의 연결을 강조함.
- **ANP**: W3C DID와 같은 탈중앙 신원(decentralized identity) 메커니즘을 도입하여 에이전트 간 P2P 통신을 가능하게 하고, 시스템의 자율성과 유연성을 향상시킴.
- **A2A**: 기업 수준의 에이전트 간 협력을 위한 표준화된 프레임워크를 제공하며, 작업 관리, 메시지 교환, 멀티모달 출력 등을 지원하여 플랫폼 및 벤더 간 협업을 촉진함.

이러한 진화 과정은 기본적인 기능 중심의 설계에서 복잡한 시스템 협업으로의 전환을 보여주며, 에이전트 생태계가 확장성과 다양성 측면에서 지속적으로 발전하고 있음을 반영한다.

위 사례들을 통해 우리는 에이전트 통신 프로토콜의 발전 경로를 명확히 확인할 수 있으며, 미래의 반복 목표를 식별할 수 있다. 각 프로토콜의 장단점을 직접 비교하지는 않지만, 에이전트 개발자 및 연구자를 위한 다음과 같은 권고사항을 제시한다:

- **문맥 적합성 고려**: 특정 응용 시나리오에 따라 적절한 프로토콜을 선택하라. 예를 들어, MCP는 외부 도구 및 데이터 소스 통합이 필요한 시나리오에 적합하며, ANP는 인터넷 상에서 에이전트 간의 도메인 간 통신과 협업에 적합하다. A2A는 에이전트 간 협업을 위한 보다 포괄적인 지원을 제공한다.
- **보안 및 성능 중시**: 프로토콜 선택 및 구현 시, 인증 메커니즘, 데이터 전송 보안, 성능 최적화에 주의를 기울여야 하며, 이를 통해 시스템의 신뢰성과 효율성을 확보할 수 있다.
- **프로토콜 진화 모니터링**: 에이전트 프로토콜이 지속적으로 발전하고 있는 만큼, 새로운 프로토콜 및 버전에 대한 지속적인 모니터링이 필수적이다. 이는 기존 시스템에 대한 영향 평가 및 잠재적인 최적화 기회 발굴에 있어 중요한 역할을 한다.

<img src="./images/fig_01_04.png" width=800>

Figure 4: 동일한 사용자 지시에 따라 네 가지 프로토콜을 분석한 사례 연구.

---

## 5 Use-Case Analysis

이 섹션에서는 동일한 사용 사례(베이징에서 뉴욕까지 5일간의 여행 계획)에 적용된 네 가지 지능형 에이전트 프로토콜 — MCP, A2A, ANP, Agora — 에 대한 비교 분석을 제공한다. Figure 4는 각 프로토콜의 아키텍처 차이와 상호작용 패턴을 보여준다.

### 5.1 MCP: Single Agent Invokes All Tools

Model Context Protocol (MCP)은 단일 에이전트가 모든 외부 서비스와의 상호작용을 조율하는 중앙집중식 접근 방식을 나타낸다. Figure 4 (좌측 상단)에 나타난 바와 같이, MCP Travel Client는 조정 에이전트로서 모든 외부 서비스에 직접 의존한다:

- 중앙의 MCP Travel Client는 Flight Server, Hotel Server, Weather Server를 각각 get_flights(), get_hotels(), get_weather() 호출을 통해 직접 호출한다.
- 모든 외부 서비스는 정보를 제공하는 도구로 취급되며 서로 간의 상호작용은 없다.
- 정보 흐름은 MCP Travel Client를 중심으로 별 모양(star pattern) 구조를 따른다.
- 클라이언트는 모든 응답을 수집하고 전체 여행 계획을 생성하는 책임을 진다.

MCP 아키텍처는 단순성과 제어 측면에서 우수하지만 유연성은 부족하다. 중앙 에이전트는 모든 서비스와 인터페이스에 대한 지식을 갖고 있어야 하며, 이는 높은 의존성 구조를 만들어 확장 또는 수정이 어려울 수 있다. 또한 모든 통신이 중앙 에이전트를 거쳐야 하므로 성능 병목이 발생할 수 있다.

### 5.2 A2A: Complex Collaboration Inter-agents Within an Enterprise

Agent-to-Agent (A2A) 프로토콜은 복잡한 작업을 위해 다양한 에이전트 간의 직접 통신을 가능하게 한다. Figure 4 (우측 상단)에 나타난 A2A 구현은 여러 전문화된 에이전트에 지능을 분산시킨다:

- 에이전트는 논리적 부서(교통, 숙박 및 활동)로 구성된다.
- 각 에이전트는 명시적 의존성을 가진다: Flight Agent와 Activity Agent는 환경 정보를 위해 Weather Agent에 의존한다.
- 에이전트들은 상호작용마다 중앙 조정 없이 직접 통신한다.
- A2A Travel Planner는 주로 최종 결과를 수집하는 비중앙 조정자 역할을 한다.

A2A 프로토콜은 에이전트가 필요 시 직접 연결을 형성할 수 있는 보다 유연하고 현실적인 아키텍처를 제공한다. 예를 들어, A2A Flight Agent는 Travel Planner를 거치지 않고 Weather Agent로부터 직접 기상 정보를 얻을 수 있다. 이는 불필요한 통신 오버헤드를 줄이고, 조직이나 다중 에이전트 시스템에서 더 복잡한 협업 패턴을 가능하게 한다.

### 5.3 ANP: Cross-Domain Agent Protocol

Agent Network Protocol (ANP)은 표준화된 도메인 간 상호작용을 통해 협업을 확장한다. Figure 4 (좌측 하단)은 ANP가 서로 다른 조직 도메인에 속한 에이전트 간의 협상을 어떻게 가능하게 하는지를 보여준다:

- 항공사, 호텔, 날씨 웹사이트 등 서로 다른 조직 경계가 존재한다.
- 도메인 간 협업은 공식적인 프로토콜 기반 요청과 응답을 통해 이루어진다.
- Flight Agent는 도메인 경계를 넘어 Weather Agent와 협상한다.
- Travel Planner는 전체 프로세스를 조정하지만 모든 상호작용을 중재하지는 않는다.

ANP는 독립적인 에이전트 간의 협업에서 발생하는 문제를 프로토콜 기반 상호작용을 공식화함으로써 해결한다. A2A가 메시지 기반 위임에 초점을 두는 반면, ANP는 에이전트 간 구조화된 요청 및 응답을 위한 명확한 프로토콜을 정의한다. 이는 명확한 인터페이스와 기능을 가진 에이전트들이 동일한 시스템 내 또는 여러 시스템 간에 존재하는 경우에도 효과적인 시나리오에 적합하다.

### 5.4 Agora: Natural Language to Protocol Generation

Agora 프로토콜은 자연어 요청을 표준화된 프로토콜로 직접 변환하는 가장 사용자 중심적인 접근 방식을 나타낸다. Figure 4 (우측 하단)에 나타난 바와 같이, Agora는 여러 개의 고유한 계층을 도입한다:

- 프로세스는 사용자 요청을 구조화된 구성요소(출발지, 목적지, 기간, 예산)로 파싱하는 자연어 이해로 시작된다.
- 프로토콜 생성 계층은 이러한 구성요소를 서비스 유형별 공식화된 프로토콜로 변환한다.
- 프로토콜 배포는 해당 프로토콜을 전문화된 에이전트(항공, 호텔, 날씨, 예산)에 전파한다.
- 각 에이전트는 자유형 요청이 아닌 명확한 프로토콜에 응답한다.

Agora의 세 단계 프로세스(이해, 생성, 배포)는 전문화된 에이전트가 자연어 처리의 복잡성으로부터 분리될 수 있는 높은 적응력을 가진 시스템을 만든다. 이러한 역할 분리는 도메인별 에이전트가 본래의 기능에 집중할 수 있도록 하며, 사용자 의도 해석은 Agora 계층이 담당한다.

이 사례 연구를 통해 각 프로토콜이 성공적으로 적용되기 위해 필요한 특정 조건과 의존성이 명확히 드러난다.  
1) **MCP**는 도구를 순차적으로 호출하는 중앙 에이전트(예: 여행 어시스턴트)를 사용하며, 명확한 인터페이스를 가진 작업에 적합하다. 이 방식은 정형화된 워크플로우에서는 효율적이나, 새로운 시나리오에 대응하려면 중앙 에이전트의 수정이 필요하다.  
2) **A2A**는 전문화된 에이전트(예: 항공, 호텔, 날씨) 간의 메시지/데이터 교환을 통해 협업을 가능하게 한다. 각 에이전트는 자체 작업을 자율적으로 처리하고 결과를 조정 에이전트에게 전달하며, 유연한 통신 패턴을 유지하면서 전체 조정을 수행할 수 있다.  
3) **ANP**는 구조화된 프로토콜 기반 상호작용을 활용하며, 주요 에이전트는 처리 로직을 유지하되 구체적인 실행 단계를 명확한 API 인터페이스를 통해 위임한다. 이 방식은 에이전트가 동일 시스템 내부 또는 여러 도메인에 존재하더라도 효과적이다.  
4) **Agora**는 자연어를 적절한 구조화 프로토콜로 변환하는 데 중점을 두며, 사용자 의도를 각 에이전트가 요구하는 명시적 프로토콜로 매핑하는 중간 계층 역할을 한다.  

각 프로토콜의 적용 가능성은 에이전트 자율성 수준, 통신 유연성, 인터페이스 표준화 수준, 수행 작업의 복잡성 등 다양한 요소에 따라 달라진다.

---

## 6 Academic Outlook

에이전트 프로토콜의 개발은 빠르게 진전되고 있다. 본 섹션은 단기, 중기, 장기 관점에서 이 분야의 향후 진화 방향을 개괄하며, 연구 동향, 새로운 도전 과제, 그리고 미래 지향적인 비전을 강조한다.

### 6.1 Short-Term Outlook: From Static to Evolvable

**평가 및 벤치마킹**  
다양한 에이전트 응용을 위한 여러 프로토콜이 제안되었지만, 그 효과를 평가할 수 있는 통합된 벤치마크는 아직 충분히 탐구되지 않았다. 최근에는 단순한 작업 성공률을 넘어, 통신 효율성, 환경 변화에 대한 견고성, 적응력, 확장성 등을 포함하는 평가 프레임워크 설계로 연구가 수렴되고 있다. 다양한 시뮬레이션 환경과 표준화된 테스트베드의 개발은 통제된 시나리오와 열린 시나리오를 모두 제공함으로써, 프로토콜 간의 공정하고 일관된 비교를 가능하게 할 것으로 기대된다.

**프라이버시 보호 프로토콜**  
에이전트가 점점 더 민감한 영역(예: 의료, 금융)에서 활동함에 따라, 안전하고 기밀성 있는 통신 보장이 필수적이다. 향후 연구는 에이전트가 내부 상태나 개인정보 노출을 최소화하면서 정보를 교환할 수 있는 프로토콜 개발을 탐색해야 한다. 정보 접근은 에이전트의 역할, 작업, 보안 등급과 같은 속성을 기반으로 한 권한 부여 메커니즘에 의해 관리될 수 있다. 또한, 연합 학습(federated learning)에서 영감을 얻어(Zhang et al., 2021), 에이전트가 민감한 원시 데이터를 전송하는 대신, 로컬에서 얻은 통합된 통찰, 유도된 정보 또는 익명화된 중간 결과를 공유함으로써 협업을 가능하게 하는 프로토콜이 고안될 수 있다.

**에이전트 메시 프로토콜**  
기존의 에이전트 상호작용 프로토콜은 대부분 에이전트 간 쌍방 통신에 초점을 맞추고 있으며, 에이전트의 수와 복잡성이 증가함에 따라 비효율적으로 변할 수 있다. 이러한 한계를 극복하기 위해, 우리는 디지털 시대의 인간 그룹 채팅에서 영감을 받은 통신 모델인 ‘Agent Mesh Protocol’의 개발을 구상한다. 이 프로토콜은 에이전트 그룹 내에서의 완전한 투명성과 커뮤니케이션 기록에 대한 공유 접근을 가능하게 하여 보다 효과적인 조율과 협력적 의사결정을 촉진할 수 있다. 메시 프로토콜의 구현을 위해서는 그룹 수준의 의미론을 지원하고, 공유 지식의 일관성과 동기화를 유지하며, 메시지 순서, 동적 그룹 구성원 변경, 통신 오버헤드와 같은 도전을 효과적으로 처리할 수 있는 메커니즘 설계가 필요하다.

**진화 가능한 프로토콜**  
프로토콜을 정적인 규칙으로 보기보다는, 미래의 에이전트 시스템은 이를 동적이고 모듈화 가능하며 학습 가능한 구성 요소로 간주하는 ‘진화 가능한 프로토콜(evolvable protocols)’ 개념을 도입할 수 있다. 이 패러다임에서는 프로토콜이 외부에서 부과되는 불변의 프레임워크가 아니라, 에이전트가 능동적으로 관리하고 정제할 수 있는 자원이 된다. 에이전트는 특정 프로토콜 모듈을 검색하거나, 여러 프로토콜의 요소를 결합해 현재 작업의 요구사항에 맞춘 맞춤형 통신 전략을 구성할 수 있다. 나아가 에이전트는 시간이 지남에 따라 통신 효율성이나 작업 성공률을 향상시키는 최적의 프로토콜 변형이나 협상 전략을 학습할 수 있다. 이러한 적응성은 에이전트 시스템이 새로운 상황에 일반화하고, 특정 파트너나 조건에 맞춰 상호작용을 최적화하며, 더 복잡한 협력 시나리오로 확장할 수 있도록 한다.

### 6.2 Mid-Term Outlook: From Rules to Ecosystems

**내장형 프로토콜 지식**  
추론 시점에 프로토콜 지침을 공급하는 대신, 미래에는 프로토콜의 내용과 구조를 모델의 파라미터에 통합하여 대형 언어 모델을 학습시키는 가능성을 탐색할 수 있다. 이를 통해 에이전트는 명시적인 프롬프트 없이도 프로토콜 준수 행동을 실행할 수 있으며, 보다 효율적이고 원활한 상호작용이 가능해진다. 그러나 프로토콜 지식을 학습 시 직접 주입하는 방식은 적응성에 한계를 초래한다. 모델이 일단 학습되면 프로토콜 표준의 업데이트나 수정 반영이 어려워지기 때문이다. 그럼에도 불구하고 어떤 프로토콜을 내장시킬 것인지에 대한 선택은 향후 표준과 경쟁 구도에 전략적 중요성을 가질 수 있다.

**계층형 프로토콜 아키텍처**  
프로토콜 설계는 현재의 분리된 구조에서, 통신의 여러 수준을 분리하는 계층형 프로토콜 아키텍처로 진화할 수 있다. 저수준의 전송 및 동기화 메커니즘을 고수준의 의미론적 및 작업 관련 상호작용과 분리함으로써, 이러한 아키텍처는 이기종 에이전트 간의 모듈성과 확장성을 향상시킬 수 있다. 전통적인 네트워크 프로토콜 설계에서 영감을 받은 이 구조는, 각 계층의 공통 추상화를 준수함으로써 다양한 에이전트 간의 효율적인 상호운용을 가능하게 한다. 더 나아가, 계층형 아키텍처는 동적 프로토콜 구성의 길을 열 수 있으며, 에이전트가 상황에 맞게 상호작용 계층을 협상하거나 자동 선택할 수 있게 한다. 이는 규칙 기반의 경직된 행동에서 보다 유동적이고 생태계 수준의 행동으로의 전환을 의미한다. 이러한 적응성은 규범, 선호, 목표가 시간에 따라 변화하는 인간-AI 혼합 환경에서 매우 중요하다. 계층형 프로토콜은 또한 상위 계층에서 윤리적, 법적, 사회적 제약을 통합하여 에이전트의 행동이 보다 넓은 사회적 가치와 정렬될 수 있도록 할 수 있다.

### 6.3 Long-Term Outlook: From Protocols to Intelligence Infrastructure

**집단 지능과 스케일링 법칙**  
에이전트 프로토콜이 성숙함에 따라, 장기적인 유망 방향 중 하나는 대규모 상호 연결된 에이전트 집단 내에서 집단 지능(collective intelligence)의 출현을 탐색하는 것이다. 기존의 다중 에이전트 시스템, 군집 지능(swarm intelligence), 복잡 적응 네트워크에 대한 연구를 기반으로, 미래 연구는 에이전트와 환경의 스케일링 법칙—즉, 집단 크기, 통신 토폴로지, 프로토콜 구성 방식이 시스템 수준의 행동, 창발적 속성, 견고성에 어떻게 영향을 미치는지를 탐구할 수 있다. 전통적인 시뮬레이션과 달리, 인터넷 기반의 탈중앙화된 에이전트 프로토콜의 등장은 이러한 동역학을 웹 스케일에서 관찰하고 분석할 수 있게 한다. 장기적으로 이러한 연구 결과는 분산형 에이전트 집합체를 새로운 계산 기반 구조로서 원칙에 따라 설계하는 데 기여할 수 있다—이는 개별 능력을 초월하는 지능을 구현할 수 있는 확장 가능하고 적응적인 시스템이 될 수 있다.

**에이전트 데이터 네트워크 (ADN)**  
동시에, 자율 에이전트의 통신 및 조율을 최적화하기 위한 기반 데이터 인프라인 ‘에이전트 데이터 네트워크(ADN)’의 등장이 예상된다. 기존 웹 상호작용은 주로 인간 해석과 프론트엔드 렌더링에 중점을 두는 반면, ADN은 구조화되고 의도 기반이며 프로토콜을 준수하는 정보 교환을 에이전트 간에 지원한다. ADN은 여전히 기존 인터넷 스택(TCP/IP 및 HTTP 등) 위에서 작동하지만, 의미론적 추상화 관점에서의 전환을 나타낸다. 에이전트는 점점 더 인간 가독성의 웹 콘텐츠가 아니라, 잠재적 작업 상태(latent task states), 분산 메모리 스냅샷, 시간 기반 컨텍스트 로그와 같은 기계 중심 데이터 표현에 의존하게 될 것이다. 이 네트워크 계층은 에이전트의 작동 요구를 직접적으로 지원하여, 영속적인 상태 동기화, 장기 계획, 비동기 협업 등을 가능하게 하며, 인간의 개입이나 가시성을 필요로 하지 않는다.

---

## 7 Conclusion

본 설문에서는 기존 AI 에이전트 프로토콜에 대한 최초의 포괄적 분석을 제공하였다. 프로토콜을 체계적으로 이차원 분류 체계로 분류하고, 효율성, 확장성, 보안성과 같은 주요 성능 차원을 평가함으로써, 실무자와 연구자 모두를 위한 실질적인 참조 자료를 제시하였다. 이 구조화된 개요는 사용자들이 점점 더 확장되는 에이전트 프로토콜 생태계를 보다 잘 탐색할 수 있도록 도와줄 뿐만 아니라, 신뢰할 수 있고 효율적이며 안전한 에이전트 시스템을 구축하는 데 수반되는 트레이드오프와 설계 고려사항들을 부각시킨다. 향후를 내다보면, 진화 가능한(evolvable), 프라이버시 인지형(privacy-aware), 그룹 조정형(group-coordinated) 프로토콜과 같은 차세대 프로토콜의 출현뿐만 아니라, 계층형 아키텍처 및 집단 지능 인프라의 등장도 예상된다. 에이전트 프로토콜의 발전은 보다 연결되고 협업 가능한 에이전트 생태계로 나아가는 길을 열어줄 것이며, 여기서 에이전트와 도구는 동적으로 연합을 형성하고, 지식을 교환하며, 점점 더 복잡한 현실 문제를 해결하기 위해 함께 진화해 나갈 수 있을 것이다. 이는 마치 인터넷의 기초 프로토콜들이 그랬던 것처럼, 향후 에이전트 통신 표준이 분산된 집단 지능의 새로운 시대를 여는 열쇠가 되어, 지능이 시스템 전반에 걸쳐 어떻게 공유되고, 조율되며, 증폭되는지를 재편할 잠재력을 지닌다.

---

## References

- Davide Caffagni, Federico Cocchi, Luca Barsellotti, Nicholas Moratelli, Sara Sarto, Lorenzo Baraldi, Marcella Cornia, and Rita Cucchiara. *The (r) evolution of multimodal large language models: A survey*. arXiv preprint arXiv:2402.12451, 2024.

- OpenAI, Josh Achiam, Steven Adler, Sandhini Agarwal, et al. *Gpt-4 technical report*, 2024. URL https://arxiv.org/abs/2303.08774.

- Juraj Gottweis, Wei-Hung Weng, Alexander Daryin, Tao Tu, Anil Palepu, et al. *Towards an ai co-scientist*, 2025. URL https://arxiv.org/abs/2502.18864.

- Yingxuan Yang, Bo Huang, Siyuan Qi, et al. *Who's the mvp? A game-theoretic evaluation benchmark for modular attribution in llm agents*, 2025a. URL https://arxiv.org/abs/2502.00510.

- Taicheng Guo, Xiuying Chen, Yaqi Wang, et al. *Large language model based multi-agents: A survey of progress and challenges*. In International Joint Conference on Artificial Intelligence, 2024. URL https://api.semanticscholar.org/CorpusID:267412980.

- Ruiwen Zhou, Yingxuan Yang, Muning Wen, et al. *Trad: Enhancing llm agents with step-wise thought retrieval and aligned decision*, 2024. URL https://arxiv.org/abs/2403.06221.

- Changle Qu, Sunhao Dai, Xiaochi Wei, et al. *Tool learning with large language models: a survey*. Frontiers of Computer Science, 19(8), January 2025. doi:10.1007/s11704-024-40678-2.

- Shishir G. Patil, Tianjun Zhang, Xin Wang, and Joseph E. Gonzalez. *Gorilla: Large language model connected with massive apis*, 2023. URL https://arxiv.org/abs/2305.15334.

- Zuxin Liu, Thai Hoang, Jianguo Zhang, et al. *Apigen: Automated pipeline for generating verifiable and diverse function-calling datasets*, 2024. URL https://arxiv.org/abs/2406.18518.

- Saman Rajaei. *Multi-agent-as-a-service - a senior engineer's overview*. https://medium.com/datascience/multi-agent-as-a-service-a-senior-engineers-overview-fc759f5bbcfa, 2024.

- Yingxuan Yang, Qiuying Peng, Jun Wang, et al. *Llm-based multi-agent systems: Techniques and business perspectives*, 2024. URL https://arxiv.org/abs/2411.14033.

- Weize Chen, Ziming You, Ran Li, et al. *Internet of agents: Weaving a web of heterogeneous agents for collaborative intelligence*. arXiv preprint arXiv:2407.07061, 2024.

- Yingxuan Yang, Huacan Chai, Shuai Shao, et al. *Agentnet: Decentralized evolutionary coordination for llm-based multi-agent systems*, 2025b. URL https://arxiv.org/abs/2504.00587.

- Anthropic. *Model context protocol*, 2024. URL https://www.anthropic.com/news/model-contextprotocol.

- Gaowei Chang. *ANP: Agent network protocol*, 2024. URL https://www.agent-networkprotocol.com/.

- Google. *A2A: Agent2agent protocol*, 2025. URL https://github.com/google/A2A.

- Shinnung Yao et al. *React: Synergizing reasoning and acting in language models*. arXiv preprint arXiv:2210.03629, 2022.

- Tao Tang, Zhihui Li, Jiangjie Chen, et al. *AutoGPT: An autonomous GPT-4 experiment*. arXiv preprint arXiv:2308.08155, 2023.

- Sirui Hong, Xiawu Wang, Mingyu Yang, et al. *MetaGPT: Meta programming for multi-agent collaborative framework*. arXiv preprint arXiv:2401.03066, 2024.

- Wayne Xin Zhao, Kun Zhou, Junyi Li, et al. *A survey of large language models*, 2025. URL https://arxiv.org/abs/2303.18223.

- Shukang Yin, Chaoyou Fu, Sirui Zhao, et al. *A survey on multimodal large language models*. National Science Review, 11(12), November 2024. doi:10.1093/nsr/nwae403.

- Zeyu Zhang, Xiaohe Bo, Chen Ma, et al. *A survey on the memory mechanism of large language model based agents*, 2024. URL https://arxiv.org/abs/2404.13501.

- Yujia Wang, Yusheng Qin, Haozhe Li, et al. *ToolLLM: Facilitating large language models to master 16000+ real-world APIs*. arXiv preprint arXiv:2307.16789, 2023.

- Timo Schick, Jane Dwivedi-Yu, Roberto Dessì, et al. *Toolformer: Language models can teach themselves to use tools*, 2023. URL https://arxiv.org/abs/2302.04761.

- Xiao Liu, Hao Zhou, Zhiheng Zhang, et al. *AgentBench: Evaluating LLMs as agents*. arXiv preprint arXiv:2308.03688, 2023.

- VentureBeat. *Microsoft's 10 new AI agents strengthen its enterprise automation lead*. https://venturebeat.com/ai/microsofts-10-new-ai-agents-strengthen-its-enterprise-automation-lead/, 2024.

- IBM Newsroom. *IBM introduces new AI integration services to help enterprises build and scale AI*. https://newsroom.ibm.com/blog-ibm-introduces-new-ai-integration-services-to-help-enterprises-build-and-scale-ai, 2024.

- TrustedBy.ai. *Comparing 9 AI agent development platforms: Dify, Coze, Adept, Kognitos, Flowise, Articul8, Stack AI*. https://trustedby.ai/blog/comparing-9-ai-agent-development-platforms-dify-coze-adept-kognitos-flowise-articul8-stack-ai, 2024.

- Aaron Jaech, Adam Kalai, Adam Lerer, et al. *OpenAI O1 system card*. arXiv preprint arXiv:2412.16720, 2024.

- LangChain. *LangGraph: Building graph-based agent workflows*. https://www.langchain.com/langgraph, 2024.

- Microsoft Learn. *Semantic Kernel agent framework*. https://learn.microsoft.com/en-us/semantic-kernel/frameworks/agent/, 2024.

- Bang Liu, Xinfeng Li, Jiayi Zhang, et al. *Advances and challenges in foundation agents: From brain-inspired intelligence to evolutionary, collaborative, and safe systems*, 2025. URL https://arxiv.org/abs/2504.01990.

- WildCardAI. *agents.json specification*. https://github.com/wild-card-ai/agents-json, 2025.

- NEAR. *AITP: Agent Interaction & Transaction Protocol*, 2025. URL https://aitp.dev/.

- Linux Foundation AI and LBM Data. *ACP: Agent Communication Protocol*, 2025. URL https://github.com/orgs/i-am-bee/discussions/284.

- Galileo Cisco, Langchain. *ACP: Agent Connect Protocol*, 2025. URL https://spec.acp.agntcy.org/.

- Samuele Marro, Emanuele La Malfa, Jesse Wright, et al. *A scalable communication protocol for networks of large language models*, 2024. URL https://arxiv.org/abs/2410.11905.

- Eclipse. *Language model operating system (LMOS)*. https://eclipse.dev/lmos/, 2025.

- AlEngineerFoundation. *Agent protocol*. https://agentprotocol.ai/, 2025.

- Rajesh Ranjan, Shailja Gupta, and Surya Narayan Singh. *Loka protocol: A decentralized framework for trustworthy and ethical AI agent ecosystems*, 2025. URL https://arxiv.org/abs/2504.10915.

- Ashwin Srinivasan, Karan Bania, Shreyas V, et al. *Implementation and application of an intelligibility protocol for interaction with an LLM*, 2024. URL https://arxiv.org/abs/2410.20600.

- Inhwan Bae, Junoh Lee, and Hae-Gon Jeon. *Continuous locomotive crowd behavior generation*, 2025. URL https://arxiv.org/abs/2504.04756.

- Leszek Gąsieniec, Łukasz Kuszner, Ehsan Latif, et al. *Anonymous distributed localisation via spatial population protocols*, 2024. URL https://arxiv.org/abs/2411.08434.

- Peter Stone and Manuela Veloso. *Multiagent systems: A survey from a machine learning perspective*. Autonomous Robots, 8:345–383, 2000.

- Ali Dorri, Salil S Kanhere, and Raja Jurdak. *Multi-agent systems: A survey*. IEEE Access, 6:28573–28593, 2018.

- Nigel Gilbert. *Agent-based models*. Sage Publications, 2019.

- Jason Wei, Xuezhi Wang, Dale Schuurmans, et al. *Chain-of-thought prompting elicits reasoning in large language models*. NeurIPS, 35:24824–24837, 2022.

- Katherine M. Collins, Catherine Wong, Jiahai Feng, et al. *Structured, flexible, and robust: Benchmarking and improving large language models towards more human-like behavior in out-of-distribution reasoning tasks*, 2022. URL https://arxiv.org/abs/2205.05718.

- Valentina Pyatkin, Jena D Hwang, Vivek Srikumar, et al. *Reinforced clarification question generation with defeasibility rewards for disambiguating social and moral situations*. arXiv preprint arXiv:2212.10409, 2022.

- Li Zhong and Zilong Wang. *A study on robustness and reliability of large language model code generation*. arXiv preprint arXiv:2308.10335, 2023.

- Edward J Hu, Yelong Shen, Phillip Wallis, et al. *LoRA: Low-rank adaptation of large language models*. ICLR, 1(2):3, 2022.

- Da Liu, Liqian Dou, Ruilong Zhang, et al. *Multi-agent reinforcement learning-based coordinated dynamic task allocation for heterogeneous UAVs*. IEEE Transactions on Vehicular Technology, 72(4):4372–4383, 2022.

- Xiaolin Jiang, Hossein S. Ghadikolaei, Gabor Fodor, et al. *Low-latency networking: Where latency lurks and how to tame it*, 2018. URL https://arxiv.org/abs/1808.02079.

- V. Fuller and T. Li. *Classless inter-domain routing (CIDR): An address assignment and aggregation strategy*. Technical Report, 1993.

- Chen Zhang, Yu Xie, Hang Bai, et al. *A survey on federated learning*. Knowledge-Based Systems, 216:106775, 2021.

---