# Chapter 21: Exploration and Discovery

에이전트가 **새로운 정보를 적극적으로 탐색하고**, **새로운 가능성을 발견하고**, **작동 환경 내의 알려지지 않은 영역** 을 식별하도록 돕는 패턴들을 다룬다.  

탐험과 발견은 단순히 반응적 행동을 하거나, 미리 정의된 해답 공간에서 최적화를 수행하는 것과는 다르다. 대신, 에이전트가 **익숙하지 않은 영역으로 능동적으로 이동하고**, **새로운 접근을 실험하며**, **새로운 지식이나 이해를 생성**하는 데 초점을 둔다.  

이 패턴은 정적 지식이나 사전에 프로그래밍된 해결책만으로는 충분하지 않은, **개방적이고 복잡하거나 빠르게 변화하는 도메인**에서 작동하는 에이전트에게 특히 중요하다. 이는 에이전트가 자신의 **이해와 능력을 확장**할 수 있는 역량을 강조한다.

## Practical Applications & Use Cases  
AI 에이전트는 **지능적으로 우선순위를 설정하고 탐색**할 수 있는 능력을 갖추고 있어, 다양한 도메인에서 폭넓게 활용될 수 있다. 잠재적 행동들을 자율적으로 평가하고 정렬함으로써, 이들은 복잡한 환경을 탐색하고 숨겨진 통찰을 발굴하며 혁신을 이끌어낼 수 있다. 이러한 **우선순위 기반 탐색 능력**은 프로세스를 최적화하고 새로운 지식을 발견하며 콘텐츠를 생성하도록 돕는다.

### Examples

- **과학 연구 자동화**:
    에이전트가 실험을 설계하고 수행하며, 결과를 분석하고 새로운 가설을 수립하여 신소재, 신약 후보, 과학 원리를 발견

- **게임 플레이 및 전략 생성**: 
    에이전트가 게임 상태를 탐색하면서 새로운 전략을 발견하거나 게임 환경의 취약점을 식별 (예: AlphaGo)

- **시장 조사 및 트렌드 분석**: 
    소셜 미디어, 뉴스, 보고서 등 비정형 데이터를 스캔하여 트렌드, 소비자 행동, 시장 기회를 파악.

- **보안 취약점 탐지**: 
    시스템 또는 코드베이스를 탐색하여 보안 결함이나 공격 벡터를 발견.

- **창의적 콘텐츠 생성**: 
    스타일, 테마, 데이터의 다양한 조합을 탐색하여 예술 작품, 음악, 문학 콘텐츠 등을 생성.

- **개인화 교육 및 훈련**: 
    AI 튜터가 학생의 진도, 학습 스타일, 개선이 필요한 영역에 따라 학습 경로와 콘텐츠 제공 우선순위를 설정.

## Google Co-Scientist

Google Research가 개발한, 계산적 과학 협업을 위해 설계된 AI 시스템이다.  
가설 생성, 제안서 정제, 실험 설계 등 연구 전반의 다양한 측면에서 인간 연구자를 지원한다. **Gemini LLM**을 기반으로 작동한다.

이 시스템은 과학 연구에서 발생하는 여러 문제를 해결하기 위해 개발되었다. 예를 들어, 방대한 정보 처리, 검증 가능한 가설의 생성, 실험 계획 수립 등의 난제를 다룬다.   
AI Co-Scientist는 대규모 정보 처리와 통합이 필요한 작업을 수행하여 데이터 내의 잠재적 관계를 밝혀낼 수 있다. 이를 통해 초기 연구 단계에서 인간의 인지적 부담을 줄이고 연구를 보조하는 것이 목적이다.

### System Architecture and Methodology

**멀티 에이전트 프레임워크**를 기반으로 하며, 협업적이고 반복적인 연구 과정을 모방하도록 구조화돼 있다.  
이 구조는 특정 연구 목표 달성을 위해 역할이 다른 전문화된 AI 에이전트들로 구성되며, **슈퍼바이저 에이전트**가 비동기적 작업 실행 환경을 관리·조정해 확장성과 유연성을 제공한다.

![image.png](attachment:image.png)

- **Generation agent**: 
    문헌 탐색과 시뮬레이션 기반 과학 토론을 통해 초기 가설을 생성.

- **Reflection agent**: 
    동료 평가자처럼 가설의 정확성, 독창성, 품질을 비판적으로 검토.

- **Ranking agent**: 
    Elo 기반 토너먼트 방식을 활용해 가설을 비교·순위화하고 우선순위를 지정.

- **Evolution agent**: 
    상위 가설을 단순화·통합하고 비전통적 사고를 탐색하며 지속적으로 개선.

- **Proximity agent**: 
    유사한 아이디어를 클러스터링하는 근접 그래프를 계산해 가설 공간 탐색을 지원.

- **Meta-review agent**: 
    모든 리뷰와 토론 결과를 종합하여 패턴을 식별하고 피드백을 제공해 시스템 자체 개선을 돕는 역할.

시스템의 기반은 Gemini로, 언어 이해, 추론, 생성 능력을 제공한다.  
또한 **test-time compute scaling**을 적용해 반복적 추론 과정에서 계산 자원을 탄력적으로 확장하여 출력을 향상시킨다.


### Iterative Research Method: Generate, Debate, and Evolve

전체 과정은 과학적 방법론을 모방한 **반복적 가설 생성·논쟁·진화 프레임워크**이다.  
연구 문제를 입력하면 시스템은 가설 생성, 평가, 개선의 **자기 개선적 사이클**을 실행한다.  
생성된 가설은 내부 에이전트 평가·토론뿐 아니라 토너먼트 기반 순위 결정 절차를 거친다.  




### Validation and Results

생의학 분야에서 여러 검증 연구를 통해 유용성이 입증되었다. 자동화된 벤치마크, 전문가 리뷰, 그리고 실제 실험(습식 실험)으로 성능이 평가되었다.

### Automated and Expert Evaluation

- **GPQA 벤치마크**에서 시스템의 내부 Elo 점수는 성능과 높은 상관성을 보였으며, 어려운 "diamond set"에서 **Top-1 정확도 78.4%**를 기록.
- 200개 이상의 연구 목표에 대한 분석 결과, test-time compute scaling은 Elo 점수 기준 가설 품질을 일관되게 향상.
- 15개의 고난도 문제를 대상으로 한 평가에서, AI 공동과학자는 최신 AI 모델 및 인간 전문가의 “최선 추측(best guess)”보다 우수한 성능을 보임.
- 소규모 평가에서 생의학 전문가들은 공동과학자의 결과물을 다른 모델 대비 더 **혁신적이고 영향력 있는** 것으로 평가.
- 시스템이 생성한 약물 재창출(Drug Repurposing) 제안은 NIH Specific Aims 형식으로 작성되었고, 6명의 종양학 전문가 패널로부터 높은 품질로 평가됨.


### End-to-End Experimental Validation

- Drug Repurposing (약물 재창출)
    - 급성 골수성 백혈병(AML)에 대해 시스템이 새로운 약물 후보를 제안.
    - 일부 후보(KIRA6 등)는 AML에 대한 사전 연구가 전혀 없던 완전 신규 제안.
    - 이후 **in vitro 실험**에서 KIRA6을 포함한 여러 제안 약물이 다양한 AML 세포주에서 임상적으로 유효한 농도에서 종양 세포 생존율을 억제함이 확인됨.

- Novel Target Discovery (신규 타깃 발견)
    - 시스템은 간 섬유증(liver fibrosis)을 위한 새로운 **후성유전학(epigenetic) 타깃**을 식별.
    - 인간 간 오가노이드 기반 실험에서 해당 타깃을 표적하는 약물이 강력한 항섬유화 효과를 보임.
    - 이들 중 일부는 이미 다른 질환에 대해 FDA 승인을 받은 약물로, 재창출 가능성이 존재.

-  Antimicrobial Resistance (항미생물 내성 연구)
    - AI 공동과학자는 미발표 실험 결과를 독립적으로 재현하는 데 성공.
    - 예: 다양한 세균 종에서 cf-PICIs가 발견되는 이유를 설명하라는 문제에서,  
    시스템은 **2일 만에** "cf-PICIs가 다양한 파지(phage) 꼬리와 상호작용해 숙주 범위를 확장한다"는 가설을 제시.
    - 이는 독립 연구팀이 **10년 이상의 연구 끝에** 실험적으로 밝혀낸 발견과 동일한 결론이었다.



### Augmentation and Limitations

Google Co-Scientists는 완전 자동화가 아닌 **인간 연구 증강**을 목표로 설계되었다.  
연구자는 자연어로 시스템과 상호작용하며 피드백을 제공하고, 아이디어를 제시하며, 탐색 방향을 정하는 **scientist-in-the-loop** 방식으로 협업한다.

그러나 몇 가지 한계가 존재한다.

- 시스템 지식은 **오픈 액세스 문헌에 제한**되며, 유료 문헌의 핵심 연구를 놓칠 가능성.
- 부정적 실험 결과(negative results)에 접근이 제한됨.  
  이는 숙련된 과학자에게 중요한 정보지만 거의 출판되지 않는다.
- 기저 LLM의 한계를 그대로 이어받기 때문에 사실 오류나 hallucination 가능성 존재.

## Safety

안전성은 시스템 설계에서 핵심 요소다.

- 모든 연구 목표는 입력 시 안전 검토를 수행.
- 생성된 가설 역시 위험하거나 비윤리적 연구로 악용되지 않도록 필터링.
- 1,200개의 적대적(adversarial) 연구 목표로 수행한 초기 안전 평가에서 위험 입력을 강건하게 거부하는 능력이 확인됨.
- 책임 있는 개발을 위해, 시스템은 **Trusted Tester Program**을 통해 더 많은 연구자에게 제공되어 실제 연구 환경에서 피드백을 수집하고 있다.

## Agent Laboratory ( Hands-On )

## At a Glance

### What  
AI 에이전트는 **미리 정의된 지식 범위 안에서만 작동**하기 때문에, 새로운 상황이나 개방형 문제를 다루는 능력이 제한된다. 복잡하고 동적인 환경에서는 이러한 **정적이고 사전 프로그래밍된 정보만으로는 진정한 혁신이나 발견을 이루기 어렵다**.   
핵심 과제는 에이전트가 단순한 최적화를 넘어 **새로운 정보를 적극적으로 탐색하고, '알려지지 않은 미지수(unknown unknowns)'를 식별**하도록 만드는 것이다.   
**시스템 스스로의 이해와 역량을 확장하는 적극적·에이전트적 탐색(Agentic exploration)** 으로의 패러다임 전환이 필요하다.

### Why  
솔루션은 **탐색과 발견을 위한 Agentic AI 시스템을 구축하는 것**이다.   
이러한 시스템은 보통 멀티 에이전트 프레임워크를 활용하며, 전문화된 LLM들이 협업하여 **과학적 방법론과 유사한 과정**을 수행한다.    
예를 들어, 서로 다른 에이전트가  
- 가설을 생성하고,  
- 비판적으로 검토하며,  
- 가장 유망한 개념을 발전시키는  
식으로 역할을 분담할 수 있다.  

이러한 구조화된 협업 방식은 시스템이 방대한 정보 공간을 지능적으로 탐색하고, 실험을 설계·수행하며, **진정으로 새로운 지식**을 생성할 수 있도록 해준다.   
탐색 과정에서 수반되는 방대한 작업을 자동화함으로써, 시스템은 **인간의 지적 능력을 보강**하고 **발견 속도를 획기적으로 가속화**한다.

### Rule of Thumb  
**Exploration and Discovery 패턴은** 해결 공간이 완전히 정의되지 않은 **개방적·복잡·빠르게 변화하는 도메인**에서 사용하기 적합하다.  
특히 다음과 같은 작업에 이상적이다:

- 새로운 가설, 전략, 통찰 생성  
- 과학 연구  
- 시장 분석  
- 창의적 콘텐츠 생성  

이 패턴은 단순히 알려진 프로세스를 최적화하는 것이 아니라, **'unknown unknowns'를 발견하는 것 자체가 목표**일 때 반드시 필요한 접근 방식이다.

## Key Takeaways

- **Exploration and Discovery**는 AI 에이전트가 새로운 정보와 가능성을 적극적으로 탐색하도록 하여, 복잡하고 변화하는 환경을 효과적으로 탐색하는 데 필수적인 역할을 한다.
- 궁극적으로 이러한 에이전트는 계산적으로 복잡한 작업을 처리하여 **인간의 창의성·문제 해결 능력을 확장**하고 **혁신과 발견의 속도를 가속**하는 것을 목표로 한다.

## Conclusion

**Exploration and Discovery 패턴**은 진정한 에이전트 시스템의 핵심이며, 단순한 지시 수행을 넘어 환경을 **능동적으로 탐색**하는 능력을 정의한다.   
이러한 내재된 에이전트적 추진력(agentic drive)이야말로 AI가 복잡한 도메인에서 **자율적으로 작동**하도록 만들며,   
단순히 작업을 실행하는 수준을 넘어서 **새로운 정보를 발견하기 위한 하위 목표를 스스로 설정**하도록 한다.  

이러한 고도화된 에이전트적 행동은 특히 **멀티 에이전트 프레임워크**에서 가장 강력하게 구현된다. 각 에이전트가 더 큰 협업 과정 속에서 **특화된 능동적 역할**을 수행하기 때문이다.  

궁극적으로, Exploration and Discovery 패턴은 **진정한 에이전트적 AI를 설계하기 위한 청사진**을 제공하며, 계산 도구를 단순한 보조 도구에서 **독립적 목표 추구가 가능한 지식 탐구 파트너**로 진화 시킨다.