In [1]:
!pip install langchain_openai



In [2]:
# setting OpenAI API

from langchain_openai import ChatOpenAI
import os

with open('openai_api_key.txt', 'r') as f:
    openai_api_key = f.readlines()[0].split('\n')[0]
    os.environ['OPENAI_API_KEY'] = openai_api_key

In [3]:
# create agent

llm = ChatOpenAI(model='gpt-4o-mini')

**Agent와 도구 통합 예제**

In [4]:
!pip install langchain_community



In [6]:
# setting Tavliy API key

with open('tavily_api_key.txt', 'r') as f:
    tavily_api_key = f.readlines()[0].split('\n')[0]
    os.environ['TAVILY_API_KEY'] = tavily_api_key

In [10]:
# 기본 통합

from langchain.agents import create_agent
from langchain_community.tools import TavilySearchResults

# 검색 도구 초기화
search_tool = TavilySearchResults(max_results=10)

# 에이전트 생성
agent = create_agent(
    model=llm,
    tools=[search_tool],
    system_prompt="""당신은 웹 검색을 통해 정보를 제공하는 어시스턴트입니다.
사용자의 질문에 대해 신뢰성 있는 출처의 정보를 찾아서 답변을 검색합니다."""
)

# 에이전트 실행
user_query = "각 업체 (OpenAI, Google, Anthropic) 별 2025년 4분기 이후 출시된 거대 언어 모델들의 성능을 비교 분석해줘"
result = agent.invoke({
    "messages": [{"role": "user", "content": user_query}]
})

print(result["messages"][-1].content)

아래는 OpenAI, Google, Anthropic의 2025년 4분기 이후 출시된 거대 언어 모델들의 성능을 비교 분석한 내용입니다.

### OpenAI (GPT-5 시리즈)
- **모델**: GPT-5, GPT-5.1, GPT-5.2
- **주요 성능 지표**:
  - **코드 작성 능력**: SWE-bench Verified 기준으로 GPT-5는 74.9%의 정확도를 기록하여 상대적으로 높은 성능을 보였습니다. 통합된 Python 기능을 이용한 GPT-5 Pro는 89.4%의 정확도를 기록하여 뛰어난 성능을 보였습니다.
  - **수학적 성능**: AIME 2025 기준 94.6%로, 이는 Gemini 3 Pro에 이어 두 번째로 우수한 성적입니다.
- **기타 특징**: 
  - **비용**: API 사용 가격은 상당히 높은 편이며, $3에서 $12 per 1M tokens 사이입니다.
  - **창의성 및 안정성**: GPT-5는 이전 모델에 비해 오류가 80% 감소하였으며, 더 나은 확신 평가 기능을 갖추었습니다.

### Google (Gemini 2.5 Pro 및 Gemini 2.5 Flash)
- **모델**: Gemini 2.5 Pro, Gemini 2.5 Flash
- **주요 성능 지표**:
  - **코드 작성 능력**: SWE-bench에서 76.2%의 정확도를 기록하여 OpenAI의 GPT-5보다 낮지만, 가격 대비 성능 비율에서 큰 장점을 보입니다.
  - **수학적 성능**: AIME 시험에서 82%의 성능을 기록했습니다.
- **기타 특징**:
  - **비용**: Gemini 2.5 Pro는 $1.25 per 1M tokens의 입력 비용 및 $10 per 1M tokens의 출력 비용을 청구합니다. Flash 모델은 더 저렴한 옵션으로 제공됩니다.
  - **속도와 멀티모달 처리**: Gemini 모델은 속도와 멀티모달 처리에서 우수한 성능을 보이며, 다양한 응용 프로그램에 적합합니다.

### Anthropic (Cla

In [11]:
!pip install langchain_experimental



In [12]:
# 여러 가지 도구 조합하여 통합

from langchain_experimental.tools import PythonAstREPLTool

# initialize tools
search_tool = TavilySearchResults(max_results=5)
python_tool = PythonAstREPLTool()

# create multiple-tools LLM agent
agent = create_agent(
    model=llm,
    tools=[search_tool, python_tool],
    system_prompt="""당신은 역량 있는 데이터 분석가입니다.
- 관련 정보가 필요하면 웹 검색을 실시합니다.
- 계산 또는 데이터 처리가 필요하면 Python 코드를 작성하고 실행합니다."""
)

# 복합 작업 실행
result = agent.invoke({
    "messages": [{
        "role": "user",
        "content": """비트코인의 최근 5년간 연 평균 수익률을 계산해줘.
- 비트코인의 최근 5년치 가격을 먼저 검색한다.
- 이 가격을 바탕으로 수학 공식을 이용하여 연평균 수익률을 계산한다.
        """
    }]
})

print(result["messages"][-1].content)

비트코인의 최근 5년간 연 평균 수익률은 약 **11.41%**입니다.
