# GPT에 인터넷 검색 기능 추가하기
- DuckDuckGo 검색

## 모델 선언 및 질문
- 인터넷 검색 엔진이 없을 때의 답변 확인

In [1]:
from dotenv import load_dotenv
import os
load_dotenv()

True

In [2]:
from langchain_openai import ChatOpenAI

model = ChatOpenAI(model="gpt-4o-mini")
model.invoke("2025년 현대자동차 미국 시장 전망은 어떻게 되나요?")

  from .autonotebook import tqdm as notebook_tqdm


AIMessage(content='2025년 현대자동차의 미국 시장 전망에 대해 구체적으로 예측하기는 어렵지만, 몇 가지 추세와 요인을 고려하여 논의할 수 있습니다.\n\n1. **전기차(EV) 시장 확대**: 현대자동차는 전기차 라인업을 강화하고 있습니다. 2025년까지 더 많은 전기 모델이 출시될 것으로 예상되며, 이는 미국 시장에서의 경쟁력을 높이는 요인이 될 것입니다.\n\n2. **SUV 및 크로스오버 수요 증가**: 미국 소비자들 사이에서 SUV와 크로스오버 차량에 대한 선호도가 계속 높아지고 있습니다. 현대차는 이 시장에 맞춘 다양한 모델을 제공하고 있어, 이 부문에서의 성장이 기대됩니다.\n\n3. **친환경 기술 개발**: 현대차는 수소연료전지차와 같은 친환경 기술에 투자하고 있습니다. 이러한 혁신이 시장에서 긍정적으로 받아들여질 가능성이 있습니다.\n\n4. **정부 정책 및 규제**: 미국 정부의 친환경 정책 및 규제가 자동차 제조사들에게 영향을 미칠 수 있습니다. 전기차와 같은 친환경 차에 대한 인센티브가 강화된다면, 현대차의 긍정적인 성장 요소로 작용할 것입니다.\n\n5. **브랜드 이미지 및 고객 신뢰**: 현대차는 품질과 디자인 측면에서 좋은 평가를 받고 있으며, 이는 소비자들의 선택에 큰 영향을 미칠 수 있습니다. 브랜드 충성도와 고객 신뢰도가 높아질 경우 판매 증가에 기여할 것입니다.\n\n결론적으로, 2025년 현대자동차의 미국 시장 전망은 전기차와 SUV 모델의 증가, 친환경 기술 개발 등의 긍정적인 요소들 덕분에 긍정적일 가능성이 높습니다. 그러나 경쟁 심화, 경제적 요인 등 외부 변수도 고려해야 할 중요한 요소입니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 405, 'prompt_tokens': 21, 'total_tokens': 426, 'completion_tokens_details': {

## 덕덕고 설치

In [3]:
# %pip install -U duckduckgo-search
#  pip install ddgs
# 가상환경 에러날 시 pip uninstall -y langchain langchain-core langchain-community pydantic
# pip install --upgrade langchain langchain-cli langchain-openai langchain-community

## 덕덕고 검색 엔진 정의 및 질문 실행
- 1) 에이전트는 질문에 답변하기 위해 외부 검색 도구를 사용해야 한다고 판단
- 2) 덕덕고 검색을 실행
- 3) 검색 결과가 LLM에게 전달되어 답변 생성

In [4]:
from langchain_community.tools import DuckDuckGoSearchResults

search = DuckDuckGoSearchResults(results_separator=';\n')
docs = search.invoke("2025년 현대자동차 미국 시장 전망은 어떻게 되나요?")

print(docs)


snippet: 2025년 상반기 현대차와 기아는 전기차 글로벌 판매 비중 확대, 북미 시장 점유율 상승, 신형 SUV 및 EV6 후속 모델 등으로 실적을 꽤 잘 버텼어. 특히 IRA (미국 인플레 감축법) 수혜로 현지 생산라인 투자 확대가 긍정적으로 평가됐지. 반면, 일부에서는 전기차 가격 경쟁 심화, 중국 로컬업체와의 경쟁에서 점유율 하락 등의 우려도 나왔어. 하반기에는 현대차의 아이오닉 시리즈 추가 모델과 기아 EV9 라인업이 본격적으로 양산되고 글로벌 출시돼. 유럽과 북미 현지 공장에서 IRA 혜택까지 받으면 가격 경쟁력이 좀 더 올라갈 거야. 현대차그룹은 수소연료전지 상용차와 PBV 모델을 통해 차별화 전략을 쓰고 있지., title: 현대자동차, 기아차 2025년 하반기 주가 전망 - 미국 시장 점유율 ..., link: https://solekim.tistory.com/entry/현대자동차-기아차-2025년-하반기-주가-전망-미국-시장-점유율-115로-급속히-상승;
snippet: Mar 11, 2025 · 현대차 의 전기차 전략, 글로벌 자동차 시장에서 의 경쟁력, 자율주행 기술 및 주가 전망 을 심층 분석합니다. 현대차 의 미래 는 앞으로 어떻게 진행이 될 것인지 경쟁사들에 비해 현대차가 가진 강점과 약점은 무엇인지 설명합니다., title: 2025년 현대차 심층 분석 – 전기차, 자율주행, 글로벌 시장 전망, link: https://moneymadeup.com/hyundai-motor-analysis-2025/;
snippet: 현대차·기아는 2025년 미국 시장에서 사상 최대 실적을 목표로 설정하고, 전기차와 하이브리드 시장에서 강력한 성장세를 이어가고 있습니다 . 이들은 특히 차량 모델 경쟁력을 높이기 위해 공격적인 신차 출시와 마케팅 전략을 통해 판매 목표를 달성하고자 합니다., title: 2025년 현대차·기아의 미국 시장 정복 전략: 전기차와 하이브리드가 ..., link: https://seo.goover.ai/report/2

## system 메시지로 컨텍스트 보강
- RAG의 검색 증강 역할 담당

In [5]:
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder

question_answering_prompt = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            "사용자의 질문에 대해 아래 context에 기반하여 답변하라.:\n\n{context}",
        ),
        MessagesPlaceholder(variable_name="messages"),
    ]
)

document_chain = question_answering_prompt | model

## 검색 결과 추출 및 메모리 저장

In [6]:
from langchain_classic.memory import ChatMessageHistory

# 채팅 메시지를 저장할 메모리 객체 생성
chat_history = ChatMessageHistory() 
# 사용자 질문을 메모리에 저장
chat_history.add_user_message("2025년 현대자동차 미국 시장 전망은 어떻게 되나요?") 

# 문서 검색하고 답변 생성
answer = document_chain.invoke(
    {
        "messages": chat_history.messages,
        "context": docs,
    }
)

# 생성된 답변을 메모리에 저장
chat_history.add_ai_message(answer) 

print(answer)


content='2025년 현대차는 미국 시장에서 사상 최대 실적을 목표로 하고 있으며, 전기차와 하이브리드 시장에서 강력한 성장세를 이어갈 계획입니다. 특히, 공격적인 신차 출시와 마케팅 전략을 통해 차량 모델 경쟁력을 높이고 판매 목표를 달성하고자 합니다. 이는 전기차 글로벌 판매 비중 확대와 함께 북미 시장에서의 점유율 상승을 기대하는 전략에 기반하고 있습니다.\n\n또한 IRA(미국 인플레 감축법) 수혜로 현지 생산라인 투자 확대가 긍정적으로 평가되고 있으며, 현대차의 아이오닉 시리즈 추가 모델과 기아 EV9 라인업이 하반기부터 본격적으로 양산되어 글로벌 출시될 예정입니다. 그러나 도널드 트럼프 미국 대통령의 수입차에 대한 25% 관세 부과 방침이 현대차에 위협이 될 수 있으며, 이로 인해 미국 내 생산 확대 같은 대응 전략이 중요한 도전 과제가 될 것입니다.\n\n종합적으로 보면, 현대차는 전기차와 하이브리드 모델을 통해 미국 시장에서의 경쟁력을 더욱 강화하고자 하고 있지만, 관세와 같은 외부 요인도 귀 기울여야 할 부분입니다.' additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 270, 'prompt_tokens': 793, 'total_tokens': 1063, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_560af6e559', 'id': 'chatcm

## 검색 추가 설정

In [7]:
# DuckDuckGo API wrapper를 사용하여 검색할 때 검색 매개변수를 설정하기 위한 클래스 import
from langchain_community.utilities import DuckDuckGoSearchAPIWrapper

# 한국 지역("kr-kr")을 기준, 최근 일주일("w") 내의 검색 결과를 가져오도록 초기화
wrapper = DuckDuckGoSearchAPIWrapper(region="kr-kr", time="w")

In [8]:
# 검색 기능을 위한 DuckDuckGoSearchResults 초기화
search = DuckDuckGoSearchResults(
    api_wrapper=wrapper,      # 앞에서 정의한 API wrapper를 사용
    source="news",            # 뉴스 소스에서만 검색하도록 지정
    results_separator=';\n'   # 결과 항목 사이에 구분자 사용 (세미콜론과 줄바꿈)
)

In [9]:
docs = search.invoke("2025년 현대자동차 미국 시장 전망은 어떻게 되나요?")

# 검색 결과 출력
print(docs)


snippet: Jul 3, 2025 · 2025년 상반기 현대차와 기아는 전기차 글로벌 판매 비중 확대, 북미 시장 점유율 상승, 신형 SUV 및 EV6 후속 모델 등으로 실적을 꽤 잘 버텼어. 특히 IRA (미국 인플레 감축법) 수혜로 현지 생산라인 투자 확대가 긍정적으로 …, title: 현대자동차 , 기아차 2025년 하반기 주가 전망 - 미국 시장 점유율 ..., link: https://solekim.tistory.com/entry/현대자동차-기아차-2025년-하반기-주가-전망-미국-시장-점유율-115로-급속히-상승;
snippet: Jun 14, 2025 · 현대자동차그룹이 미국 시장에서 펼치는 야심찬 생산계획이 본격적으로 가시화되고 있습니다. 2025년 3월 조지아주에 위치한 현대자동차그룹 메타플랜트 아메리카 (HMGMA) 준공을 통해 현대차는 미국 내 연간 120만대 …, title: 현대자동차 미국 생산계획의 새로운 전환점: 2025년 120만대 생산 ..., link: https://blog.naver.com/avamusic7/223899027644;
snippet: 2025년 9월, 미국 자동차 시장은 구조적 전환의 한가운데에 있습니다. IRA 보조금 축소 가능성과 고금리 지속, 중국 OEM의 저가 공세 등 복합적인 변수들이 시장을 흔들고 있습니다., title: 2025년 미국 자동차 시장 , 현대차 ·기아의 전략적 질주 ..., link: https://infoco.infocat.kr/371;
snippet: Mar 27, 2025 · 2025년 현재, 현대차는 미국 시장에서의 경쟁력을 더욱 강화하기 위해 큰 투자를 단행하고 있습니다. 그러나 최근 도널드 트럼프 미국 대통령이 발표한 수입산 자동차에 대한 25% 관세 부과 방침은 현대차와 같은 한국 자동차 …, title: 2025년 미국 시장 공략, 현대차의 투자 전략 분석, link: https://informing.kr/entry/2025년-미국-시장-공략-현대차의-투자-전략-분석

### 특정 사이트 내 검색 기능

In [10]:
# ytn.co.kr 사이트에서 검색
docs = search.invoke("site:ytn.co.kr 2025년 현대자동차 미국 시장 전망은 어떻게 되나요?")
docs


'snippet: 지하철 승차라든가, 무료승차도 있고 현재 기초연금, 국민연금 다 65세부터 지급이 되게 될 텐데 굉장히 그렇게 우리가 고령화 속도를 보면 당장 2025년에는 20%가 65세입니다., title: [경제] 30년 만에 육체노동 정년 상향...경제 전망은 ? | YTN, link: https://ytn.co.kr/_ln/0102_201902211930045919;\nsnippet: 특징주부터 하나 짚어보겠습니다. 대한항공 아시아나항공 합병 작업이 사실상 마무리 단계라고 봐야 되는데요. 이쪽 주가는 어떻게 반응하고 있습니까?, title: [경제] 대한항공-아시아나 합병하면 내 주식은 어떻게 되나요 ? | YTN, link: https://ytn.co.kr/_ln/0102_202411290733539034;\nsnippet: 이처럼 트럼프 2기 행정부 시대와 함께, 2025 년 미국 경제에도 큰 변화의 바람이 불어닥칠 것으로 보입니다. 지금까지 뉴욕에서 YTN 이승윤입니다. YTN 이승윤 (risungyoon@ytn.co.kr)., title: [국제] 뉴욕 타임스퀘어에 100만 인파...새해 경제 전망은 ? | YTN, link: https://www.ytn.co.kr/_ln/0104_202501011251307373;\nsnippet: , title: [운세][오늘의 운세] 2025년 11월 15일 띠별 운세 | YTN, link: '

## 기사 링크 가져오기

In [19]:
# 검색 결과의 링크들을 저장할 빈 리스트 초기화
links = []

# 검색 결과를 세미콜론과 줄바꿈 기준으로 분리하고, 각 결과 항목에서 링크를 추출
for doc in docs.split(";\n"):
    print(doc)  # 각 검색 결과 항목을 출력하여 확인
    link = doc.split("link:")[1].strip()  # 각 항목에서 'link:' 이후의 URL 부분만 추출
    links.append(link)  # 추출한 링크를 리스트에 추가

# 모든 링크를 출력
print(links)

snippet: 지하철 승차라든가, 무료승차도 있고 현재 기초연금, 국민연금 다 65세부터 지급이 되게 될 텐데 굉장히 그렇게 우리가 고령화 속도를 보면 당장 2025년에는 20%가 65세입니다., title: [경제] 30년 만에 육체노동 정년 상향...경제 전망은 ? | YTN, link: https://ytn.co.kr/_ln/0102_201902211930045919
snippet: 특징주부터 하나 짚어보겠습니다. 대한항공 아시아나항공 합병 작업이 사실상 마무리 단계라고 봐야 되는데요. 이쪽 주가는 어떻게 반응하고 있습니까?, title: [경제] 대한항공-아시아나 합병하면 내 주식은 어떻게 되나요 ? | YTN, link: https://ytn.co.kr/_ln/0102_202411290733539034
snippet: 이처럼 트럼프 2기 행정부 시대와 함께, 2025 년 미국 경제에도 큰 변화의 바람이 불어닥칠 것으로 보입니다. 지금까지 뉴욕에서 YTN 이승윤입니다. YTN 이승윤 (risungyoon@ytn.co.kr)., title: [국제] 뉴욕 타임스퀘어에 100만 인파...새해 경제 전망은 ? | YTN, link: https://www.ytn.co.kr/_ln/0104_202501011251307373
snippet: , title: [운세][오늘의 운세] 2025년 11월 15일 띠별 운세 | YTN, link: 
['https://ytn.co.kr/_ln/0102_201902211930045919', 'https://ytn.co.kr/_ln/0102_202411290733539034', 'https://www.ytn.co.kr/_ln/0104_202501011251307373', '']


## 웹페이지 내용을 비동기로 불러오기
- Langchain의 WebBaseLoader를 사용하여 웹 페이지의 내용을 불러오기

In [20]:
from langchain_community.document_loaders import WebBaseLoader

# WebBaseLoader 객체를 생성. 'links'는 웹 페이지의 URL 목록을 담고 있는 변수
# bs_get_text_kwargs는 BeautifulSoup의 get_text() 메소드에 전달될 추가 인자
loader = WebBaseLoader(
    web_paths=links,  # 웹 페이지의 링크 목록을 지정
    bs_get_text_kwargs={
        "strip": True  # 웹 페이지에서 텍스트를 가져올 때 앞뒤의 공백을 제거
    },
)

# 비동기로 웹 페이지의 내용을 로드하고, 각 문서를 page_contents 리스트에 추가
page_contents = []  # 각 웹 페이지의 내용을 저장할 리스트입니다.
async for doc in loader.alazy_load():
    page_contents.append(doc)  # 불러온 문서를 page_contents 리스트에 추가

# page_contents에 있는 각 웹 페이지의 내용을 출력
for content in page_contents:
    print(content)  # 웹 페이지의 내용을 출력
    print('--------------')  # 페이지 구분을 위해 구분선을 출력

Fetching pages:   0%|          | 0/4 [00:00<?, ?it/s]Error fetching  and aborting, use continue_on_failure=True to continue loading urls after encountering an error.
Traceback (most recent call last):
  File "c:\ProgramData\anaconda3\envs\llm\Lib\site-packages\langchain_community\document_loaders\web_base.py", line 268, in _fetch_with_rate_limit
    return await self._fetch(url)
           ^^^^^^^^^^^^^^^^^^^^^^
  File "c:\ProgramData\anaconda3\envs\llm\Lib\site-packages\langchain_community\document_loaders\web_base.py", line 246, in _fetch
    async with session.get(
               ^^^^^^^^^^^^
  File "c:\ProgramData\anaconda3\envs\llm\Lib\site-packages\aiohttp\client.py", line 1488, in __aenter__
    self._resp: _RetType = await self._coro
                           ^^^^^^^^^^^^^^^^
  File "c:\ProgramData\anaconda3\envs\llm\Lib\site-packages\aiohttp\client.py", line 637, in _request
    raise err_exc_cls(url)
aiohttp.client_exceptions.InvalidUrlClientError
Fetching pages:  50%|##### 

InvalidUrlClientError: 

## Beautiful Soup을 통해 특정 영역만 가져오기

In [14]:
import requests
from bs4 import BeautifulSoup

# 주어진 URL에서 기사 텍스트를 가져오는 함수
def get_article_text(url):
    try:
        # URL에 GET 요청을 보냄
        response = requests.get(url)
        # 요청이 성공하지 못하면 예외를 발생시킴
        response.raise_for_status()
        
        # BeautifulSoup을 사용하여 HTML 내용을 파싱
        soup = BeautifulSoup(response.content, 'html.parser')
        
        # 클래스가 'story-news article'인 <article> 태그를 찾음
        article = soup.find('article', class_='story-news article')
        
        # 기사를 찾았다면 그 텍스트를 반환
        if article:
            return article.get_text(strip=True)
        else:
            try:
                if soup.find('article'):
                    return soup.find('article').get_text(strip=True)
                elif soup.find('div', id="CmAdContent"):
                    return soup.find('div', id="CmAdContent").get_text(strip=True)
            except:
                return "기사 내용을 찾을 수 없습니다."
            
    # 요청이 실패할 경우 예외 처리
    except requests.exceptions.RequestException as e:
        return f"URL을 가져오는 중 오류 발생: {e}"

In [15]:
# URL 목록의 각 링크를 반복하면서 기사 텍스트를 출력
articles = []    # 가져온 내용을 리스트에 담기 위한 변수 선언
for link in links:
    print(f"URL: {link}\n")
    article_text = get_article_text(link)
    print(f"Content:\n{article_text}")
    print("--------------------------------------------------")
    articles.append(article_text)

URL: https://ytn.co.kr/_ln/0102_201902211930045919

Content:
■ 진행: 박석원 앵커■ 출연: 정철진 경제평론가* 아래 텍스트는 실제 방송 내용과 차이가 있을 수 있으니 보다 정확한 내용은 방송으로 확인해주시기 바랍니다.[앵커]대법원이 육체노동자의 노동 가동 연한을 60세에서 65세로 상향해야 된다고 판단했습니다. 평균수명, 은퇴연령 등을 고려해 30년 만에 기존 판례를 변경한 것인데요. 육체노동 정년의 상향은 경제 전반에도 영향을 끼칠 것으로 보입니다.또 이번 판례로 내 정년은 어떤 영향을 받을지 많은 분들이 궁금해하실 것으로 보이는데요. 정철진 경제평론가와 함께 궁금증 풀어보도록 하겠습니다. 어서 오십시오. 일단 오늘 판결이 어떤 배경에서 나오게 됐는지부터 설명을 해 주시죠.[인터뷰]법정 소송에서부터 시작이 된 건데요. 지난 2015년 여름이었었습니다. 부산의 한 수영장에서 너무나 안타깝게도 4살 아동이 사망하게 됐었는데요. 이 부모가 수영장 운영업체에 대해서 그 아이에 대한 사망 관련해서 손해배상 청구를 하게 되면서 이 소송에서 가장 중요한 쟁점이 그렇다면 이 4살짜리 아동이 어느 정도까지 일을 할 수가 있었을까라고 하는 가동 연한이 쟁점이 됐었고 1심, 2심, 이번 대법원 판결에서 가동 연한을 65세로 판결을 하게 되면서 가장 큰 관심이 모아지게 된 거죠.[앵커]가동연한이 판결의 핵심이었다라고 말씀해 주셨는데 가동연한이라는 게 무엇인지, 왜 쟁점이 됐는지.[인터뷰]지금 4살짜리 아동 아니었습니까? 만의 하나 그때의 피해자가 공무원이었다라든가 어디의 회사원이었다라고 하면 공무원과 회사원의 정년이 있잖아요. 그러니까 그 정년을 기준으로 해서 그때까지 일할 수 있었으니까 얼마를 배상하라고 나올 텐데 피해자 같은 경우에 이런 뚜렷한 정년이 없었을 때 어디까지 일할 수 있는가를 파악을 할 때 그게 바로 육체 가동할 수 있다라고 해서 가동연한이라고 하는 거였었는데 지금까지는 판례를 통해서 60세까지다라고 해서 앞으로 

In [16]:
filtered_articles = [article for article in articles if article]
chat_history.add_message("\n".join(filtered_articles))
chat_history.add_user_message("2025년 현대자동차 미국 시장 전망은 어떻게 되나요?") 

# 문서 검색하고 답변을 생성
answer = document_chain.invoke(
    {
        "messages": chat_history.messages,
        "context": docs,
    }
)

# 생성된 답변 메모리에 저장
chat_history.add_ai_message(answer) 
print(answer)

content='2025년 현대차는 미국 시장에서 긍정적인 전망을 가지고 있습니다. 현대차는 전기차와 친환경 자동차에 대한 강력한 포부를 가지고 있으며, 이를 통해 시장 점유율을 확대할 계획입니다. 특히, 현대차는 아시아나항공과의 합병을 통해 더욱 강화된 브랜드 이미지를 구축하고, 새로운 모델과 기술을 도입하여 소비자들의 선택을 받을 것으로 예상됩니다.\n\n또한, 2025년에는 고령화 사회에 대한 대응으로 자동차의 안전성과 편의성을 강조한 모델들이 출시될 것으로 보입니다. 이러한 변화는 소비자들의 니즈에 맞춰 진행되는 것으로, 젊은 소비자와 중장년층 모두에게 긍정적인 반응을 불러올 수 있을 것입니다.\n\n다만, 전반적인 미국 경제 상황, 특히 금리와 인플레이션 등의 변수는 현대차의 실적에 영향을 미칠 수 있으므로 주의가 필요합니다. 현대차가 지속적으로 혁신적인 기술과 디자인을 선보이고, 소비자들에게 매력적인 옵션을 제공한다면, 2025년 미국 시장에서의 성장은 예상 가능한 시나리오입니다.' additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 253, 'prompt_tokens': 11033, 'total_tokens': 11286, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_560af6e559', 'id': 'chatcmpl-Cd5vejdEZlbnnVEecPJc