## Amazon Bedrock Knowledge Bases - Retrieve API로 Q&A 애플리케이션 구축

### 컨텍스트

이 노트북에서는 Amazon Bedrock Knowledge Bases의 Retrieve API를 사용해 Q&A 애플리케이션을 구축하는 방법을 자세히 살펴봅니다. 지식 베이스에서 유사도 검색을 기반으로 원하는 수만큼 문서 청크를 가져오고, 관련 문서를 프롬프트와 함께 Anthropic Claude V2에 전달해 응답을 생성합니다.

Knowledge Base를 사용하면 Amazon Bedrock의 Foundation Model(FM)을 기업 데이터에 안전하게 연결해 Retrieval Augmented Generation(RAG)을 구현할 수 있습니다. 추가 데이터에 접근하면 모델이 더 관련성 있고 컨텍스트에 특화된 정확한 응답을 생성하면서 FM을 지속적으로 재학습할 필요가 없습니다. Knowledge Base에서 검색된 모든 정보에는 출처가 제공되어 투명성을 높이고 환각을 줄입니다. 콘솔에서 Knowledge Base를 만드는 방법은 [문서](https://docs.aws.amazon.com/bedrock/latest/userguide/knowledge-base.html)를 참고하세요.
노트북은 두 부분으로 구성됩니다:
- 1부에서는 Amazon Bedrock의 Foundation Model과 함께 `RetrieveAPI`를 사용하는 방법을 설명합니다. 여기서는 `amazon.nova-pro-v1:0` 모델을 사용합니다. 
- 2부에서는 LangChain 통합을 소개합니다.

### 패턴

이 솔루션은 Retrieval Augmented Generation(RAG) 패턴으로 구현할 수 있습니다. RAG는 언어 모델 외부의 데이터(비모수 데이터)를 검색해 관련 데이터를 프롬프트에 추가합니다. 여기서는 콘솔/SDK로 생성한 Knowledge Base에서 효과적으로 RAG를 수행합니다. 

### 사전 준비

질문에 답하려면 문서를 처리해 Knowledge Base에 저장해야 합니다. 이 노트북에서는 Amazon Bedrock Knowledge Bases를 생성하기 위해 `synthetic dataset for 10K financial reports`를 사용합니다. 

1. 문서(데이터 소스)를 Amazon S3 버킷에 업로드합니다.
2. Amazon Bedrock Knowledge Bases는 [01_create_ingest_documents_test_kb_multi_ds.ipynb](/knowledge-bases/01-rag-concepts/01_create_ingest_documents_test_kb_multi_ds.ipynb)를 사용해 생성합니다.
3. Knowledge Base ID를 기록해 둡니다.

<!-- ![data_ingestion](./images/data_ingestion.png) -->
<img src="./images/data_ingestion.png" width=50% height=20% />

#### 노트북 워크스루

이 노트북에서는 Amazon Bedrock Knowledge Bases가 제공하는 `Retrieve API`를 사용합니다. 이 API는 사용자 질의를 임베딩으로 변환하고 Knowledge Base를 검색하며, 의미 기반 검색 결과 위에 사용자 정의 워크플로를 구축할 수 있도록 관련 결과를 반환합니다. `Retrieve API`의 출력에는 `검색된 텍스트 청크`, 소스 데이터의 `위치 유형`과 `URI`, 검색의 관련성 `점수`가 포함됩니다.

생성된 텍스트 청크를 원래 프롬프트와 결합해 `amazon.nova-pro-v1:0` 모델에 전달하고, 사용 사례에 맞는 프롬프트 엔지니어링 패턴으로 응답을 생성합니다.

### USE CASE

#### 데이터 세트

이 예제에서는 Octank의 재무 10-K 보고서(합성 데이터 세트)를 텍스트 코퍼스로 사용해 Q&A를 수행합니다. 이 데이터는 이미 Amazon Bedrock Knowledge Bases에 적재되어 있으며, 실행하려면 `knowledge base id`가 필요합니다.
실제 사용 사례에서는 도메인별 주제에 맞춰 다양한 파일을 동기화한 뒤 Knowledge Bases의 Retrieve API를 사용해 동일한 방식으로 모델 응답을 평가할 수 있습니다.

### Python 3.10

⚠ 이 실습은 Python 3.10 런타임에서 실행해야 합니다. ⚠

Amazon SageMaker Studio 외부의 로컬 환경에서 워크숍을 진행하는 경우 Python 런타임이 3.10 이상인지 확인하세요.

### 설정

이 노트북을 실행하려면 다음 패키지를 설치해야 합니다.

In [1]:
%pip install --upgrade pip --quiet
%pip install -r ../requirements.txt --no-deps --quiet
%pip install -r ../requirements.txt --upgrade --quiet

Note: you may need to restart the kernel to use updated packages.
Note: you may need to restart the kernel to use updated packages.
Note: you may need to restart the kernel to use updated packages.


#### 위 종속성으로 설치한 패키지를 적용하려면 커널을 재시작하세요

In [2]:
# restart kernel
from IPython.core.display import HTML
HTML("<script>Jupyter.notebook.kernel.restart()</script>")

In [3]:
%store -r kb_id
# kb_id = "<knowledge base id>" If you have already created knowledge base, comment the `store -r kb_id` and provide knowledge base id here.

### Bedrock 클라이언트를 초기화하려면 아래 단계를 따르세요:

1. 필요한 라이브러리를 임포트합니다. 여기에는 Bedrock 모델 선택을 위한 LangChain, LLM과 임베딩 모델 인스턴스를 보관하는 LlamaIndex 서비스 컨텍스트가 포함됩니다. 서비스 컨텍스트는 이후 Q&A 애플리케이션의 응답을 평가할 때 사용합니다. 

2. Knowledge Base에서 `retrieve` API로 모든 텍스트 청크를 검색한 뒤 RAG 패턴으로 질의 완성을 수행하기 위해 `amazon.nova-pro-v1:0`을 대형 언어 모델로 초기화합니다.

In [4]:
import boto3
import pprint
from botocore.client import Config
import json

pp = pprint.PrettyPrinter(indent=2)
session = boto3.session.Session()
region = session.region_name
bedrock_config = Config(connect_timeout=120, read_timeout=120, retries={'max_attempts': 0})
bedrock_client = boto3.client('bedrock-runtime', region_name = region)
bedrock_agent_client = boto3.client("bedrock-agent-runtime",
                              config=bedrock_config, region_name = region)
print(region)

us-west-2


### 1부 - Amazon Bedrock Foundation Model과 함께 Retrieve API 사용

사용자 질의를 임베딩으로 변환하고 Knowledge Base를 검색하며 관련 결과를 반환해 의미 기반 검색 결과 위에 사용자 정의 워크플로를 구성할 수 있도록 하는 Amazon Bedrock Knowledge Bases의 `Retrieve API`를 호출하는 함수를 정의합니다. 

Retrieve API는 Amazon Bedrock이 제공하는 어떤 Foundation Model이든 사용할 수 있으며, 사용 사례에 따라 HYBRID 또는 SEMANTIC 검색 유형을 선택할 수 있는 유연성을 제공합니다. 
Hybrid Search 기능에 대한 자세한 내용은 [블로그](#https://aws.amazon.com/blogs/machine-learning/knowledge-bases-for-amazon-bedrock-now-supports-hybrid-search/)를 참고하세요.

In [8]:
def retrieve(query, kbId, numberOfResults=5):
    return bedrock_agent_client.retrieve(
        retrievalQuery= {
            'text': query
        },
        knowledgeBaseId=kbId,
        retrievalConfiguration= {
            'vectorSearchConfiguration': {
                'numberOfResults': numberOfResults,
                'overrideSearchType': "SEMANTIC", # optional
            }
        }
    )

#### LLM 응답을 조회하기 전에 Knowledge Base ID를 초기화하세요

이제 `retrieve API`를 호출하면서 `knowledge base id`, `number of results`, `query`를 파라미터로 전달합니다. 

`score`: 반환된 각 텍스트 청크의 점수를 확인하면 질의와 얼마나 밀접하게 일치하는지 상관성을 파악할 수 있습니다.

In [10]:
query = "Amazon Aurora에 대해 설명해주세요"
response = retrieve(query, kb_id, 5)
retrievalResults = response['retrievalResults']
pp.pprint(retrievalResults)

[ { 'content': { 'text': 'Amazon Aurora는 표준 MySQL 데이터베이스보다 최대 5배 빠르고 표준 '
                         'PostgreSQL 데이터베이 스보다 3배 빠릅니다. 1/10의 비용으로 상용 데이터베이스의 '
                         '보안, 가용성 및 신뢰성을 제공합니다. Amazon Aurora는 하드웨어 프로비저닝, '
                         '데이터베이스 설정, 패치 적용 및 백업과 같이 시간이 많이 걸 리는 관리 작업을 자동화하는 '
                         'Amazon Relational Database Service(Amazon RDS)에서 '
                         '완벽하게 관리 합니다.     Amazon Aurora는 데이터베이스 인스턴스당 최대 '
                         '128TB까지 자동 확장되는 내결함성 자체 복구 분산 스토리지 시스템을 갖추고 있습니다.',
                 'type': 'TEXT'},
    'location': { 's3Location': { 'uri': 's3://bedrock-kb-6094322-1/aws-overview.pdf'},
                  'type': 'S3'},
    'metadata': { 'x-amz-bedrock-kb-chunk-id': '1%3A0%3AQ6E8Z5wBzfBSesdYFNPf',
                  'x-amz-bedrock-kb-data-source-id': 'DDXS99HV7P',
                  'x-amz-bedrock-kb-document-page-number': 56.0,
                  'x-amz-bedrock-kb-source-file-modality': 'TEXT',
                  'x-amz-b

### retrieveAPI 응답에서 텍스트 청크 추출

아래 셀에서는 검색 결과에서 컨텍스트를 가져옵니다.

In [11]:
# fetch context from the response
def get_contexts(retrievalResults):
    contexts = []
    for retrievedResult in retrievalResults: 
        contexts.append(retrievedResult['content']['text'])
    return contexts

In [12]:
contexts = get_contexts(retrievalResults)
pp.pprint(contexts)

[ 'Amazon Aurora는 표준 MySQL 데이터베이스보다 최대 5배 빠르고 표준 PostgreSQL 데이터베이 스보다 3배 빠릅니다. '
  '1/10의 비용으로 상용 데이터베이스의 보안, 가용성 및 신뢰성을 제공합니다. Amazon Aurora는 하드웨어 프로비저닝, '
  '데이터베이스 설정, 패치 적용 및 백업과 같이 시간이 많이 걸 리는 관리 작업을 자동화하는 Amazon Relational '
  'Database Service(Amazon RDS)에서 완벽하게 관리 합니다.     Amazon Aurora는 데이터베이스 인스턴스당 '
  '최대 128TB까지 자동 확장되는 내결함성 자체 복구 분산 스토리지 시스템을 갖추고 있습니다.',
  '.     시계열 사물 인터넷(IoT) 애플리케이 션, DevOps, 산업 원격 측정     • Amazon Timestream - '
  '빠르 고 확장 가능한 서버리스 시 계열 데이터베이스     AWS 데이터베이스 서비스 비교 45           '
  'https://aws.amazon.com/dynamodb/         '
  'https://aws.amazon.com/elasticache/         '
  'https://aws.amazon.com/memorydb/         '
  'https://aws.amazon.com/documentdb/         '
  'https://aws.amazon.com/documentdb/         '
  'https://aws.amazon.com/keyspaces/         '
  'https://aws.amazon.com/neptune/         '
  'https://aws.amazon.com/timestream/Amazon Web Services 개요 AWS 백서     Amazon '
  'Aurora     Amazon Aurora는 고성능 상용 데이터베이스의 속도와 가용성에 오픈 소스 데이터베이스의 간편성과 비

### 모델에 특화된 프롬프트로 응답을 개인화하기

아래 프롬프트는 모델이 AWS의 솔루션즈 아키텍트 역할을 수행해서 AWS에 대한 전문 지식을 바탕으로 질문에 답하도록 안내합니다. 앞서 받은 `Retrieve API` 응답을 프롬프트의 `{contexts}`에 포함해 모델이 참고하도록 하고, 사용자 `query`도 함께 전달합니다.  

In [14]:
prompt = f"""
Human: 당신은 AWS 솔루션즈 아키텍트로써, 사실을 기반으로 질문에 답변을 제공합니다.
<question> 태그로 묶인 질문에 대해 다음 정보를 활용하여 간결한 답변을 제공하십시오.
답변을 알지 못할 경우, 답변을 알지 못한다고 말하고 답변을 지어내려 하지 마십시오.
<context>
{contexts}
</context>

<question>
{query}
</question>

답변은 구체적이어야 하며 가능한 경우 통계나 수치를 활용해야 합니다.

Assistant:"""

### Amazon Bedrock의 Foundation Model 호출
이 예제에서는 Amazon Bedrock의 `amazon.nova-pro-v1:0` Foundation Model을 사용합니다. 
- 경쟁사 대비 낮은 비용으로 높은 효용을 제공하도록 설계된 모델로, 대규모 AI 배포에 적합한 안정적인 고성능 모델입니다. Amazon Nova Pro는 이미지를 처리해 텍스트 출력을 반환할 수 있고, 300K 컨텍스트 윈도우를 제공합니다.
- 모델 특성
    - Image to text & code, 다국어 대화, 복잡한 추론 및 분석

In [18]:
# payload with model paramters
messages=[{ "role":'user', "content":[{'text': prompt.format(contexts, query)}]}]
inf_params = {"maxTokens": 1000, "topP": 0.1, "temperature": 0.3}

additionalModelRequestFields = {
    "inferenceConfig": {
         "topK": 20
    }
}

In [19]:
modelId = 'us.amazon.nova-pro-v1:0' # change this to use a different version from the model provider
accept = 'application/json'
contentType = 'application/json'
model_response = bedrock_client.converse(
    modelId=modelId, 
    messages=messages, 
    inferenceConfig=inf_params,
    additionalModelRequestFields=additionalModelRequestFields
)
print("\n[Full Response]")
print(json.dumps(model_response, indent=2, ensure_ascii=False))

print("\n[Response Content Text]")
print(model_response["output"]["message"]["content"][0]["text"])


[Full Response]
{
  "ResponseMetadata": {
    "RequestId": "84047563-dd0f-4099-bcf5-fd2811f83c36",
    "HTTPStatusCode": 200,
    "HTTPHeaders": {
      "date": "Mon, 16 Feb 2026 16:42:34 GMT",
      "content-type": "application/json",
      "content-length": "1114",
      "connection": "keep-alive",
      "x-amzn-requestid": "84047563-dd0f-4099-bcf5-fd2811f83c36"
    },
    "RetryAttempts": 0
  },
  "output": {
    "message": {
      "role": "assistant",
      "content": [
        {
          "text": "Amazon Aurora는 MySQL 및 PostgreSQL과 호환되는 고성능 관계형 데이터베이스 엔진으로, 표준 MySQL 데이터베이스보다 최대 5배, 표준 PostgreSQL 데이터베이스보다 3배 빠릅니다. 또한, 1/10의 비용으로 상용 데이터베이스의 보안, 가용성 및 신뢰성을 제공합니다. Amazon Aurora는 Amazon Relational Database Service(Amazon RDS)를 통해 하드웨어 프로비저닝, 데이터베이스 설정, 패치 적용 및 백업과 같은 시간이 많이 걸리는 관리 작업을 자동화하여 완벽하게 관리됩니다. 데이터베이스 인스턴스당 최대 128TB까지 자동 확장되는 내결함성 자체 복구 분산 스토리지 시스템을 갖추고 있습니다. 또한, Amazon Redshift와의 제로 ETL 통합을 통해 Aurora MySQL 데이터를 거의 실시간으로 분석 및 기계 학습에 사용할 수 있습니다."
        }
      ]
    }
  },
  

## Part 2 - LangChain 통합
이 노트북의 두 번째 부분에서는 Amazon Bedrock Knowledge Bases가 제공하는 Retrieve API와 LangChain을 함께 사용해 Q&A 애플리케이션을 구성합니다. 유사도 검색을 기반으로 원하는 수의 문서 청크를 가져오고, 이를 LangChain retriever와 통합한 뒤 `Amazon Nova Pro` 모델로 질문에 답변합니다.

In [25]:
# from langchain.llms.bedrock import Bedrock
import langchain
from langchain_aws import ChatBedrock
from langchain_aws.retrievers import AmazonKnowledgeBasesRetriever

llm = ChatBedrock(model_id=modelId, 
                  client=bedrock_client)

LangChain에서 `AmazonKnowledgeBasesRetriever` 객체를 생성하면 Amazon Bedrock Knowledge Bases의 `Retrieve API`를 호출해 사용자 질의를 임베딩으로 변환하고 Knowledge Base를 검색한 뒤 관련 결과를 반환합니다. 이를 통해 의미 기반 검색 결과 위에 사용자 정의 워크플로를 더 세밀하게 구성할 수 있습니다. `Retrieve API` 출력에는 `retrieved text chunks`, 소스 데이터의 `location type`과 `URI`, 검색 관련성 `scores`가 포함됩니다.

In [26]:
query = "AWS상에 전통적인 3-Tier 아키텍처를 구현하려고 합니다. 가이드해주세요."
retriever = AmazonKnowledgeBasesRetriever(
        knowledge_base_id=kb_id,
        retrieval_config={"vectorSearchConfiguration": 
                          {"numberOfResults": 4,
                           'overrideSearchType': "SEMANTIC", # optional
                           }
                          },
        # endpoint_url=endpoint_url,
        # region_name=region,
        # credentials_profile_name="<profile_name>",
    )
docs = retriever.invoke(query)
pp.pprint(docs)

[ Document(metadata={'location': {'s3Location': {'uri': 's3://bedrock-kb-6094322-1/aws-overview.pdf'}, 'type': 'S3'}, 'score': 0.48418596, 'type': 'TEXT', 'source_metadata': {'x-amz-bedrock-kb-source-uri': 's3://bedrock-kb-6094322-1/aws-overview.pdf', 'x-amz-bedrock-kb-source-file-modality': 'TEXT', 'x-amz-bedrock-kb-document-page-number': 143.0, 'x-amz-bedrock-kb-chunk-id': '1%3A0%3A96E8Z5wBzfBSesdYHNNp', 'x-amz-bedrock-kb-data-source-id': 'DDXS99HV7P'}}, page_content='AWS 기반의 시스템을 구축할 때 내리는 결정의 장단점을 이해하는 데 도움이 되는 AWS Well- Architected Framework를 살펴보세요. AWS Well-Architected Framework의 6가지 원칙을 사용하면 클 라우드에서 안정적이고, 보안성이 뛰어나고, 효율적이고, 비용 효율적이며, 지속 가능한 시스템을 설계 하고 운영하기 위한 아키텍처 모범 사례를 배울 수 있습니다.     AWS Management 콘솔에서 무료로 제공되는 AWS Well-Architected Tool를 사용하면 각 요소에 대한 일련의 질문에 답하여, 이러한 모범 사례와 비교하여 워크로드를 검토할 수 있습니다. 프레임워크 및 AWS WA Tool 외에도 다양한 유형의 애플리케이션에 대한 전문화된 지침이 제공됩니다.'),
  Document(metadata={'location': {'s3Location': {'uri': 's3://bedrock-kb-6094322-1/aws-overview.pdf'}, 'type': 'S3'}, '

In [None]:
answer = qa.invoke(query)
pp.pprint(answer)

## 결론
RAG 기반 애플리케이션을 사용자화할 때는 Bedrock의 `InvokeModel` API를 직접 사용하거나, LangChain의 `AmazonKnowledgeBaseRetriever`로 통합해 Retrieve API를 활용할 수 있습니다.
Retrieve API는 Amazon Bedrock에서 제공하는 어떤 Foundation Model도 선택할 수 있는 유연함과, 사용 사례에 맞춰 HYBRID 또는 SEMANTIC 검색 유형을 선택할 수 있는 옵션을 제공합니다. 
Hybrid Search 기능에 대한 자세한 내용은 [블로그](#https://aws.amazon.com/blogs/machine-learning/knowledge-bases-for-amazon-bedrock-now-supports-hybrid-search/)를 참고하세요.

<div class="alert alert-block alert-warning">
<b>참고:</b> 비용이 발생하지 않도록 KB, OSS 인덱스 및 관련 IAM 역할과 정책을 반드시 삭제하세요.
</div>