# 한글-Claude-v2 Model: Conversational Interface - Chatbot with Claude LLM

> 이 노트북은 SageMaker Studio의 **`Data Science 3.0`** 커널과 잘 작동합니다.

> **SageMaker Notebook Instance** 를 이용해 실습을 진행하신다면, **JupyterLab이 아닌 Jupyter**에서 실행하시기 바랍니다.

이 노트북에서는 Amazon Bedrock의 기본 모델 (FM) 을 사용하여 챗봇을 구축할 것입니다.사용 사례에서는 Claude를 챗봇 구축을 위한 FM으로 사용합니다.

---
### 중요
- 이 노트북은 Anthropic 의 Claude-v2 모델 접근 가능한 분만 실행 가능합니다. 
- 접근이 안되시는 분은 노트북의 코드와 결과 만을 확인 하시면 좋겠습니다.
- 만일 실행시에는 **"과금"** 이 발생이 되는 부분 유념 해주시기 바랍니다.

## 개요

챗봇 및 가상 어시스턴트와 같은 대화형 인터페이스를 사용하여 고객의 사용자 경험을 향상시킬 수 있습니다. 챗봇은 자연어 처리 (NLP) 및 기계 학습 알고리즘을 사용하여 사용자 쿼리를 이해하고 이에 응답합니다.챗봇은 고객 서비스, 판매, 전자 상거래와 같은 다양한 애플리케이션에서 사용되어 사용자에게 빠르고 효율적인 응답을 제공할 수 있습니다.웹사이트, 소셜 미디어 플랫폼 및 메시징 앱과 같은 다양한 채널을 통해 액세스할 수 있습니다.


## Amazon Bedrock을 사용하는 챗봇

![Amazon Bedrock - Conversational Interface](./images/chatbot_bedrock.png)


## 사용 사례
- 1.**챗봇 (기본)** - FM 모델을 사용하는 제로샷 챗봇
- 2.**프롬프트를 사용하는 챗봇** - 템플릿 (Langchain) - 프롬프트 템플릿에 일부 컨텍스트가 제공된 챗봇
- 3.**페르소나가 있는 챗봇** - 정의된 역할을 가진 챗봇. 즉, 커리어 코치와 인간 상호작용
- 4.**컨텍스트 인식 챗봇** - 임베딩을 생성하여 외부 파일을 통해 컨텍스트를 전달합니다.

## Amazon Bedrock으로 챗봇을 구축하기 위한 랭체인 프레임워크
챗봇과 같은 대화형 인터페이스에서는 단기적 수준뿐만 아니라 장기적 수준에서도 이전 상호 작용을 기억하는 것이 매우 중요합니다.

LangChain은 메모리 구성 요소를 두 가지 형태로 제공합니다.먼저 LangChain은 이전 채팅 메시지를 관리하고 조작하기 위한 도우미 유틸리티를 제공합니다.모듈식으로 설계되어 사용 방식에 관계없이 유용하게 사용할 수 있습니다.둘째, LangChain은 이러한 유틸리티를 체인에 통합하는 쉬운 방법을 제공합니다.
이를 통해 다양한 유형의 추상화를 쉽게 정의하고 상호 작용할 수 있으므로 강력한 챗봇을 쉽게 구축할 수 있습니다.

## 컨텍스트를 활용한 챗봇 구축하기 - 핵심 요소

컨텍스트 인식 챗봇을 구축하는 첫 번째 프로세스는 컨텍스트에 대한**임베딩을 생성**하는 것입니다.일반적으로 임베딩 모델을 통해 실행되고 일종의 벡터 저장소에 저장될 임베딩을 생성하는 통합 프로세스가 있습니다.이 예제에서는 이를 위해 Amazon Titan 임베딩 모델을 사용하고 있습니다.

![Embeddings](./images/embeddings_lang.png)

두 번째 프로세스는 사용자 요청 오케스트레이션, 상호 작용, 호출 및 결과 반환입니다.

![Chatbot](./images/chatbot_lang.png)

## 아키텍처 [컨텍스트 인식 챗봇]
![4](./images/context-aware-chatbot.png)


### 설정

이 노트북의 나머지 부분을 실행하기 전에 아래 셀을 실행하여 (필요한 라이브러리가 설치되어 있는지 확인하고) Bedrock에 연결해야 합니다.


이 노트북에는 몇 가지 추가 종속성도 필요합니다.

- [FAISS](https://github.com/facebookresearch/faiss), 벡터 임베딩 저장용
- [iPyWidgets](https://ipywidgets.readthedocs.io/en/stable/), 노트북의 대화형 UI 위젯용
- [PyPDF](https://pypi.org/project/pypdf/), PDF 파일 처리용

In [1]:
%load_ext autoreload
%autoreload 2

import sys, os
module_path = ".."
sys.path.append(os.path.abspath(module_path))

# 1. Bedrock Client 생성

In [2]:
import json
import boto3
from pprint import pprint
from termcolor import colored
from utils import bedrock, print_ww
from utils.bedrock import bedrock_info

# ---- ⚠️ Un-comment and edit the below lines as needed for your AWS setup ⚠️ ----

# os.environ["AWS_DEFAULT_REGION"] = "<REGION_NAME>"  # E.g. "us-east-1"
# os.environ["AWS_PROFILE"] = "<YOUR_PROFILE>"
# os.environ["BEDROCK_ASSUME_ROLE"] = "<YOUR_ROLE_ARN>"  # E.g. "arn:aws:..."
# os.environ["BEDROCK_ENDPOINT_URL"] = "<YOUR_ENDPOINT_URL>"  # E.g. "https://..."


boto3_bedrock = bedrock.get_bedrock_client(
    assumed_role=os.environ.get("BEDROCK_ASSUME_ROLE", None),
    endpoint_url=os.environ.get("BEDROCK_ENDPOINT_URL", None),
    region=os.environ.get("AWS_DEFAULT_REGION", None),
)

print (colored("\n== FM lists ==", "green"))
pprint (bedrock_info.get_list_fm_models())

Create new client
  Using region: None
  Using profile: None
boto3 Bedrock client successfully created!
bedrock-runtime(https://bedrock-runtime.us-east-1.amazonaws.com)
[32m
== FM lists ==[0m
{'Claude-Instant-V1': 'anthropic.claude-instant-v1',
 'Claude-V1': 'anthropic.claude-v1',
 'Claude-V2': 'anthropic.claude-v2',
 'Command': 'cohere.command-text-v14',
 'Jurassic-2-Mid': 'ai21.j2-mid-v1',
 'Jurassic-2-Ultra': 'ai21.j2-ultra-v1',
 'Titan-Embeddings-G1': 'amazon.titan-embed-text-v1',
 'Titan-Text-G1': 'TBD'}


# 2. 챗봇(기본 - 컨텍스트 없음)

우리는 LangChain의 [CoversationChain](https://python.langchain.com/en/latest/modules/models/llms/integrations/bedrock.html?highlight=ConversationChain#using-in-a-conversation-chain)을 사용하여 시작합니다. 대화. 또한 메시지 저장을 위해 [ConversationBufferMemory](https://python.langchain.com/en/latest/modules/memory/types/buffer.html)를 사용합니다. 메시지 목록으로 기록을 얻을 수도 있습니다(채팅 모델에서 매우 유용합니다).

챗봇은 이전 상호작용을 기억해야 합니다. 대화 기억을 통해 우리는 그렇게 할 수 있습니다. 대화형 메모리를 구현하는 방법에는 여러 가지가 있습니다. LangChain의 맥락에서 이들은 모두 ConversationChain 위에 구축됩니다.

**참고:** 모델 출력은 비결정적입니다.

In [3]:
from utils.chat import chat_utils
from langchain.llms.bedrock import Bedrock
from langchain.chains import ConversationChain
from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler

In [4]:
# - create the Anthropic Model
llm_text = Bedrock(
    model_id=bedrock_info.get_model_id(model_name="Claude-V2"),
    client=boto3_bedrock,
    model_kwargs={
        "max_tokens_to_sample": 512,
        "temperature": 0,
        "top_k": 250,
        "top_p": 0.999,
        "stop_sequences": ["\n\nHuman:", "\n\nUser:"]
    },
    streaming=True,
    callbacks=[StreamingStdOutCallbackHandler()],
)

## Conversation momory
* **[ConversationBufferMemory](https://python.langchain.com/docs/modules/memory/types/buffer)**
    - This memory allows for storing messages and then extracts the messages in a variable.
* **[ConversationBufferWindowMemory](https://python.langchain.com/docs/modules/memory/types/buffer_window)**
    - It keeps a list of the interactions of the conversation over time.
    - It only uses the last K interactions.
    - This can be useful for keeping a sliding window of the most recent interactions, so the buffer does not get too large.
* **[ConversationSummaryBufferMemory](https://python.langchain.com/docs/modules/memory/types/summary_buffer)**
    - It maintains a summary of previous messages.
    - It combines the two ideas.
    - It keeps a buffer of recent interactions in memory, but rather than just completely flushing old interactions it compiles them into a summary and uses both. 
    - It uses token length rather than number of interactions to determine when to flush interactions.

In [5]:
memory = chat_utils.get_memory(
    memory_type="ConversationBufferMemory",
    memory_key="history"
)

conversation = ConversationChain(
    llm=llm_text,
    verbose=True,
    memory=memory
)

In [6]:
if llm_text.streaming:
    response = conversation.predict(input="안녕하세요?")
else:
    print_ww(conversation.predict(input="안녕하세요?"))



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:
[]
Human: 안녕하세요?
AI:[0m
 네, 안녕하세요!
[1m> Finished chain.[0m


### 결과 분석

여기서 무슨 일이 일어나는가? 우리는 "안녕하세요!"라고 말했습니다. 모델은 몇 가지 대화를 나눴습니다. 이는 Langchain ConversationChain에서 사용하는 기본 프롬프트가 Claude에 맞게 잘 설계되지 않았기 때문입니다. 
- [효과적인 클로드 프롬프트](https://docs.anthropic.com/claude/docs/introduction-to-prompt-design)는 `\n\nHuman\n\nAassistant:`로 끝나야 합니다. 이 문제를 해결해 보겠습니다.

Claude의 프롬프트 작성 방법에 대해 자세히 알아보려면 [Anthropic 문서](https://docs.anthropic.com/claude/docs/introduction-to-prompt-design)를 확인하세요.

### Reset memory

In [7]:
chat_utils.clear_memory(
    chain=conversation
)
print_ww(memory.load_memory_variables({}))

{'history': []}


# 3. 프롬프트 템플릿(Langchain)을 이용한 챗봇

LangChain은 프롬프트를 쉽게 구성하고 작업할 수 있도록 여러 클래스와 기능을 제공합니다. [PromptTemplate](https://python.langchain.com/en/latest/modules/prompts/getting_started.html) 클래스를 사용하여 f-string 템플릿에서 프롬프트를 구성하겠습니다.

**[TIP] Prompt의 instruction의 경우 한글보다 **영어**로 했을 때 더 좋은 결과를 얻을 수 있습니다.**

In [8]:
from langchain import PromptTemplate

In [9]:
# turn verbose to true to see the full logs and documents
conversation = ConversationChain(
    llm=llm_text,
    verbose=False,
    memory=memory
)

claude_prompt = PromptTemplate(
        input_variables=["history", 'input'],
        template="""
        \n\nHuman: Here's a friendly conversation between a user and an AI.
        The AI is talkative and provides lots of contextualized details.
        If it doesn't know, it will honestly say that it doesn't know the answer to the question.

        Current conversation:
        {history}

        User:
        {input}

        \n\nAssistant:
        """
)

print("claude_prompt: \n", claude_prompt)

claude_prompt: 
 input_variables=['history', 'input'] template="\n        \n\nHuman: Here's a friendly conversation between a user and an AI.\n        The AI is talkative and provides lots of contextualized details.\n        If it doesn't know, it will honestly say that it doesn't know the answer to the question.\n\n        Current conversation:\n        {history}\n\n        User:\n        {input}\n\n        \n\nAssistant:\n        "


In [10]:
conversation.prompt = claude_prompt

In [11]:
chat_utils.get_tokens(
    chain=conversation,
    prompt="안녕하세요?"
)

# tokens: 8


8

In [12]:
if llm_text.streaming:
    response = conversation.predict(input="안녕하세요?")
else:
    print_ww(conversation.predict(input="안녕하세요?"))

 네, 안녕하세요! 반갑습니다.

#### (1) 새로운 질문

모델이 초기 메시지로 응답했습니다. 몇 가지 질문을 해보겠습니다.

In [13]:
if llm_text.streaming:
    response = conversation.predict(input="새로운 정원을 시작하는 방법에 대한 몇 가지 팁을 알려주세요.")
else:
    print_ww(conversation.predict(input="새로운 정원을 시작하는 방법에 대한 몇 가지 팁을 알려주세요."))

 네, 새로운 정원을 시작하는 몇 가지 유용한 팁을 알려드리겠습니다.

먼저, 정원의 위치를 잘 선택하는 것이 중요합니다. 해가 잘 드는 곳으로 선택하시고, 땅이 비옥한 토양인지 확인하세요. 

다음으로는 어떤 종류의 채소나 화훼를 키울 지 미리 계획을 세우세요. 계절별로 재배할 작물을 결정하고, 그에 맞춰 씨앗이나 묘목을 준비하세요.

흙을 고르고, 깊이 갈아엎는 것도 중요합니다. 토양을 부드럽고 활기 있게 만드는 것이 좋습니다. 

물 공급을 위한 시스템도 마련하세요. 주기적으로 물을 공급할 수 있는 방법이 필요합니다.

마지막으로, 야채나 꽃을 심은 후에는 제초와 병충해 관리를 잘 하는 것이 성공적인 정원 가꾸기의 핵심입니다.

이런 기본 팁을 참고하시면 좋은 정원을 가꿀 수 있을 것 같습니다. 정성껏 가꾸다 보면 정말 보람 있는 일이 될 거예요.

#### Check momory

In [14]:
print_ww(memory.load_memory_variables({}))

{'history': [HumanMessage(content='안녕하세요?'), AIMessage(content=' 네, 안녕하세요! 반갑습니다.'),
HumanMessage(content='새로운 정원을 시작하는 방법에 대한 몇 가지 팁을 알려주세요.'), AIMessage(content=' 네, 새로운 정원을 시작하는 몇 가지
유용한 팁을 알려드리겠습니다.\n\n먼저, 정원의 위치를 잘 선택하는 것이 중요합니다. 해가 잘 드는 곳으로 선택하시고, 땅이 비옥한 토양인지 확인하세요. \n\n다음으로는 어떤
종류의 채소나 화훼를 키울 지 미리 계획을 세우세요. 계절별로 재배할 작물을 결정하고, 그에 맞춰 씨앗이나 묘목을 준비하세요.\n\n흙을 고르고, 깊이 갈아엎는 것도 중요합니다.
토양을 부드럽고 활기 있게 만드는 것이 좋습니다. \n\n물 공급을 위한 시스템도 마련하세요. 주기적으로 물을 공급할 수 있는 방법이 필요합니다.\n\n마지막으로, 야채나 꽃을
심은 후에는 제초와 병충해 관리를 잘 하는 것이 성공적인 정원 가꾸기의 핵심입니다.\n\n이런 기본 팁을 참고하시면 좋은 정원을 가꿀 수 있을 것 같습니다. 정성껏 가꾸다 보면
정말 보람 있는 일이 될 거예요.')]}


#### (2) 질문을 토대로 작성

모델이 이전 대화를 이해할 수 있는지 확인하기 위해 정원이라는 단어를 언급하지 않고 질문해 보겠습니다.

In [15]:
if llm_text.streaming:
    response = conversation.predict(input="좋아요. 토마토에도 어울릴까요?")
else:
    print_ww(conversation.predict(input="좋아요. 토마토에도 어울릴까요?"))

 네, 토마토를 키우기에도 이 팁들이 도움이 될 거예요. 

토마토는 해가 잘 드는 곳에 심는 게 좋습니다. 남쪽이나 서쪽을 향한 곳이 이상적이죠. 

토마토는 비옥한 토양을 좋아하니, 영양분이 풍부한 흙을 준비하는 것이 중요합니다. 

묘목은 해가 따뜻해지는 봄에 심는 것이 좋고, 수확량을 늘리기 위해서는 지속적으로 물과 영양분을 공급하는 것이 필요합니다.

토마토는 병충해에 취약하니, 예방 차원에서 제초와 방제를 잘 하는 것도 도움이 될 거예요. 

이런 팁들을 참고하셔서 토마토 정원 가꾸기를 시작하시면 좋을 것 같습니다. 맛있는 토마토를 키우시는 데 도움이 되었으면 좋겠습니다.

In [16]:
print_ww (memory.load_memory_variables({}))

{'history': [HumanMessage(content='안녕하세요?'), AIMessage(content=' 네, 안녕하세요! 반갑습니다.'),
HumanMessage(content='새로운 정원을 시작하는 방법에 대한 몇 가지 팁을 알려주세요.'), AIMessage(content=' 네, 새로운 정원을 시작하는 몇 가지
유용한 팁을 알려드리겠습니다.\n\n먼저, 정원의 위치를 잘 선택하는 것이 중요합니다. 해가 잘 드는 곳으로 선택하시고, 땅이 비옥한 토양인지 확인하세요. \n\n다음으로는 어떤
종류의 채소나 화훼를 키울 지 미리 계획을 세우세요. 계절별로 재배할 작물을 결정하고, 그에 맞춰 씨앗이나 묘목을 준비하세요.\n\n흙을 고르고, 깊이 갈아엎는 것도 중요합니다.
토양을 부드럽고 활기 있게 만드는 것이 좋습니다. \n\n물 공급을 위한 시스템도 마련하세요. 주기적으로 물을 공급할 수 있는 방법이 필요합니다.\n\n마지막으로, 야채나 꽃을
심은 후에는 제초와 병충해 관리를 잘 하는 것이 성공적인 정원 가꾸기의 핵심입니다.\n\n이런 기본 팁을 참고하시면 좋은 정원을 가꿀 수 있을 것 같습니다. 정성껏 가꾸다 보면
정말 보람 있는 일이 될 거예요.'), HumanMessage(content='좋아요. 토마토에도 어울릴까요?'), AIMessage(content=' 네, 토마토를 키우기에도 이
팁들이 도움이 될 거예요. \n\n토마토는 해가 잘 드는 곳에 심는 게 좋습니다. 남쪽이나 서쪽을 향한 곳이 이상적이죠. \n\n토마토는 비옥한 토양을 좋아하니, 영양분이 풍부한
흙을 준비하는 것이 중요합니다. \n\n묘목은 해가 따뜻해지는 봄에 심는 것이 좋고, 수확량을 늘리기 위해서는 지속적으로 물과 영양분을 공급하는 것이 필요합니다.\n\n토마토는
병충해에 취약하니, 예방 차원에서 제초와 방제를 잘 하는 것도 도움이 될 거예요. \n\n이런 팁들을 참고하셔서 토마토 정원 가꾸기를 시작하시면 좋을 것 같습니다. 맛있는 토마토를
키우시는 데 도움이 되었으면

#### (3) 대화를 마치며

In [17]:
if llm_text.streaming:
    response = conversation.predict(input="그게 다야, 고마워!")
else:
    print_ww(conversation.predict(input="그게 다야, 고마워!"))

 네, 천만에요! 새로운 정원 가꾸기에 도움이 되었기를 바랍니다. 정성껏 가꾸다 보면 정말 보람 있는 일이 될 거예요. 앞으로도 좋은 팁이 필요하시면 언제든지 문의해 주세요. 즐거운 정원 가꾸기 되세요!

# 4. ipywidgets를 사용한 대화형 세션

다음 유틸리티 클래스를 사용하면 Claude와 보다 자연스러운 방식으로 상호 작용할 수 있습니다. 입력창에 질문을 적고 클로드의 답변을 받습니다. 그러면 대화를 계속할 수 있습니다.

In [18]:
import ipywidgets as ipw
from IPython.display import display, clear_output

class ChatUX:
    """ A chat UX using IPWidgets
    """
    def __init__(self, qa, retrievalChain = False):
        self.qa = qa
        self.name = None
        self.b=None
        self.retrievalChain = retrievalChain
        self.out = ipw.Output()

        if "ConversationChain" in str(type(self.qa)):
            self.streaming = self.qa.llm.streaming
        elif "ConversationalRetrievalChain" in str(type(self.qa)):
            self.streaming = self.qa.combine_docs_chain.llm_chain.llm.streaming

    def start_chat(self):
        print("Starting chat bot")
        display(self.out)
        self.chat(None)


    def chat(self, _):
        if self.name is None:
            prompt = ""
        else: 
            prompt = self.name.value
        if 'q' == prompt or 'quit' == prompt or 'Q' == prompt:
            print("Thank you , that was a nice chat !!")
            return
        elif len(prompt) > 0:
            with self.out:
                thinking = ipw.Label(value="Thinking...")
                display(thinking)
                try:
                    if self.retrievalChain:
                        result = self.qa.run({'question': prompt })
                    else:
                        result = self.qa.run({'input': prompt }) #, 'history':chat_history})
                except:
                    result = "No answer"
                thinking.value=""
                if self.streaming:
                    response = f"AI:{result}"
                else:
                    print_ww(f"AI:{result}")
                self.name.disabled = True
                self.b.disabled = True
                self.name = None

        if self.name is None:
            with self.out:
                self.name = ipw.Text(description="You:", placeholder='q to quit')
                self.b = ipw.Button(description="Send")
                self.b.on_click(self.chat)
                display(ipw.Box(children=(self.name, self.b)))

#### (1) 채팅을 시작해 보겠습니다. 다음 질문을 테스트할 수도 있습니다.

1. 농담 하나 해줘
2. 또 다른 농담을 들려주세요
3. 첫 번째 농담은 무엇이었나요?
4. 첫 번째 농담과 같은 주제로 또 다른 농담을 할 수 있나요?

위의 4가지를 순서대로 아래에 입력하시고, "Send" 버튼을 눌러 보세요.

In [19]:
chat = ChatUX(conversation)

In [20]:
chat = ChatUX(conversation)
chat.start_chat()

Starting chat bot


Output()

# 5.페르소나를 활용한 챗봇

AI 비서가 커리어 코치 역할을 하게 됩니다. 
- 역할극 대화에서는 채팅을 시작하기 전에 사용자 메시지를 설정해야 합니다. ConversationBufferMemory는 대화 상자를 미리 채우는 데 사용됩니다.

### (1) ConversationChain 생성 필요한 메모리 초기화, Bedrock Claude 설정

In [21]:
# llm
llm_text = Bedrock(
    model_id=bedrock_info.get_model_id(model_name="Claude-V2"),
    client=boto3_bedrock,
    model_kwargs={
        "max_tokens_to_sample": 1000,
        "temperature": 0,
        "top_k": 250,
        "top_p": 0.999,
        "stop_sequences": ["\n\nHuman:"]
    },
    streaming=True,
    callbacks=[StreamingStdOutCallbackHandler()],
)

# memory
# store previous interactions using ConversationalBufferMemory and add custom prompts to the chat.
memory = chat_utils.get_memory(
    memory_type="ConversationBufferMemory",
    memory_key="history"
)

memory.chat_memory.add_user_message("당신은 직업 코치로 활동하게 될 것입니다. 귀하의 목표는 사용자에게 직업 조언을 제공하는 것입니다")
memory.chat_memory.add_ai_message("나는 직업 코치이며 직업에 대한 조언을 제공합니다")

# conversation chain
conversation = ConversationChain(
    llm=llm_text,
    verbose=True,
    memory=memory
)
print(conversation)

# langchain prompts do not always work with all the models. This prompt is tuned for Claude
claude_prompt = PromptTemplate.from_template("""
\n\nHuman: Here's a friendly conversation between a user and an AI.
The AI is talkative and provides lots of contextualized details.
If it doesn't know, it will honestly say that it doesn't know the answer to the question.

Current conversation:
{history}

User: {input}

\n\nAssistant:
"""
)


print("claude_prompt: \n", claude_prompt)
conversation.prompt = claude_prompt

memory=ConversationBufferMemory(chat_memory=ChatMessageHistory(messages=[HumanMessage(content='당신은 직업 코치로 활동하게 될 것입니다. 귀하의 목표는 사용자에게 직업 조언을 제공하는 것입니다'), AIMessage(content='나는 직업 코치이며 직업에 대한 조언을 제공합니다')]), return_messages=True) verbose=True llm=Bedrock(client=<botocore.client.BedrockRuntime object at 0x7fe9704a0eb0>, model_id='anthropic.claude-v2', model_kwargs={'max_tokens_to_sample': 1000, 'temperature': 0, 'top_k': 250, 'top_p': 0.999, 'stop_sequences': ['\n\nHuman:']}, streaming=True, callbacks=[<langchain.callbacks.streaming_stdout.StreamingStdOutCallbackHandler object at 0x7fe96da43b80>])
claude_prompt: 
 input_variables=['history', 'input'] template="\n\n\nHuman: Here's a friendly conversation between a user and an AI.\nThe AI is talkative and provides lots of contextualized details.\nIf it doesn't know, it will honestly say that it doesn't know the answer to the question.\n\nCurrent conversation:\n{history}\n\nUser: {input}\n\n\n\nAssistant:\n"


### (2) 인공지능 관련 직업 질문

In [22]:
if llm_text.streaming:
    response = conversation.predict(input="“인공지능에 관련된 직업은 어떤 것이 있습니까?")
else:
    print_ww(conversation.predict(input="“인공지능에 관련된 직업은 어떤 것이 있습니까?"))



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3m


Human: Here's a friendly conversation between a user and an AI.
The AI is talkative and provides lots of contextualized details.
If it doesn't know, it will honestly say that it doesn't know the answer to the question.

Current conversation:
[HumanMessage(content='당신은 직업 코치로 활동하게 될 것입니다. 귀하의 목표는 사용자에게 직업 조언을 제공하는 것입니다'), AIMessage(content='나는 직업 코치이며 직업에 대한 조언을 제공합니다')]

User: “인공지능에 관련된 직업은 어떤 것이 있습니까?



Assistant:
[0m
 네, 인공지능과 관련된 직업은 다음과 같습니다:

- AI 연구원 - AI 알고리즘과 모델을 연구하고 개발합니다. 

- 데이터 사이언티스트 - 대규모 데이터를 수집, 처리, 분석하고 AI 모델을 훈련시킵니다.

- 머신러닝 엔지니어 - 머신러닝/딥러닝 시스템을 설계, 구축, 유지보수 합니다.

- AI 프로덕트 매니저 - AI 제품의 기획, 로드맵 수립 등 AI 비즈니스를 주도합니다.

- 로보틱스 엔지니어 - 인공지능이 장착된 로봇의 하드웨어와 소프트웨어를 개발합니다. 

- 자연어 처리 엔지니어 - 자연어 인식, 이해, 생성 AI를 개발합니다.

- 컴퓨터 비전 엔지니어 - 이미지/동영상 인식 AI를 개발합니다. 

이외에도 UX/UI 디자이너, 비즈니스 애널리스트 등 다양한 직업군이 있습니다. 관심 있는 분야를 탐색하셔서 자신에 맞는 직업을 찾아보세요.
[1m> Finished chain.[0m


### (3) 인공지능 관련 직업데 대한 세부 질문

In [23]:
if llm_text.streaming:
    response = conversation.predict(input="이 직업들은 실제로 무엇을 하는가요? 재미있나요?")
else:
    print_ww(conversation.predict(input="이 직업들은 실제로 무엇을 하는가요? 재미있나요?"))



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3m


Human: Here's a friendly conversation between a user and an AI.
The AI is talkative and provides lots of contextualized details.
If it doesn't know, it will honestly say that it doesn't know the answer to the question.

Current conversation:
[HumanMessage(content='당신은 직업 코치로 활동하게 될 것입니다. 귀하의 목표는 사용자에게 직업 조언을 제공하는 것입니다'), AIMessage(content='나는 직업 코치이며 직업에 대한 조언을 제공합니다'), HumanMessage(content='“인공지능에 관련된 직업은 어떤 것이 있습니까?'), AIMessage(content=' 네, 인공지능과 관련된 직업은 다음과 같습니다:\n\n- AI 연구원 - AI 알고리즘과 모델을 연구하고 개발합니다. \n\n- 데이터 사이언티스트 - 대규모 데이터를 수집, 처리, 분석하고 AI 모델을 훈련시킵니다.\n\n- 머신러닝 엔지니어 - 머신러닝/딥러닝 시스템을 설계, 구축, 유지보수 합니다.\n\n- AI 프로덕트 매니저 - AI 제품의 기획, 로드맵 수립 등 AI 비즈니스를 주도합니다.\n\n- 로보틱스 엔지니어 - 인공지능이 장착된 로봇의 하드웨어와 소프트웨어를 개발합니다. \n\n- 자연어 처리 엔지니어 - 자연어 인식, 이해, 생성 AI를 개발합니다.\n\n- 컴퓨터 비전 엔지니어 - 이미지/동영상 인식 AI를 개발합니다. \n\n이외에도 UX/UI 디자이너, 비즈니스 애널리스트 등 다양한 직업군이 있습니다. 관심 있는 분야를 탐색하셔서 자신에 맞는 직업을 찾아보세요.')]

User: 이 직업들

#### Check memory

In [24]:
pprint(memory.load_memory_variables({}))

{'history': [HumanMessage(content='당신은 직업 코치로 활동하게 될 것입니다. 귀하의 목표는 사용자에게 직업 조언을 제공하는 것입니다'),
             AIMessage(content='나는 직업 코치이며 직업에 대한 조언을 제공합니다'),
             HumanMessage(content='“인공지능에 관련된 직업은 어떤 것이 있습니까?'),
             AIMessage(content=' 네, 인공지능과 관련된 직업은 다음과 같습니다:\n\n- AI 연구원 - AI 알고리즘과 모델을 연구하고 개발합니다. \n\n- 데이터 사이언티스트 - 대규모 데이터를 수집, 처리, 분석하고 AI 모델을 훈련시킵니다.\n\n- 머신러닝 엔지니어 - 머신러닝/딥러닝 시스템을 설계, 구축, 유지보수 합니다.\n\n- AI 프로덕트 매니저 - AI 제품의 기획, 로드맵 수립 등 AI 비즈니스를 주도합니다.\n\n- 로보틱스 엔지니어 - 인공지능이 장착된 로봇의 하드웨어와 소프트웨어를 개발합니다. \n\n- 자연어 처리 엔지니어 - 자연어 인식, 이해, 생성 AI를 개발합니다.\n\n- 컴퓨터 비전 엔지니어 - 이미지/동영상 인식 AI를 개발합니다. \n\n이외에도 UX/UI 디자이너, 비즈니스 애널리스트 등 다양한 직업군이 있습니다. 관심 있는 분야를 탐색하셔서 자신에 맞는 직업을 찾아보세요.'),
             HumanMessage(content='이 직업들은 실제로 무엇을 하는가요? 재미있나요?'),
             AIMessage(content=' 네, 인공지능 관련 직업들이 실제로 하는 일과 재미있는 점에 대해 더 자세히 설명드리겠습니다.\n\nAI 연구원은 새로운 알고리즘과 모델을 연구하고 개발하는 일을 합니다. 인간의 지능을 컴퓨터에 구현하는 일은 정말 흥미롭고 도전적인 일이에요. \n\n데이터 사이언티스트는 대량의 데이터를 다루고 AI 모델을 훈련시키는 일을 합니다. 데이터에서 인사이트를

# 6. 맥락을 가진 챗봇

## 상황에 맞는 챗봇
이 사용 사례에서는 Chatbot에게 이전에 본 적이 없는 외부 코퍼스의 질문에 답변하도록 요청합니다. 이를 위해 RAG(Retrieval Augmented Generation)라는 패턴을 적용합니다. 아이디어는 말뭉치를 덩어리로 인덱싱한 다음 덩어리와 질문 사이의 의미론적 유사성을 사용하여 말뭉치의 어느 섹션이 답변을 제공하는 데 관련될 수 있는지 찾는 것입니다. 마지막으로 가장 관련성이 높은 청크가 집계되어 기록을 제공하는 것과 유사하게 ConversationChain에 컨텍스트로 전달됩니다.

**Titan Embeddings Model**을 사용하여 벡터를 생성하겠습니다. 그런 다음 이 벡터는 메모리 내 벡터 데이터 저장소를 제공하는 Amazon OpenSearch에 저장됩니다. 챗봇이 질문을 받으면 OpenSearch에 질문을 쿼리하고 의미상 가장 가까운 텍스트를 검색합니다. 이것이 우리의 대답이 될 것입니다.

## 6.1 2022년 아마존 주주 서한 문서로 구현 (PDF 문서)

### Amazon Titan Embedding 모델 사용 
- model_id="amazon.titan-embed-text-v1"
- 이 모델은 최대 8,192 Token 입력이 가능합니다.

In [144]:
from langchain.embeddings import BedrockEmbeddings

In [145]:
bedrock_embeddings = BedrockEmbeddings(
    client=boto3_bedrock,
    model_id=bedrock_info.get_model_id(
        model_name="Titan-Embeddings-G1"
    )
)

### PyPDFDirectoryLoader 를 통한 PDF 파일 로딩
- chunk_size 는 임베딩 모델의 최대 입력 토큰 (8,192) 수를 고려하여 정해야 합니다.

In [146]:
import numpy as np
from langchain.text_splitter import CharacterTextSplitter, RecursiveCharacterTextSplitter, SpacyTextSplitter
from langchain.document_loaders import PyPDFLoader, PyPDFDirectoryLoader
from langchain.vectorstores import FAISS
from langchain.indexes.vectorstore import VectorStoreIndexWrapper

In [147]:
loader = PyPDFDirectoryLoader("./rag_data_kr_pdf/")

* RecursiveCharacterTextSplitter: charater based splitter

In [148]:
# documents = loader.load()
# # - in our testing Character split works better with this PDF data set
# text_splitter = RecursiveCharacterTextSplitter(
#     # Set a really small chunk size, just to show.
#     chunk_size=1024,
#     chunk_overlap=256,
#     # separators = ['\n'],
#     separators = ['\n','\n\n']
# )
# docs = text_splitter.split_documents(documents)

In [149]:
docs[:3]

[Document(page_content='CEO로서 두 번째 연례 주주 서한을 작성하기 위해 자리에 앉았을 때 저는 Amazon의 앞날에 대해 낙관적이고 활력을 얻었습니다. 2022년은 최근 기억에 있어 어려운 거시경제적 해 중 하나이고 우리 자체의 운영상의 어려움에도 불구하고 우리는 여전히 수요를 늘릴 방법을 찾았습니다(팬데믹 전반기에 경험한 전례 없는 성장에 더해). 우리는 장단기적으로 고객 경험을 의미 있게 개선하기 위해 대규모 사업을 혁신했습니다. 그리고 고객, 주주 및 직원을 위해 Amazon의 미래를 바꿀 수 있다고 믿는 장기 투자를 계속 유지하면서 투자 결정과 앞으로 나아갈 방법에 중요한 조정을 했습니다.  작년에 이례적인 수의 동시 도전 과제가 있었지만 현실은 유능하고 자금이 충분한 경쟁자가 많은 크고 역동적인 글로벌 시장 부문에서 운영하는 경우(아마존이 모든 비즈니스를 운영하는 조건) 조건이 오랫동안 정체되어 있는 경우는 드뭅니다.  제가 Amazon에 근무한 25년 동안 끊임없는 변화가 있었고 그 중 대부분은 우리가 스스로 시작했습니다. 내가 1997년에 Amazon에 입사했을 때 우리는 1996년에 1,500만 달러의 매출을 올렸고, 도서 전용 소매업체였으며, 제3자 시장이 없었고, 미국 내 주소로만 배송되었습니다. 오늘날 Amazon은 단위 판매의 60%를 차지하고 전 세계 거의 모든 국가의 고객에게 도달하는 활기찬 타사 판매자 에코시스템을 통해 상상할 수 있는 거의 모든 물리적 및 디지털 소매 품목을 판매합니다. 마찬가지로 클라우드에서 일련의 기술 인프라 서비스를 중심으로 비즈니스를 구축하는 것은 AWS를 추구하기 시작한 2003년에는 분명하지 않았으며 2006년 첫 서비스를 출시했을 때도 마찬가지였습니다. 거의 모든 책을 60초 안에 손끝에서 볼 수 있습니다 2007년 Kindle을 출시했을 때 가벼운 디지털 리더에 저장하고 검색할 수 있다는 것은 아직 "사물"이 아니었고 Alexa(2014년 출시)와 같이 액세스하는 데 사용할 수 

* [llmsherpa: layout info. based splitter](https://github.com/nlmatics/llmsherpa)

    - https://blog.llamaindex.ai/mastering-pdfs-extracting-sections-headings-paragraphs-and-tables-with-cutting-edge-parser-faea18870125

Most PDF to text parsers do not provide layout information. Often times, even the sentences are split with arbritrary CR/LFs making it very difficult to find paragraph boundaries. This poses various challenges in chunking and adding long running contextual information such as section header to the passages while indexing/vectorizing PDFs for LLM applications such as retrieval augmented generation (RAG).

LayoutPDFReader solves this problem by parsing PDFs along with hierarchical layout information such as:

Sections and subsections along with their levels.
Paragraphs - combines lines.
Links between sections and paragraphs.
Tables along with the section the tables are found in.
Lists and nested lists.
With LayoutPDFReader, developers can find optimal chunks of text to vectorize, and a solution for limited context window sizes of LLMs.

In [202]:
import time
from langchain.schema import Document
from llmsherpa.readers import LayoutPDFReader

In [205]:
llmsherpa_api_url = "https://readers.llmsherpa.com/api/document/developer/parseDocument?renderFormat=all"
pdf_reader = LayoutPDFReader(llmsherpa_api_url)
doc = pdf_reader.read_pdf("./rag_data_kr_pdf/2022-Amazon-Stakeholder-Letter-KR.pdf")

In [225]:
#doc.json
docs = []
for chunk_info in doc.chunks():
    sentences = " ".join(chunk_info.sentences)
    chunk = Document(
        page_content=sentences,
        metadata={
            "type": "value you want",
            "timestamp": time.time()
        }
    )
    docs.append(chunk)

In [226]:
docs[:10]

[Document(page_content='이 보고서는 다음 사람에 대해 작성되었습니다:', metadata={'type': 'value you want', 'timestamp': 1698374268.872828}),
 Document(page_content='인쇄일 2023년 01월 19일', metadata={'type': 'value you want', 'timestamp': 1698374268.8728795}),
 Document(page_content='버크만 리포트(Birkman Report)는?', metadata={'type': 'value you want', 'timestamp': 1698374268.872892}),
 Document(page_content='버크만 리포트는 당신이 버크만 검사지에 응답한 결과를 바탕으로 커리어 및 커리어와 관련한 데이 터에 대한 개괄적인 내용을 제공합니다.', metadata={'type': 'value you want', 'timestamp': 1698374268.8729014}),
 Document(page_content='버크만 메소드(Birkman Method®)는 직장에서 이루어진 철저한 경험적 연구를 거쳐 고안되었습니 다. 1950년대에 개발된 이래로 250만 명이 넘는 사람들이 버크만 진단을 받았으며, 그 동안 검사의 타 당성과 신뢰도가 입증되고 당대 심리학 이론과의 일치 여부가 지속적으로 입증되었습니다.', metadata={'type': 'value you want', 'timestamp': 1698374268.8729103}),
 Document(page_content="많은 진단들이 사회화되고 눈에 보이는 행동을 다룹니다. 버크만 메소드(Birkman Method®)는 더 나아가 무엇이 행동을 좌우하고 동기를 부여하는지 분석하고 보고합니다. 우리는 이것을'욕구' (Needs)라고 부릅니다. 욕구는 사회적 상황에서 사람들이 대인관계와 환경에 대해 갖는 기대를 뜻합 니다. 이 욕구가 개인의 행

* SpacyTextSplitter: sentence based splitter

In [99]:
# documents = loader.load()
# text_splitter = SpacyTextSplitter(
#     chunk_size=1024,
#     chunk_overlap=512,
#     separator="", # seperator to be inserted between sentences 
#     pipeline="ko_core_news_md"
# )
# docs = text_splitter.split_documents(documents)

### OpenSearch Client 생성
### 선수 조건
- 아래의 링크를 참조해서 OpenSearch Service 를 생성하고, opensearch_domain_endpoint, http_auth 를 복사해서, 아래 셀의 내용을 대체 하세요.
    - [OpenSearch 생성 가이드](https://github.com/gonsoomoon-ml/Kor-LLM-On-SageMaker/blob/main/2-Lab02-QA-with-RAG/4.rag-fsi-data-workshop/TASK-4_OpenSearch_Creation_and_Vector_Insertion.ipynb)
### 아래 셀에 다음의 정보가 입력이 되어야 합니다.
```
opensearch_domain_endpoint = "<Type Domain Endpoint>"
http_auth = (rag_user_name, rag_user_password) # Master username, Master password

```

In [155]:
from utils.opensearch import opensearch_utils

In [170]:
aws_region = 'us-east-1'

os.environ["OpenSearch_UserName"] = "<Type UserName>"
os.environ["OpenSearch_UserPassword"] = "<Type Password>"

rag_user_name = os.environ["OpenSearch_UserName"]
rag_user_password = os.environ["OpenSearch_UserPassword"]

opensearch_domain_endpoint = "<Type your domain endpoint>"

http_auth = (rag_user_name, rag_user_password) # Master username, Master password

os_client = opensearch_utils.create_aws_opensearch_client(
    aws_region,
    opensearch_domain_endpoint,
    http_auth
)

### OpenSearch 벡터 Indexer 생성
- 랭체인 오프서처 참고 자료
    - [Langchain Opensearch](https://python.langchain.com/docs/integrations/vectorstores/opensearch)

#### 오픈 서치 인덱스 유무에 따라 삭제
오픈 서치에 해당 인덱스가 존재하면, 삭제 합니다. 

In [171]:
index_name = "genai-demo-chatbot-index-v1"
index_exists = opensearch_utils.check_if_index_exists(os_client, index_name)

if index_exists:
    opensearch_utils.delete_index(os_client, index_name)
else:
    print("Index does not exist")

index_name=genai-demo-chatbot-index-v1, exists=True

Deleting index:
{'acknowledged': True}


#### 인덱스 생성

In [172]:
from langchain.vectorstores import OpenSearchVectorSearch

In [173]:
%%time
# by default langchain would create a k-NN index and the embeddings would be ingested as a k-NN vector type
vector_db = OpenSearchVectorSearch.from_documents(
    index_name=index_name,
    documents=docs,
    embedding=bedrock_embeddings,
    opensearch_url=opensearch_domain_endpoint,
    http_auth=http_auth,
    bulk_size=10000,
    timeout=60,
    is_aoss =False,
    engine="faiss",
    space_type="l2"
)

CPU times: user 117 ms, sys: 329 µs, total: 118 ms
Wall time: 3.7 s


#### 인덱스 확인

In [174]:
index_info = os_client.indices.get(index=index_name)
pprint(index_info)

{'genai-demo-chatbot-index-v1': {'aliases': {},
                                 'mappings': {'properties': {'metadata': {'properties': {'timestamp': {'type': 'float'},
                                                                                         'type': {'fields': {'keyword': {'ignore_above': 256,
                                                                                                                         'type': 'keyword'}},
                                                                                                  'type': 'text'}}},
                                                             'text': {'fields': {'keyword': {'ignore_above': 256,
                                                                                             'type': 'keyword'}},
                                                                      'type': 'text'},
                                                             'vector_field': {'dimension': 1536,
                  

### 형태소 분석기 사용하기
- 영어권의 문자들과 다르게 한글, 일본어, 중국어 등은 단순한 공백만으로는 좋은 검색 결과를 얻기 힘듭니다.
- 출시하고라는 단어가 들어간 문서를 출시하고라는 정확히 같은 단어만으로 검색할 수 있다면 답답하겠죠?
- 출시하고라는 단어를 출시, 출시하고 등 다양하게 검색하기 위해서는 형태소 분석기가 필요합니다.
- OpenSearch 에서는 2개의 한국어 analyer를 제공하고 있습니다.
    - 은전한잎 (seunjeon_tokenizer)
        - https://catalog.us-east-1.prod.workshops.aws/workshops/de4e38cb-a0d9-4ffe-a777-bf00d498fa49/ko-KR/indexing/stemming#
    - Nori (nori_tokenizer)
        - 설명: https://esbook.kimjmin.net/06-text-analysis/6.7-stemming/6.7.2-nori
    - Sample 코드에서는 "Nori"를 기반으로 진행합니다.

### [중요] Nori 사용을 위해서는 nori plugin이 설치되어 있어야 합니다.
* 자세한 사항은 10_Adv_QuestionAnswering - 02_1_KR_RAG_OpenSearch_Keyword.ipynb를 참고해 주세요

#### 인덱싱 수정하기 (형태소 분석시 사용 enablement)

In [175]:
new_index_name = f'{index_name}-with-tokenizer'
new_index_name

'genai-demo-chatbot-index-v1-with-tokenizer'

In [176]:
tokenizer = "nori" #["nori", "seunjeon"]
analyzer_config = {
    "tokenizer": tokenizer,
    "tokenizer_type": f'{tokenizer}_tokenizer',
    "char_filter": ["html_strip"],
    "filter": ["nori_number", "nori_readingform", "lowercase"],
    "decompound_mode": "mixed",
    "discard_punctuation": "true",
    #"user_dictionary_rules": ["c++", "워라밸", "먹방"],
    #"user_dictionary": "analyzers/F255700190"
}

In [177]:
# Setting for "Nori" Tokenizer (변경 없음)
index_info[index_name]["settings"]["analysis"] = {
    "tokenizer": {
        analyzer_config["tokenizer"]: {
            "type": analyzer_config["tokenizer_type"],
            "decompound_mode": analyzer_config["decompound_mode"],
            "discard_punctuation": analyzer_config["discard_punctuation"],
            #"user_dictionary_rules": analyzer_config["user_dictionary_rules"],
            #"user_dictionary": analyzer_config["user_dictionary"],
        }
    },
    "analyzer": {
        "my_analyzer": {
            "type": "custom",
            "tokenizer": analyzer_config["tokenizer"],
            "char_filter": analyzer_config["char_filter"],
            "filter": analyzer_config["filter"],
        }
    }
}


# Setting for Columns to be adapted by Tokenizer (tokenizer가 적용될 컬럼에 맞춰서 수정)
index_info[index_name]["mappings"]["properties"]["text"]["analyzer"] = "my_analyzer"
index_info[index_name]["mappings"]["properties"]["text"]["search_analyzer"] = "my_analyzer"

# Setting for vector index column (변경 없음)
index_info[index_name]["settings"]["index"] = {
    "number_of_shards": "5",
    "knn.algo_param": {"ef_search": "512"},
    "knn": "true",
    "number_of_replicas": "2"
}
del index_info[index_name]["aliases"]
new_index_info = index_info[index_name]

In [178]:
pprint(new_index_info)

{'mappings': {'properties': {'metadata': {'properties': {'timestamp': {'type': 'float'},
                                                         'type': {'fields': {'keyword': {'ignore_above': 256,
                                                                                         'type': 'keyword'}},
                                                                  'type': 'text'}}},
                             'text': {'analyzer': 'my_analyzer',
                                      'fields': {'keyword': {'ignore_above': 256,
                                                             'type': 'keyword'}},
                                      'search_analyzer': 'my_analyzer',
                                      'type': 'text'},
                             'vector_field': {'dimension': 1536,
                                              'method': {'engine': 'faiss',
                                                         'name': 'hnsw',
                                    

#### 형태소 분석기용 인덱서 생성

In [179]:
index_exists = opensearch_utils.check_if_index_exists(os_client, new_index_name)
if index_exists:
    opensearch_utils.delete_index(os_client, new_index_name)
else:
    print("Index does not exist")

index_name=genai-demo-chatbot-index-v1-with-tokenizer, exists=False
Index does not exist


In [180]:
opensearch_utils.create_index(
    os_client,
    index_name=new_index_name,
    index_body=new_index_info
)


Creating index:
{'acknowledged': True, 'shards_acknowledged': True, 'index': 'genai-demo-chatbot-index-v1-with-tokenizer'}


#### Re-indexing

In [181]:
_reindex = {
    "source": {"index": index_name},
    "dest": {"index": new_index_name}
}
print("_reindex: \n", _reindex)

_reindex: 
 {'source': {'index': 'genai-demo-chatbot-index-v1'}, 'dest': {'index': 'genai-demo-chatbot-index-v1-with-tokenizer'}}


In [182]:
os_client.reindex(_reindex)

{'took': 100,
 'timed_out': False,
 'total': 34,
 'updated': 0,
 'created': 34,
 'deleted': 0,
 'batches': 1,
 'version_conflicts': 0,
 'noops': 0,
 'retries': {'bulk': 0, 'search': 0},
 'throttled_millis': 0,
 'requests_per_second': -1.0,
 'throttled_until_millis': 0,
 'failures': []}

#### 키워드 검색 체크

In [183]:
query = "아마존"
query = opensearch_utils.get_query(
    query=query
)

print("query: ", query)
response = opensearch_utils.search_document(os_client, query, new_index_name)
opensearch_utils.parse_keyword_response(response, show_size=3)

query:  {'query': {'bool': {'must': [{'match': {'text': {'query': '아마존', 'minimum_should_match': '0%', 'operator': 'or'}}}], 'filter': []}}}
# of searched docs:  7
# of display: 3
---------------------
_id in index:  652667ce-abf7-43a8-90fa-26db89d8269c
1.475063
국제적으로 확장하고, 아직 아마존의 초기 단계인 대규모 소매 시장 부문을 추구하고, 판매자가 자신의 웹사이트에서 보다 효과적으로 판매할 수 있도록 돕기 위해 우리의 고유한 자산을 사용하는 것은 우리에게 어느 정도 자연스러운 확장입니다. 핵심 비즈니스에서 더 멀리 떨어져 있지만 고유한 기회가 있는 투자도 몇 가지 있습니다. 2003 년에는 AWS 가 전형적인 예였습니다.
{'type': 'value you want', 'timestamp': 1698373064.8914099}
---------------------
_id in index:  44331d37-25aa-4a6d-913e-cdcad98a7a44
1.406829
마찬가지로 높은 잠재력을 지닌 Amazon 의 광고 비즈니스는 브랜드에 고유한 효과를 발휘하며, 이는 계속해서 빠른 속도로 성장하는 이유 중 하나입니다. 선반 공간, 엔드 캡, 원형 배치를 판매하는 물리적 소매업체의 광고 사업과 유사하게, 당사가 후원하는 제품 및 브랜드 제품은 10 년 이상 아마존 쇼핑 경험의 필수적인 부분이었습니다. 그러나 실제 소매업체와 달리 Amazon 은 쇼핑 행동에 대해 알고 있는 것과 기계 학습 알고리즘에 대한 우리의 매우 깊은 투자를 고려할 때 이러한 후원 제품을 고객이 검색하는 것과 관련이 있도록 조정할 수 있습니다. 이는 고객에게 더 유용한 광고로 이어집니다. 결과적으로 브랜드에 더 나은 성능을 제공합니다. 이것이 우리의 광고 수익이 지난 2022 

#### 형태소 분석 결과 확인
"아마존" 확인 <BR>
#### [중요]:  doc_id: 위의 문서 인덱스 정보 확인 후 수정

In [184]:
doc_id = "1bcc2bc6-de73-486c-a13f-f2a7cf0d10f9"

In [185]:
os_client.termvectors(index=new_index_name, id=doc_id, fields='text')

{'_index': 'genai-demo-chatbot-index-v1-with-tokenizer',
 '_id': '1bcc2bc6-de73-486c-a13f-f2a7cf0d10f9',
 '_version': 1,
 'found': True,
 'took': 1,
 'term_vectors': {'text': {'field_statistics': {'sum_doc_freq': 768,
    'doc_count': 9,
    'sum_ttf': 1300},
   'terms': {'2': {'term_freq': 3,
     'tokens': [{'position': 21, 'start_offset': 38, 'end_offset': 39},
      {'position': 45, 'start_offset': 83, 'end_offset': 84},
      {'position': 54, 'start_offset': 105, 'end_offset': 106}]},
    'ᆫ': {'term_freq': 3,
     'tokens': [{'position': 5, 'start_offset': 7, 'end_offset': 8},
      {'position': 24, 'start_offset': 42, 'end_offset': 43},
      {'position': 35, 'start_offset': 58, 'end_offset': 59}]},
    '가': {'term_freq': 2,
     'tokens': [{'position': 11, 'start_offset': 20, 'end_offset': 21},
      {'position': 27, 'start_offset': 47, 'end_offset': 48}]},
    '경우': {'term_freq': 2,
     'tokens': [{'position': 43, 'start_offset': 77, 'end_offset': 79},
      {'position': 62, 

### 문서 및 임베딩 확인

In [186]:
avg_doc_length = lambda documents: sum([len(doc.page_content) for doc in documents])//len(documents)
avg_char_count_pre = avg_doc_length(documents)
avg_char_count_post = avg_doc_length(docs)
print(f'Average length among {len(documents)} documents loaded is {avg_char_count_pre} characters.')
print(f'After the split we have {len(docs)} documents more than the original {len(documents)}.')
print(f'Average length among {len(docs)} documents (after split) is {avg_char_count_post} characters.')

Average length among 10 documents loaded is 1606 characters.
After the split we have 34 documents more than the original 10.
Average length among 34 documents (after split) is 442 characters.


In [187]:
print("docs[0].page_content: \n", docs[0].page_content)

docs[0].page_content: 
 CEO 로서 두 번째 연례 주주 서한을 작성하기 위해 자리에 앉았을 때 저는 Amazon 의 앞날에 대해 낙관적이고 활력을 얻었습니다. 2022 년은 최근 기억에 있어 어려운 거시경제적 해 중 하나이고 우리 자체의 운영상의 어려움에도 불구하고 우리는 여전히 수요를 늘릴 방법을 찾았습니다(팬데믹 전반기에 경험한 전례 없는 성장에 더해). 우리는 장단기적으로 고객 경험을 의미 있게 개선하기 위해 대규모 사업을 혁신했습니다. 그리고 고객, 주주 및 직원을 위해 Amazon 의 미래를 바꿀 수 있다고 믿는 장기 투자를 계속 유지하면서 투자 결정과 앞으로 나아갈 방법에 중요한 조정을 했습니다.


In [188]:
sample_embedding = np.array(bedrock_embeddings.embed_query(docs[0].page_content))
print("Sample embedding of a document chunk: ", sample_embedding)
print("Size of the embedding: ", sample_embedding.shape)

Sample embedding of a document chunk:  [ 0.7890625  -0.53515625  0.20800781 ...  0.25976562 -0.43554688
 -0.375     ]
Size of the embedding:  (1536,)


### Hybrid search

LangChain에서 제공하는 Wrapper 클래스를 사용하여 벡터 데이터베이스 저장소를 쿼리하고 관련 문서를 반환할 수 있습니다. 뒤에서는 RetrievalQA 체인만 실행됩니다.

In [189]:
from utils.rag import OpenSearchHybridSearchRetriever

In [190]:
opensearch_hybrid_retriever = OpenSearchHybridSearchRetriever(
    os_client=os_client,
    vector_db=vector_db,
    index_name=new_index_name,
    k=5,
    fusion_algorithm="RRF", # ["RRF", "simple_weighted"]
    ensemble_weights=[.5, .5], # [lexical, semantic]
    verbose=False
)

In [191]:
query = "아마존은 Generative AI 의 전략이 무엇인가요?"
search_hybrid_result = opensearch_hybrid_retriever.get_relevant_documents(query)

print(f'question: {query}')
print(f'response: {search_hybrid_result}', len(search_hybrid_result))

lexical search query: 
{'query': {'bool': {'filter': [],
                    'must': [{'match': {'text': {'minimum_should_match': '0%',
                                                 'operator': 'or',
                                                 'query': '아마존은 Generative AI '
                                                          '의 전략이 무엇인가요?'}}}]}},
 'size': 5}
question: 아마존은 Generative AI 의 전략이 무엇인가요?
response: [Document(page_content='LLM 과 GeneraTve AI 가 고객, 주주 및 Amazon 에게 큰 문제가 될 것이라고 가정해 보겠습니다.', metadata={'type': 'value you want', 'timestamp': 1698373064.8914642, 'id': '44dca5ed-5760-42a1-9765-a3013c7b24ec'}), Document(page_content='제가 언급할 마지막 투자 영역은 Amazon 이 앞으로 수십 년 동안 모든 비즈니스 영역에서 발명할 수 있도록 설정하는 핵심이며 대규모 언어 모델("LLM") 및 생성 AI 입니다. 머신 러닝은 수십 년 동안 유망한 기술이었지만 기업에서 널리 사용되기 시작한 것은 불과 5~10 년 전입니다. 이러한 요인에 의해 주도되었습니다. Amazon 은 25 년 동안 기계 학습을 광범위하게 사용해 왔으며 개인화된 전자 상거래 권장 사항부터 주문 처리 센터 선택 경로, Prime Air 용 드론, Alexa, AWS 가 제공하는 많은 기계 학습 서비스(AWS 가 가장 광범위한 기계를 보유한 곳) 모든 클라우드 공급자의 

하이브리드(lexical + semantic) 검색이 어떻게 작동하는지 살펴보겠습니다.
1. 먼저 쿼리에 대한 임베딩 벡터를 계산하고
2. 그런 다음 이 벡터를 사용하여 벡터 스토어에서 유사성 검색을 수행한다.
3. document 풀을 기반으로 쿼리에 대한 full text 검색을 수행한다.
4. 두가지 결과를 바탕으로 re-ranking을 한다.
5. 결과를 반환한다.

In [192]:
v = bedrock_embeddings.embed_query(query)
print(v[0:10], len(v))
for r in search_hybrid_result:
    print_ww(r.page_content)
    print('----')

[0.765625, -0.59375, -0.08300781, -0.29296875, 0.86328125, -0.19140625, 0.06542969, -0.00034332275, -1.2109375, -0.578125] 1536
LLM 과 GeneraTve AI 가 고객, 주주 및 Amazon 에게 큰 문제가 될 것이라고 가정해 보겠습니다.
----
제가 언급할 마지막 투자 영역은 Amazon 이 앞으로 수십 년 동안 모든 비즈니스 영역에서 발명할 수 있도록 설정하는 핵심이며 대규모 언어 모델("LLM") 및 생성 AI
입니다. 머신 러닝은 수십 년 동안 유망한 기술이었지만 기업에서 널리 사용되기 시작한 것은 불과 5~10 년 전입니다. 이러한 요인에 의해 주도되었습니다. Amazon 은 25 년
동안 기계 학습을 광범위하게 사용해 왔으며 개인화된 전자 상거래 권장 사항부터 주문 처리 센터 선택 경로, Prime Air 용 드론, Alexa, AWS 가 제공하는 많은 기계
학습 서비스(AWS 가 가장 광범위한 기계를 보유한 곳) 모든 클라우드 공급자의 학습 기능 및 고객 기반). 보다 최근에는 GeneraTve AI 라고 하는 새로운 형태의 기계
학습이 등장하여 기계 학습 채택을 크게 가속화할 것이라고 약속합니다. 제너레이티브 AI 는 매우 큰 언어 모델(최대 천억 개의 매개변수에 대해 훈련되고 계속 증가하고 있음)을
기반으로 하며 광범위한 데이터 세트에 걸쳐 매우 일반적이고 광범위한 리콜 및 학습 기능을 갖추고 있습니다. 우리는 한동안 자체 LLM 에 대해 작업해 왔으며 이것이 거의 모든 고객
경험을 변화시키고 개선할 것이라고 믿으며 모든 소비자, 판매자, 브랜드 및 제작자 경험에 걸쳐 이러한 모델에 계속해서 상당한 투자를 할 것입니다. 또한 AWS 에서 수년간 해왔듯이
모든 규모의 회사가 제너레이티브 AI 를 활용할 수 있도록 이 기술을 민주화하고 있습니다. AWS 는 Trainium 및 InferenTa 에서 가장 가격 대비 성능이 뛰어난 기계
학습 칩을

### 메모리
모든 챗봇에는 사용 사례에 따라 맞춤화된 다양한 옵션을 갖춘 QA 체인이 필요합니다. 그러나 챗봇에서는 모델이 답변을 제공하기 위해 이를 고려할 수 있도록 항상 대화 기록을 보관해야 합니다. 이 예에서는 대화 기록을 유지하기 위해 ConversationBufferMemory와 함께 LangChain의 [ConversationalRetrievalChain](https://python.langchain.com/docs/modules/chains/popular/chat_Vector_db)을 사용합니다.

출처: https://python.langchain.com/docs/modules/chains/popular/chat_Vector_db

뒤에서 무슨 일이 일어나고 있는지 모두 보려면 'verbose'를 'True'로 설정하세요.

In [193]:
from langchain.chains.conversational_retrieval.prompts import CONDENSE_QUESTION_PROMPT

In [194]:
print (CONDENSE_QUESTION_PROMPT.template)

Given the following conversation and a follow up question, rephrase the follow up question to be a standalone question, in its original language.

Chat History:
{chat_history}
Follow Up Input: {question}
Standalone question:


### ConversationRetrievalChain에 사용되는 매개변수
* **retriever**: 우리는 `OpenSearch`를 기반으로 customization한 `OpenSearchHybridSearchRetriever`를 사용했습니다. 이것은 `OpenSearch`를 이용하여 주어진 `query`에 대한 `lexical`, `sematic` search를 기반으로 최종 후보 context 를 선택해 줍니다.

* **메모리**: 이력을 저장하는 메모리 체인

* **condense_question_prompt**: 사용자의 질문이 주어지면 이전 대화와 해당 질문을 사용하여 독립형 질문을 구성합니다.

* **chain_type**: 채팅 기록이 길고 상황에 맞지 않는 경우 이 매개변수를 사용하고 옵션은 `stuff`, `refine`, `map_reduce`, `map-rerank`입니다.

질문이 컨텍스트 범위를 벗어나면 모델은 답을 모른다고 대답합니다.

**참고**: 체인이 어떻게 작동하는지 궁금하다면 `verbose=True` 줄의 주석 처리를 해제하세요.

In [195]:
# turn verbose to true to see the full logs and documents
from langchain.chains import ConversationalRetrievalChain
from langchain.memory import ConversationBufferMemory

In [196]:
llm_text = Bedrock(
    model_id=bedrock_info.get_model_id(model_name="Claude-V2"),
    client=boto3_bedrock,
    model_kwargs={
        "max_tokens_to_sample": 1000,
        "temperature": 0,
        "top_k": 250,
        "top_p": 0.999,
        "stop_sequences": ["\n\nHuman:"]
    },
    streaming=True,
    callbacks=[StreamingStdOutCallbackHandler()],
)

In [197]:
# turn verbose to true to see the full logs and documents
from langchain.schema import BaseMessage
from langchain.chains import ConversationalRetrievalChain

In [198]:
# We are also providing a different chat history retriever which outputs the history as a Claude chat (ie including the \n\n)
_ROLE_MAP = {"human": "\n\nUser: ", "ai": "\n\nAI: "}
def _get_chat_history(chat_history):
    buffer = ""
    for dialogue_turn in chat_history:
        if isinstance(dialogue_turn, BaseMessage):
            role_prefix = _ROLE_MAP.get(dialogue_turn.type, f"{dialogue_turn.type}: ")
            buffer += f"\n{role_prefix}{dialogue_turn.content}"
        elif isinstance(dialogue_turn, tuple):
            human = "\n\nUser: " + dialogue_turn[0]
            ai = "\n\nAI: " + dialogue_turn[1]
            buffer += "\n" + "\n".join([human, ai])
        else:
            raise ValueError(
                f"Unsupported chat history format: {type(dialogue_turn)}."
                f" Full chat history: {chat_history} "
            )
    return buffer

# 이전 대화 내용을 기반으로, 신규 질문을 재구성 하는 prompt
condense_prompt_claude = PromptTemplate.from_template("""
\n\nHuman:
Given the following conversation and a follow up question,
rephrase the follow up question to be a standalone question, in its original language.

Chat History: {chat_history}
Follow Up Input: {question}

\n\nAssistant: Question:"""
)

# memory
# store previous interactions using ConversationalBufferMemory and add custom prompts to the chat.
memory_chain = chat_utils.get_memory(
    memory_type="ConversationBufferMemory",
    memory_key="chat_history",
    return_messages=True
)

opensearch_hybrid_retriever.update_search_params(
    k=5,
    minimum_should_match=0,
    filter=[],
    verbose=False
)

qa = ConversationalRetrievalChain.from_llm(
    llm=llm_text,
    retriever=opensearch_hybrid_retriever,
    memory=memory_chain,
    get_chat_history=_get_chat_history,
    verbose=True,
    condense_question_prompt=condense_prompt_claude,
    chain_type='stuff', # 'refine',
    #max_tokens_limit=300
)

# the LLMChain prompt to get the answer. the ConversationalRetrievalChange does not expose this parameter in the constructor
qa.combine_docs_chain.llm_chain.prompt = PromptTemplate.from_template("""
\n\nHuman:

{context}

<q></q> XML 태그 내의 질문에 답하려면 최대 3개의 문장을 사용하세요.

<q>{question}</q>

답변에 XML 태그를 사용하지 마세요.
답변이 context에 없으면 "죄송합니다. 문맥에서 답을 찾을 수 없어서 모르겠습니다."라고 말합니다.

\n\nAssistant:""")

채팅을 해보죠. 아래와 같은 질문을 해보세요. 
1. 무슨 내용의 편지인가요?
2. 미래 전망은 어떤가요?
3. generative ai전략에 대해서 말해 주세요

In [199]:
from utils.chat import ChatUX

In [200]:
chat = ChatUX(qa, retrievalChain=True)
chat.start_chat()

Starting chat bot


Output()

## Delete OpenSearch Index

In [None]:
print(index_name, new_index_name)

In [None]:
for name in [index_name, new_index_name]:

    index_exists = opensearch_utils.check_if_index_exists(os_client, name)
    if index_exists:
        opensearch_utils.delete_index(os_client, name)
    else:
        print("Index does not exist")

# 7.Next Action

자신만의 챗봇 시스템을 만들고 챗봇과 대화한 내역을 캡쳐해서 올려주세요. 웹 페이지 정보를 가져오기 위해서 'WebBaseLoader' 를 사용하는 것도 가능합니다.

### 요약
- 이 데모에서는 Claude LLM을 사용하여 다음 패턴으로 대화형 인터페이스를 만들었습니다.

1. 챗봇(기본 - 맥락 없음)

2. 프롬프트 템플릿(Langchain)을 이용한 챗봇

3. 페르소나를 갖춘 챗봇
4. 맥락을 갖춘 챗봇