# 한글-Claude-v2 Model: Conversational Interface - Chatbot with Claude LLM

> 이 노트북은 SageMaker Studio의 **`Data Science 3.0`** 커널과 잘 작동합니다.

> **SageMaker Notebook Instance** 를 이용해 실습을 진행하신다면, **JupyterLab이 아닌 Jupyter**에서 실행하시기 바랍니다.

이 노트북에서는 Amazon Bedrock의 기본 모델 (FM) 을 사용하여 챗봇을 구축할 것입니다.사용 사례에서는 Claude를 챗봇 구축을 위한 FM으로 사용합니다.

---
### 중요
- 이 노트북은 Anthropic 의 Claude-v2 모델 접근 가능한 분만 실행 가능합니다. 
- 접근이 안되시는 분은 노트북의 코드와 결과 만을 확인 하시면 좋겠습니다.
- 만일 실행시에는 **"과금"** 이 발생이 되는 부분 유념 해주시기 바랍니다.

## 개요

챗봇 및 가상 어시스턴트와 같은 대화형 인터페이스를 사용하여 고객의 사용자 경험을 향상시킬 수 있습니다. 챗봇은 자연어 처리 (NLP) 및 기계 학습 알고리즘을 사용하여 사용자 쿼리를 이해하고 이에 응답합니다.챗봇은 고객 서비스, 판매, 전자 상거래와 같은 다양한 애플리케이션에서 사용되어 사용자에게 빠르고 효율적인 응답을 제공할 수 있습니다.웹사이트, 소셜 미디어 플랫폼 및 메시징 앱과 같은 다양한 채널을 통해 액세스할 수 있습니다.


## Amazon Bedrock을 사용하는 챗봇

![Amazon Bedrock - Conversational Interface](./images/chatbot_bedrock.png)


## 사용 사례
- 1.**챗봇 (기본)** - FM 모델을 사용하는 제로샷 챗봇
- 2.**프롬프트를 사용하는 챗봇** - 템플릿 (Langchain) - 프롬프트 템플릿에 일부 컨텍스트가 제공된 챗봇
- 3.**페르소나가 있는 챗봇** - 정의된 역할을 가진 챗봇. 즉, 커리어 코치와 인간 상호작용
- 4.**컨텍스트 인식 챗봇** - 임베딩을 생성하여 외부 파일을 통해 컨텍스트를 전달합니다.

## Amazon Bedrock으로 챗봇을 구축하기 위한 랭체인 프레임워크
챗봇과 같은 대화형 인터페이스에서는 단기적 수준뿐만 아니라 장기적 수준에서도 이전 상호 작용을 기억하는 것이 매우 중요합니다.

LangChain은 메모리 구성 요소를 두 가지 형태로 제공합니다.먼저 LangChain은 이전 채팅 메시지를 관리하고 조작하기 위한 도우미 유틸리티를 제공합니다.모듈식으로 설계되어 사용 방식에 관계없이 유용하게 사용할 수 있습니다.둘째, LangChain은 이러한 유틸리티를 체인에 통합하는 쉬운 방법을 제공합니다.
이를 통해 다양한 유형의 추상화를 쉽게 정의하고 상호 작용할 수 있으므로 강력한 챗봇을 쉽게 구축할 수 있습니다.

## 컨텍스트를 활용한 챗봇 구축하기 - 핵심 요소

컨텍스트 인식 챗봇을 구축하는 첫 번째 프로세스는 컨텍스트에 대한**임베딩을 생성**하는 것입니다.일반적으로 임베딩 모델을 통해 실행되고 일종의 벡터 저장소에 저장될 임베딩을 생성하는 통합 프로세스가 있습니다.이 예제에서는 이를 위해 GPT-J 임베딩 모델을 사용하고 있습니다.

![Embeddings](./images/embeddings_lang.png)

두 번째 프로세스는 사용자 요청 오케스트레이션, 상호 작용, 호출 및 결과 반환입니다.

![Chatbot](./images/chatbot_lang.png)

## 아키텍처 [컨텍스트 인식 챗봇]
![4](./images/context-aware-chatbot.png)


### 설정

이 노트북의 나머지 부분을 실행하기 전에 아래 셀을 실행하여 (필요한 라이브러리가 설치되어 있는지 확인하고) Bedrock에 연결해야 합니다.


이 노트북에는 몇 가지 추가 종속성도 필요합니다.

- [FAISS](https://github.com/facebookresearch/faiss), 벡터 임베딩 저장용
- [iPyWidgets](https://ipywidgets.readthedocs.io/en/stable/), 노트북의 대화형 UI 위젯용
- [PyPDF](https://pypi.org/project/pypdf/), PDF 파일 처리용

In [1]:
%load_ext autoreload
%autoreload 2

import sys, os
module_path = ".."
sys.path.append(os.path.abspath(module_path))

In [3]:
%pip install --quiet "faiss-cpu>=1.7,<2" "ipywidgets>=7,<8" "pypdf>=3.8,<4"

[0mNote: you may need to restart the kernel to use updated packages.


# 1. Bedrock Client 생성

In [3]:
import json
import boto3
from pprint import pprint
from termcolor import colored
from utils import bedrock, print_ww
from utils.bedrock import bedrock_info

### ---- ⚠️ Un-comment and edit the below lines as needed for your AWS setup ⚠️ ----
- os.environ["AWS_DEFAULT_REGION"] = "<REGION_NAME>"  # E.g. "us-east-1"
- os.environ["AWS_PROFILE"] = "<YOUR_PROFILE>"
- os.environ["BEDROCK_ASSUME_ROLE"] = "<YOUR_ROLE_ARN>"  # E.g. "arn:aws:..."
- os.environ["BEDROCK_ENDPOINT_URL"] = "<YOUR_ENDPOINT_URL>"  # E.g. "https://..."

In [4]:
boto3_bedrock = bedrock.get_bedrock_client(
    assumed_role=os.environ.get("BEDROCK_ASSUME_ROLE", None),
    endpoint_url=os.environ.get("BEDROCK_ENDPOINT_URL", None),
    region=os.environ.get("AWS_DEFAULT_REGION", None),
)

print (colored("\n== FM lists ==", "green"))
pprint (bedrock_info.get_list_fm_models(verbose=False))

Create new client
  Using region: None
  Using profile: None
boto3 Bedrock client successfully created!
bedrock-runtime(https://bedrock-runtime.us-east-1.amazonaws.com)
[32m
== FM lists ==[0m
{'Claude-Instant-V1': 'anthropic.claude-instant-v1',
 'Claude-V1': 'anthropic.claude-v1',
 'Claude-V2': 'anthropic.claude-v2',
 'Claude-V2-1': 'anthropic.claude-v2:1',
 'Claude-V3-Haiku': 'anthropic.claude-3-haiku-20240307-v1:0',
 'Claude-V3-Sonnet': 'anthropic.claude-3-sonnet-20240229-v1:0',
 'Cohere-Embeddings-En': 'cohere.embed-english-v3',
 'Cohere-Embeddings-Multilingual': 'cohere.embed-multilingual-v3',
 'Command': 'cohere.command-text-v14',
 'Command-Light': 'cohere.command-light-text-v14',
 'Jurassic-2-Mid': 'ai21.j2-mid-v1',
 'Jurassic-2-Ultra': 'ai21.j2-ultra-v1',
 'Llama2-13b-Chat': 'meta.llama2-13b-chat-v1',
 'Titan-Embeddings-G1': 'amazon.titan-embed-text-v1',
 'Titan-Text-G1': 'amazon.titan-text-express-v1',
 'Titan-Text-G1-Light': 'amazon.titan-text-lite-v1'}


# 2. 챗봇(기본 - 컨텍스트 없음)

우리는 LangChain의 [CoversationChain](https://python.langchain.com/en/latest/modules/models/llms/integrations/bedrock.html?highlight=ConversationChain#using-in-a-conversation-chain)을 사용하여 시작합니다. 대화. 또한 메시지 저장을 위해 [ConversationBufferMemory](https://python.langchain.com/en/latest/modules/memory/types/buffer.html)를 사용합니다. 메시지 목록으로 기록을 얻을 수도 있습니다(채팅 모델에서 매우 유용합니다).

챗봇은 이전 상호작용을 기억해야 합니다. 대화 기억을 통해 우리는 그렇게 할 수 있습니다. 대화형 메모리를 구현하는 방법에는 여러 가지가 있습니다. LangChain의 맥락에서 이들은 모두 ConversationChain 위에 구축됩니다.

**참고:** 모델 출력은 비결정적입니다.

In [33]:
from utils.chat import chat_utils
from langchain_aws import ChatBedrock
from langchain.chains import ConversationChain
from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler

In [34]:
llm_text = ChatBedrock(
    model_id=bedrock_info.get_model_id(model_name="Claude-V3-Sonnet"),
    client=boto3_bedrock,
    streaming=True,
    callbacks=[StreamingStdOutCallbackHandler()],
    model_kwargs={
        "max_tokens": 1024,
        "stop_sequences": ["\n\nHuman"],
        # "temperature": 0,
        # "top_k": 350,
        # "top_p": 0.999
    }
)
llm_text

ChatBedrock(callbacks=[<langchain_core.callbacks.streaming_stdout.StreamingStdOutCallbackHandler object at 0x7fb7cadb9cf0>], client=<botocore.client.BedrockRuntime object at 0x7fb7dfa924d0>, model_id='anthropic.claude-3-sonnet-20240229-v1:0', model_kwargs={'max_tokens': 1024, 'stop_sequences': ['\n\nHuman']}, streaming=True)

In [35]:
# from utils.chat import chat_utils
# from langchain.llms.bedrock import Bedrock
# from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler

In [36]:
# # - create the Anthropic Model
# llm_text = Bedrock(
#     model_id=bedrock_info.get_model_id(model_name="Claude-V2"),
#     client=boto3_bedrock,
#     model_kwargs={
#         "max_tokens_to_sample": 512,
#         "temperature": 0,
#         "top_k": 250,
#         "top_p": 0.999,
#         "stop_sequences": ["\n\nHuman:"]
#     },
#     streaming=True,
#     callbacks=[StreamingStdOutCallbackHandler()],
# )

In [63]:
memory = chat_utils.get_memory(
    memory_type="ConversationBufferMemory",
    memory_key="history"
)

conversation = ConversationChain(
    llm=llm_text,
    verbose=True,
    memory=memory
)

In [45]:
memory.chat_memory.add_ai_message("ai")
memory.clear()
memory

ConversationBufferMemory(return_messages=True)

In [64]:
if llm_text.streaming:
    response = conversation.predict(input="안녕하세요?")
else:
    print_ww(conversation.predict(input="안녕하세요?"))



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:
[]
Human: 안녕하세요?
AI:[0m
안녕하세요! 저는 Claude라는 인공지능 대화 에이전트입니다. 한국어로 대화할 수 있어서 기쁩니다. 무엇을 도와드릴까요? 궁금한 점이 있다면 언제든 물어보세요.
[1m> Finished chain.[0m


## Reset memory

In [53]:
chat_utils.clear_memory(
    chain=conversation
)
print_ww(memory.load_memory_variables({}))

{'history': []}


# 3. 프롬프트 템플릿(Langchain)을 이용한 챗봇

LangChain은 프롬프트를 쉽게 구성하고 작업할 수 있도록 여러 클래스와 기능을 제공합니다. [PromptTemplate](https://python.langchain.com/en/latest/modules/prompts/getting_started.html) 클래스를 사용하여 f-string 템플릿에서 프롬프트를 구성하겠습니다.

#### [TIP] Prompt의 instruction의 경우 한글보다 영어로 했을 때 더 좋은 결과를 얻을 수 있습니다.

In [54]:
from langchain import PromptTemplate

In [55]:
# turn verbose to true to see the full logs and documents
conversation = ConversationChain(
    llm=llm_text,
    verbose=False,
    memory=memory
)

claude_prompt = PromptTemplate(
        input_variables=["history", 'input'],
        template="""
        \n\nHuman: Here's a friendly conversation between a user and an AI.
        The AI is talkative and provides lots of contextualized details.
        If it doesn't know, it will honestly say that it doesn't know the answer to the question.

        Current conversation:
        {history}

        \n\nUser: {input}

        \n\nAssistant:
        """
)

print("claude_prompt: \n", claude_prompt)

claude_prompt: 
 input_variables=['history', 'input'] template="\n        \n\nHuman: Here's a friendly conversation between a user and an AI.\n        The AI is talkative and provides lots of contextualized details.\n        If it doesn't know, it will honestly say that it doesn't know the answer to the question.\n\n        Current conversation:\n        {history}\n\n        \n\nUser: {input}\n\n        \n\nAssistant:\n        "


In [57]:
conversation.prompt = claude_prompt

In [58]:
chat_utils.get_tokens(
    chain=conversation,
    prompt="안녕하세요?"
)

# tokens: 8


8

In [65]:
if llm_text.streaming:
    response = conversation.predict(input="안녕하세요?")
else:
    print_ww(conversation.predict(input="안녕하세요?"))



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:
[HumanMessage(content='안녕하세요?'), AIMessage(content='안녕하세요! 저는 Claude라는 인공지능 대화 에이전트입니다. 한국어로 대화할 수 있어서 기쁩니다. 무엇을 도와드릴까요? 궁금한 점이 있다면 언제든 물어보세요.')]
Human: 안녕하세요?
AI:[0m
안녕하세요! 반갑습니다. 어떤 주제에 대해 대화를 나누고 싶으신가요? 제가 최선을 다해 답변해드리겠습니다. 만약 모르는 부분이 있다면 정직하게 말씀드리겠습니다. 언제든지 궁금한 점이 있으면 물어보세요.
[1m> Finished chain.[0m


#### (1) 새로운 질문

모델이 초기 메시지로 응답했습니다. 몇 가지 질문을 해보겠습니다.

In [66]:
if llm_text.streaming:
    response = conversation.predict(input="좋은 고기를 고르는 몇 가지 팁을 알려주세요.")
else:
    print_ww(conversation.predict(input="좋은 고기를 고르는 몇 가지 팁을 알려주세요."))



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:
[HumanMessage(content='안녕하세요?'), AIMessage(content='안녕하세요! 저는 Claude라는 인공지능 대화 에이전트입니다. 한국어로 대화할 수 있어서 기쁩니다. 무엇을 도와드릴까요? 궁금한 점이 있다면 언제든 물어보세요.'), HumanMessage(content='안녕하세요?'), AIMessage(content='안녕하세요! 반갑습니다. 어떤 주제에 대해 대화를 나누고 싶으신가요? 제가 최선을 다해 답변해드리겠습니다. 만약 모르는 부분이 있다면 정직하게 말씀드리겠습니다. 언제든지 궁금한 점이 있으면 물어보세요.')]
Human: 좋은 고기를 고르는 몇 가지 팁을 알려주세요.
AI:[0m
고기를 고를 때 다음과 같은 팁들을 참고해보세요:

1. 색깔: 고기는 밝은 붉은색을 띄어야 합니다. 너무 어두운 붉은색은 오래되었거나 상한 고기일 수 있습니다.

2. 향: 고기는 상쾌한 고기 냄새가 나야 합니다. 쵸레 냄새나 산패한 냄새가 나면 피하는 것이 좋습니다. 

3. 견고함: 고기를 손가락으로 살짝 누르면 다시 원래 모양으로 돌아와야 합니다. 너무 단단하거나 물렁물렁하면 품질이 좋지 않습니다.

4. 지방 분포: 고기에 지방이 고르게 분포되어 있어야 부드럽고 맛있습니다. 지방 무늬가 없거나 한쪽으로 몰려있으면 피하는 것이 

#### (2) 질문을 토대로 작성

모델이 이전 대화를 이해할 수 있는지 확인하기 위해 정원이라는 단어를 언급하지 않고 질문해 보겠습니다.

In [61]:
if llm_text.streaming:
    response = conversation.predict(input="좋아요. 생선에도 적용될까요?")
else:
    print_ww(conversation.predict(input="좋아요. 생선에도 적용될까요?"))

네, 생선을 고를 때에도 비슷한 원칙이 적용됩니다.

1. 신선도 - 생선 눈이 맑고 촉촉해야 하며, 살이 단단하고 탄력이 있어야 합니다. 비린내가 나면 신선하지 않은 것입니다.

2. 외관 - 생선 비늘이 광채가 나고 밝은 색을 띄어야 합니다. 탁하거나 윤기가 없으면 싱싱하지 않습니다.

3. 냄새 - 약간의 바다 내음은 있어야 하지만 강한 비린내나 암모니아 냄새가 나면 안 됩니다.

4. 상태 - 생선 아가미와 살이 단단하고 탄력있어야 합니다. 말랑말랑하거나 축 처진 상태는 피하는 게 좋습니다.

5. 유통기한 - 포장된 생선은 유통기한을 꼭 확인하세요. 최대한 빨리 소비하는 것이 좋습니다.

생선은 고기보다 더 빨리 상하기 때문에 신선도 관리가 매우 중요합니다. 위생적인 환경에서 판매되는 믿을 만한 생선을 구매하는 것이 좋겠습니다.

In [None]:
conversation.

In [26]:
print_ww (memory.load_memory_variables({}))

{'history': [HumanMessage(content='안녕하세요?'), AIMessage(content='안녕하세요! 오늘 좋은 하루 보내고 계신가요? 날씨가 꽤 화창해서
기분이 좋네요. 저는 인공지능 대화 모델이라 날씨의 영향은 받지 않지만, 사람들이 좋은 날씨에 기분이 좋아지는 것 같아 대리 만족을 느낍니다. 오늘 하루 무엇을 하셨나요? 궁금한
점이 있다면 물어보세요. 모르는 것이 있으면 솔직히 모른다고 말씀드리겠습니다.'), HumanMessage(content='좋은 고기를 고르는 몇 가지 팁을 알려주세요.'),
AIMessage(content='좋은 고기를 고르는 팁에 대해 알려드리겠습니다.\n\n1. 색깔 - 신선한 고기일수록 밝은 붉은색을 띠고 있습니다. 너무 어두운 갈색빛은
오래되었다는 신호입니다.\n\n2. 촉감 - 손가락으로 살짝 누르면 살이 잘 튕겨 나와야 합니다. 너무 꾹꾹하거나 물렁물렁하면 상한 것일 수 있습니다. \n\n3. 향기 - 고기
특유의 신선한 향이 나야 합니다. 아몬다 냄새나 썩은 냄새가 나면 안 좋습니다.\n\n4. 지방 - 지방이 단단하고 투명하며 촉촉한 편이 신선합니다. 지방이 말랐거나 딱딱하면
오래된 것입니다.\n\n5. 포장 - 진공 포장된 고기는 신선합니다. 포장지에 얼룩이 있거나 가스가 차면 오래되었을 수 있습니다.\n\n제가 도움이 되는 정보를 드렸기를 바랍니다.
다른 궁금한 점이 있으시면 물어보세요.'), HumanMessage(content='좋아요. 생선에도 적용될까요?'), AIMessage(content='네, 좋은 생선을 고르는
데에도 비슷한 원칙이 적용됩니다.\n\n1. 외관 - 신선한 생선은 빛이 나고 윤기가 있으며, 살이 탄력 있어야 합니다. 눈은 맑고 불룩해야 하고, 살이 축 처지면 안
좋습니다.\n\n2. 냄새 - 아가미 부분에서 바다 내음이 나야 합니다. 암모니아 냄새나 불쾌한 냄새가 나면 상한 것입니다.\n\n3. 지느러미/비늘 - 지느러미와 비늘이 단단히
붙어 있으면 신선합니다

#### (3) 대화를 마치며

In [18]:
if llm_text.streaming:
    response = conversation.predict(input="좋은 정보 감사합니다. 고마워요!")
else:
    print_ww(conversation.predict(input="좋은 정보 감사합니다. 고마워요!"))

 천만에요! 고기와 생선을 고르는 팁이 도움이 되었기를 바랍니다. 맛있는 요리 만드시고 즐거운 식사 되세요!

# 4. ipywidgets를 사용한 대화형 세션

다음 유틸리티 클래스를 사용하면 Claude와 보다 자연스러운 방식으로 상호 작용할 수 있습니다. 입력창에 질문을 적고 클로드의 답변을 받습니다. 그러면 대화를 계속할 수 있습니다.

In [19]:
import ipywidgets as ipw
from IPython.display import display, clear_output

class ChatUX:
    """ A chat UX using IPWidgets
    """
    def __init__(self, qa, retrievalChain = False):
        self.qa = qa
        self.name = None
        self.b=None
        self.retrievalChain = retrievalChain
        self.out = ipw.Output()

        if "ConversationChain" in str(type(self.qa)):
            self.streaming = self.qa.llm.streaming
        elif "ConversationalRetrievalChain" in str(type(self.qa)):
            self.streaming = self.qa.combine_docs_chain.llm_chain.llm.streaming

    def start_chat(self):
        print("Starting chat bot")
        display(self.out)
        self.chat(None)


    def chat(self, _):
        if self.name is None:
            prompt = ""
        else: 
            prompt = self.name.value
        if 'q' == prompt or 'quit' == prompt or 'Q' == prompt:
            print("Thank you , that was a nice chat !!")
            return
        elif len(prompt) > 0:
            with self.out:
                thinking = ipw.Label(value="Thinking...")
                display(thinking)
                try:
                    if self.retrievalChain:
                        result = self.qa.run({'question': prompt })
                    else:
                        result = self.qa.run({'input': prompt }) #, 'history':chat_history})
                except:
                    result = "No answer"
                thinking.value=""
                if self.streaming:
                    response = f"AI:{result}"
                else:
                    print_ww(f"AI:{result}")
                self.name.disabled = True
                self.b.disabled = True
                self.name = None

        if self.name is None:
            with self.out:
                self.name = ipw.Text(description="You:", placeholder='q to quit')
                self.b = ipw.Button(description="Send")
                self.b.on_click(self.chat)
                display(ipw.Box(children=(self.name, self.b)))

#### (1) 채팅을 시작해 보겠습니다. 다음 질문을 테스트할 수도 있습니다.

1. 사랑 노래 가사 한번 만들어 줄래요?
2. 또 다른 사랑 노래 만들어 주세요.
3. 첫 번째 가사는 무엇이었나요?
4. 첫 번째 가사와 같은 주제로 또 다른 가사를 만들 수 있나요?

위의 4가지를 순서대로 아래에 입력하시고, "Send" 버튼을 눌러 보세요.

In [20]:
chat = ChatUX(conversation)
chat.start_chat()

Starting chat bot


Output()

# 5.페르소나를 활용한 챗봇

AI 비서가 커리어 코치 역할을 하게 됩니다. 
- 역할극 대화에서는 채팅을 시작하기 전에 사용자 메시지를 설정해야 합니다. ConversationBufferMemory는 대화 상자를 미리 채우는 데 사용됩니다.

### (1) ConversationChain 생성 필요한 메모리 초기화, Bedrock Claude 설정

In [21]:
# llm
llm_text = Bedrock(
    model_id=bedrock_info.get_model_id(model_name="Claude-V2"),
    client=boto3_bedrock,
    model_kwargs={
        "max_tokens_to_sample": 1000,
        "temperature": 0,
        "top_k": 250,
        "top_p": 0.999,
        "stop_sequences": ["\n\nHuman:"]
    },
    streaming=True,
    callbacks=[StreamingStdOutCallbackHandler()],
)

# memory
# store previous interactions using ConversationalBufferMemory and add custom prompts to the chat.
memory = chat_utils.get_memory(
    memory_type="ConversationBufferMemory",
    memory_key="history"
)

memory.chat_memory.add_user_message("당신은 직업 코치로 활동하게 될 것입니다. 귀하의 목표는 사용자에게 직업 조언을 제공하는 것입니다")
memory.chat_memory.add_ai_message("나는 직업 코치이며 직업에 대한 조언을 제공합니다")

# conversation chain
conversation = ConversationChain(
    llm=llm_text,
    verbose=True,
    memory=memory
)
print(conversation)

# langchain prompts do not always work with all the models. This prompt is tuned for Claude
claude_prompt = PromptTemplate.from_template("""
\n\nHuman: Here's a friendly conversation between a user and an AI.
The AI is talkative and provides lots of contextualized details.
If it doesn't know, it will honestly say that it doesn't know the answer to the question.

Current conversation:
{history}

User: {input}

\n\nAssistant:
"""
)


print("claude_prompt: \n", claude_prompt)
conversation.prompt = claude_prompt

memory=ConversationBufferMemory(chat_memory=ChatMessageHistory(messages=[HumanMessage(content='당신은 직업 코치로 활동하게 될 것입니다. 귀하의 목표는 사용자에게 직업 조언을 제공하는 것입니다'), AIMessage(content='나는 직업 코치이며 직업에 대한 조언을 제공합니다')]), return_messages=True) verbose=True llm=Bedrock(client=<botocore.client.BedrockRuntime object at 0x7f22c7e6d960>, model_id='anthropic.claude-v2', model_kwargs={'max_tokens_to_sample': 1000, 'temperature': 0, 'top_k': 250, 'top_p': 0.999, 'stop_sequences': ['\n\nHuman:']}, streaming=True, callbacks=[<langchain.callbacks.streaming_stdout.StreamingStdOutCallbackHandler object at 0x7f22c52be3b0>])
claude_prompt: 
 input_variables=['history', 'input'] template="\n\n\nHuman: Here's a friendly conversation between a user and an AI.\nThe AI is talkative and provides lots of contextualized details.\nIf it doesn't know, it will honestly say that it doesn't know the answer to the question.\n\nCurrent conversation:\n{history}\n\nUser: {input}\n\n\n\nAssistant:\n"


### (2) 인공지능 관련 직업 질문

In [22]:
if llm_text.streaming:
    response = conversation.predict(input="“인공지능에 관련된 직업은 어떤 것이 있습니까?")
else:
    print_ww(conversation.predict(input="“인공지능에 관련된 직업은 어떤 것이 있습니까?"))



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3m


Human: Here's a friendly conversation between a user and an AI.
The AI is talkative and provides lots of contextualized details.
If it doesn't know, it will honestly say that it doesn't know the answer to the question.

Current conversation:
[HumanMessage(content='당신은 직업 코치로 활동하게 될 것입니다. 귀하의 목표는 사용자에게 직업 조언을 제공하는 것입니다'), AIMessage(content='나는 직업 코치이며 직업에 대한 조언을 제공합니다')]

User: “인공지능에 관련된 직업은 어떤 것이 있습니까?



Assistant:
[0m
 네, 인공지능과 관련된 직업은 다음과 같습니다:

- AI 연구원 - AI 알고리즘과 모델을 연구하고 개발합니다. 

- 데이터 사이언티스트 - 대규모 데이터를 수집, 처리, 분석하고 AI 모델을 훈련시킵니다.

- 머신러닝 엔지니어 - 머신러닝/딥러닝 시스템을 설계, 구축, 유지보수 합니다.

- AI 프로덕트 매니저 - AI 제품의 기획, 로드맵 수립, 출시 등을 총괄합니다.

- 로보틱스 엔지니어 - 인공지능이 장착된 로봇의 하드웨어와 소프트웨어를 개발합니다. 

- 자연어 처리 엔지니어 - 자연어 인식, 이해, 생산 AI 시스템을 개발합니다.

- 컴퓨터 비전 엔지니어 - 이미지/동영상 인식 AI 알고리즘과 시스템을 개발합니다.

이외에도 UX/UI 디자이너, 비즈니스 애널리스트 등 AI 생태계 전반의 직업군이 있습니다. 관심 있는 분야를 탐색하셔서 자신에 맞는 직업을 찾아보세요.
[1m> Finished chain.[0m


### (3) 인공지능 관련 직업데 대한 세부 질문

In [23]:
if llm_text.streaming:
    response = conversation.predict(input="이 직업들은 실제로 무엇을 하는가요? 재미있나요?")
else:
    print_ww(conversation.predict(input="이 직업들은 실제로 무엇을 하는가요? 재미있나요?"))



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3m


Human: Here's a friendly conversation between a user and an AI.
The AI is talkative and provides lots of contextualized details.
If it doesn't know, it will honestly say that it doesn't know the answer to the question.

Current conversation:
[HumanMessage(content='당신은 직업 코치로 활동하게 될 것입니다. 귀하의 목표는 사용자에게 직업 조언을 제공하는 것입니다'), AIMessage(content='나는 직업 코치이며 직업에 대한 조언을 제공합니다'), HumanMessage(content='“인공지능에 관련된 직업은 어떤 것이 있습니까?'), AIMessage(content=' 네, 인공지능과 관련된 직업은 다음과 같습니다:\n\n- AI 연구원 - AI 알고리즘과 모델을 연구하고 개발합니다. \n\n- 데이터 사이언티스트 - 대규모 데이터를 수집, 처리, 분석하고 AI 모델을 훈련시킵니다.\n\n- 머신러닝 엔지니어 - 머신러닝/딥러닝 시스템을 설계, 구축, 유지보수 합니다.\n\n- AI 프로덕트 매니저 - AI 제품의 기획, 로드맵 수립, 출시 등을 총괄합니다.\n\n- 로보틱스 엔지니어 - 인공지능이 장착된 로봇의 하드웨어와 소프트웨어를 개발합니다. \n\n- 자연어 처리 엔지니어 - 자연어 인식, 이해, 생산 AI 시스템을 개발합니다.\n\n- 컴퓨터 비전 엔지니어 - 이미지/동영상 인식 AI 알고리즘과 시스템을 개발합니다.\n\n이외에도 UX/UI 디자이너, 비즈니스 애널리스트 등 AI 생태계 전반의 직업군이 있습니다. 관심 있는 분야를 탐색하셔서 자신에 맞는 직업을 찾아보세요.

### Check memory

In [24]:
pprint(memory.load_memory_variables({}))

{'history': [HumanMessage(content='당신은 직업 코치로 활동하게 될 것입니다. 귀하의 목표는 사용자에게 직업 조언을 제공하는 것입니다'),
             AIMessage(content='나는 직업 코치이며 직업에 대한 조언을 제공합니다'),
             HumanMessage(content='“인공지능에 관련된 직업은 어떤 것이 있습니까?'),
             AIMessage(content=' 네, 인공지능과 관련된 직업은 다음과 같습니다:\n\n- AI 연구원 - AI 알고리즘과 모델을 연구하고 개발합니다. \n\n- 데이터 사이언티스트 - 대규모 데이터를 수집, 처리, 분석하고 AI 모델을 훈련시킵니다.\n\n- 머신러닝 엔지니어 - 머신러닝/딥러닝 시스템을 설계, 구축, 유지보수 합니다.\n\n- AI 프로덕트 매니저 - AI 제품의 기획, 로드맵 수립, 출시 등을 총괄합니다.\n\n- 로보틱스 엔지니어 - 인공지능이 장착된 로봇의 하드웨어와 소프트웨어를 개발합니다. \n\n- 자연어 처리 엔지니어 - 자연어 인식, 이해, 생산 AI 시스템을 개발합니다.\n\n- 컴퓨터 비전 엔지니어 - 이미지/동영상 인식 AI 알고리즘과 시스템을 개발합니다.\n\n이외에도 UX/UI 디자이너, 비즈니스 애널리스트 등 AI 생태계 전반의 직업군이 있습니다. 관심 있는 분야를 탐색하셔서 자신에 맞는 직업을 찾아보세요.'),
             HumanMessage(content='이 직업들은 실제로 무엇을 하는가요? 재미있나요?'),
             AIMessage(content=' 네, 인공지능 관련 직업들이 실제로 하는 일과 재미있는 점에 대해 더 자세히 설명드리겠습니다.\n\nAI 연구원은 새로운 알고리즘과 모델을 연구하고 개발하는 일을 합니다. 수학과 통계 지식이 필요하며, 최신 연구 동향을 파악하는 것도 중요합니다. 창의력을 발휘하여 새로운 아이디어를 구현할 수 있다는 점이 재미있습니다. \n

# 6. 맥락을 가진 챗봇

## 상황에 맞는 챗봇
이 사용 사례에서는 Chatbot에게 이전에 본 적이 없는 외부 코퍼스의 질문에 답변하도록 요청합니다. 이를 위해 RAG(Retrieval Augmented Generation)라는 패턴을 적용합니다. 아이디어는 말뭉치를 덩어리로 인덱싱한 다음 덩어리와 질문 사이의 의미론적 유사성을 사용하여 말뭉치의 어느 섹션이 답변을 제공하는 데 관련될 수 있는지 찾는 것입니다. 마지막으로 가장 관련성이 높은 청크가 집계되어 기록을 제공하는 것과 유사하게 ConversationChain에 컨텍스트로 전달됩니다.

**Titan Embeddings Model**을 사용하여 벡터를 생성하겠습니다. 그런 다음 이 벡터는 메모리 내 벡터 데이터 저장소를 제공하는 오픈 소스 라이브러리인 FAISS에 저장됩니다. 챗봇이 질문을 받으면 FAISS에 질문을 쿼리하고 의미상 가장 가까운 텍스트를 검색합니다. 이것이 우리의 대답이 될 것입니다.

## 6.1 2022년 아마존 주주 서한 문서로 구현 (PDF 문서)

### Amazon Titan Embedding 모델 사용 
- model_id='amazon.titan-e1t-medium'
- 이 모델은 최대 512 Token 입력이 가능합니다. 추후에 최대 토큰 사이즈가 큰 모델이 나오면 바꾸어서 테스트하시기 바랍니니다. 
- 일반적으로 한글 임베딩시에 512 토큰은 작습니다.

In [25]:
from langchain.embeddings import BedrockEmbeddings

In [26]:
bedrock_embeddings = BedrockEmbeddings(
    client=boto3_bedrock,
    model_id=bedrock_info.get_model_id(
        model_name="Titan-Embeddings-G1"
    )
)

### PyPDFDirectoryLoader 를 통한 PDF 파일 로딩
- chunk_size 는 임베딩 모델의 최대 입력 토큰이 512를 고려 해서 정했습니다. 아래 수치보다 증가시킬 경우에 Embedding Model 에 벡터 변환을 요구할 시에, 토큰이 512 보다 커서 에러가 발생합니다

In [27]:
import numpy as np
from langchain.text_splitter import CharacterTextSplitter, RecursiveCharacterTextSplitter, SpacyTextSplitter
from langchain.document_loaders import PyPDFLoader, PyPDFDirectoryLoader
from langchain.vectorstores import FAISS
from langchain.indexes.vectorstore import VectorStoreIndexWrapper

In [28]:
loader = PyPDFDirectoryLoader("./rag_data_kr_pdf/")

In [29]:
documents = loader.load()
# - in our testing Character split works better with this PDF data set
text_splitter = RecursiveCharacterTextSplitter(
    # Set a really small chunk size, just to show.
    chunk_size = 230,
    chunk_overlap  = 50,
#    separators = ['\n']
#    separators = ['\n','\n\n']    
)
docs = text_splitter.split_documents(documents)

In [30]:
%%time
vectorstore_faiss_aws = FAISS.from_documents(
    documents = docs,
    embedding = bedrock_embeddings
)


CPU times: user 262 ms, sys: 30.9 ms, total: 293 ms
Wall time: 11.7 s


In [31]:
print(f"vectorstore_faiss_aws: number of elements in the index={vectorstore_faiss_aws.index.ntotal}::")
wrapper_store_faiss = VectorStoreIndexWrapper(vectorstore=vectorstore_faiss_aws)

vectorstore_faiss_aws: number of elements in the index=92::


In [32]:
avg_doc_length = lambda documents: sum([len(doc.page_content) for doc in documents])//len(documents)
avg_char_count_pre = avg_doc_length(documents)
avg_char_count_post = avg_doc_length(docs)
print(f'Average length among {len(documents)} documents loaded is {avg_char_count_pre} characters.')
print(f'After the split we have {len(docs)} documents more than the original {len(documents)}.')
print(f'Average length among {len(docs)} documents (after split) is {avg_char_count_post} characters.')

Average length among 10 documents loaded is 1606 characters.
After the split we have 92 documents more than the original 10.
Average length among 92 documents (after split) is 216 characters.


In [33]:
print("docs[0].page_content: \n", docs[0].page_content)

docs[0].page_content: 
 CEO로서 두 번째 연례 주주 서한을 작성하기 위해 자리에 앉았을 때 저는 Amazon의 앞날에 대해 낙관적이고 활력을 얻었습니다. 2022년은 최근 기억에 있어 어려운 거시경제적 해 중 하나이고 우리 자체의 운영상의 어려움에도 불구하고 우리는 여전히 수요를 늘릴 방법을 찾았습니다(팬데믹 전반기에 경험한 전례 없는 성장에 더해). 우리는 장단기적으로 고객 경험을 의미 있게 개선하기 위해 대규모 사업을


In [34]:
sample_embedding = np.array(bedrock_embeddings.embed_query(docs[0].page_content))
print("Sample embedding of a document chunk: ", sample_embedding)
print("Size of the embedding: ", sample_embedding.shape)

Sample embedding of a document chunk:  [ 0.68359375 -0.359375    0.27148438 ...  0.203125   -0.56640625
 -0.53125   ]
Size of the embedding:  (1536,)


### Semantic search

LangChain에서 제공하는 Wrapper 클래스를 사용하여 벡터 데이터베이스 저장소를 쿼리하고 관련 문서를 반환할 수 있습니다. 뒤에서는 RetrievalQA 체인만 실행됩니다.

In [35]:
query = "아마존은 GeneraTve AI 의 전략이 무엇인가요?"
print_ww(wrapper_store_faiss.query(query, llm=llm_text))

 제가 본 문맥에서 아마존의 Generative AI 전략에 대한 구체적인 내용은 없습니다. 문맥에서 언급된 내용은 다음과 같습니다:

- 아마존은 LLM(Large Language Model)과 Generative AI가 향후 수십 년 동안 모든 비즈니스 영역에서 혁신을 이끌 수 있다고 보고 있습니다. 

- 아마존은 Generative AI에 계속 투자할 계획입니다. 

- 아마존은 AWS를 통해 모든 규모의 기업이 Generative AI를 활용할 수 있도록 지원할 계획입니다. 

- 아마존은 Trainium 및 InferenTa와 같은 기계학습 칩을 제공하여 Generative AI 모델을 효율적으로 훈련하고 실행할 수 있도록 지원할 계획입니다.

하지만 제가 본 문맥에서는 아마존의 구체적인 Generative AI 전략에 대한 언급은 없습니다. 제가 Generative AI 전략에 대한 구체적인 내용을 찾을 수 없습니다. 제가 본 문맥에서 아마존의 Generative AI 전략에 대한 구체적인 내용은 없습니다. 문맥에서 언급된 내용은 다음과 같습니다:

- 아마존은 LLM(Large Language Model)과 Generative AI가 향후 수십 년 동안 모든 비즈니스 영역에서 혁신을 이끌 수 있다고 보고 있습니다.

- 아마존은 Generative AI에 계속 투자할 계획입니다.

- 아마존은 AWS를 통해 모든 규모의 기업이 Generative AI를 활용할 수 있도록 지원할 계획입니다.

- 아마존은 Trainium 및 InferenTa와 같은 기계학습 칩을 제공하여 Generative AI 모델을 효율적으로 훈련하고 실행할 수 있도록 지원할 계획입니다.

하지만 제가 본 문맥에서는 아마존의 구체적인 Generative AI 전략에 대한 언급은 없습니다. 제가 Generative AI 전략에 대한 구체적인 내용을 찾을 수 없습니다.


의미론적 검색이 어떻게 작동하는지 살펴보겠습니다.
1. 먼저 쿼리에 대한 임베딩 벡터를 계산하고
2. 그런 다음 이 벡터를 사용하여 벡터 스토어에서 유사성 검색을 수행합니다.

In [36]:
v = bedrock_embeddings.embed_query(query)
print(v[0:10])
results = vectorstore_faiss_aws.similarity_search_by_vector(v, k=3)
for r in results:
    print_ww(r.page_content)
    print('----')

[0.66015625, -0.7734375, -0.028442383, -0.30664062, 0.99609375, -0.0115356445, 0.068359375, -0.0002975464, -1.3203125, -0.69921875]
국제적으로 확장하고, 아직 아마존의 초기 단계인 대규모 소매 시장 부문을 추구하고, 판매자가 자신의 웹사이트에서 보다 효과적으로 판매할 수 있도록 돕기 위해 우리의 고유한 자산을
사용하는 것은 우리에게 어느 정도 자연스러운 확장입니다. 핵심 비즈니스에서 더 멀리 떨어져 있지만 고유한 기회가 있는 투자도 몇 가지 있습니다. 2003년에는 AWS가 전형적인
예였습니다. 2023년에는 Amazon
----
LLM과 GeneraTve AI가 그렇게 변혁적일 것이라고 생각하기 때문에 전체 편지를 쓸 수 있지만 향후 편지로 남겨두겠습니다. LLM과 GeneraTve AI가 고객, 주주 및
Amazon에게 큰 문제가 될 것이라고 가정해 보겠습니다.  그래서 마지막으로 저는 우리가 이 도전적인 거시경제 시대에 진입했을 때보다 더 강력한 위치에서 등장할 것이라고
낙관합니다. 여기에는 몇 가지 이유가 있으며 위에서 많은
----
잠재력이 있으며 기술 및 창의적 능력을 갖춘 회사가 상대적으로 적다는 점에서 AWS와 유사합니다. 그것을 추구하는 투자 가설로.  제가 언급할 마지막 투자 영역은 Amazon이
앞으로 수십 년 동안 모든 비즈니스 영역에서 발명할 수 있도록 설정하는 핵심이며 대규모 언어 모델("LLM") 및 생성 AI입니다. 머신 러닝은 수십 년 동안 유망한 기술이었지만
기업에서 널리 사용되기 시작한 것은 불과 5~10년
----


### 메모리
모든 챗봇에는 사용 사례에 따라 맞춤화된 다양한 옵션을 갖춘 QA 체인이 필요합니다. 그러나 챗봇에서는 모델이 답변을 제공하기 위해 이를 고려할 수 있도록 항상 대화 기록을 보관해야 합니다. 이 예에서는 대화 기록을 유지하기 위해 ConversationBufferMemory와 함께 LangChain의 [ConversationalRetrievalChain](https://python.langchain.com/docs/modules/chains/popular/chat_Vector_db)을 사용합니다.

출처: https://python.langchain.com/docs/modules/chains/popular/chat_Vector_db

뒤에서 무슨 일이 일어나고 있는지 모두 보려면 'verbose'를 'True'로 설정하세요.

In [37]:
from langchain.chains.conversational_retrieval.prompts import CONDENSE_QUESTION_PROMPT

print_ww(CONDENSE_QUESTION_PROMPT.template)

Given the following conversation and a follow up question, rephrase the follow up question to be a
standalone question, in its original language.

Chat History:
{chat_history}
Follow Up Input: {question}
Standalone question:


### ConversationRetrievalChain에 사용되는 매개변수
* **retriever**: 우리는 `VectorStore`가 지원하는 `VectorStoreRetriever`를 사용했습니다. 텍스트를 검색하려면 `"similarity"` 또는 `"mmr"`라는 두 가지 검색 유형을 선택할 수 있습니다. `search_type="similarity"`는 질문 벡터와 가장 유사한 텍스트 청크 벡터를 선택하는 검색 객체에서 유사성 검색을 사용합니다.

* **메모리**: 이력을 저장하는 메모리 체인

* **dense_question_prompt**: 사용자의 질문이 주어지면 이전 대화와 해당 질문을 사용하여 독립형 질문을 구성합니다.

* **chain_type**: 채팅 기록이 길고 상황에 맞지 않는 경우 이 매개변수를 사용하고 옵션은 `stuff`, `refine`, `map_reduce`, `map-rerank`입니다.

질문이 컨텍스트 범위를 벗어나면 모델은 답을 모른다고 대답합니다.

**참고**: 체인이 어떻게 작동하는지 궁금하다면 `verbose=True` 줄의 주석 처리를 해제하세요.

In [38]:
# turn verbose to true to see the full logs and documents
from langchain.chains import ConversationalRetrievalChain
from langchain.memory import ConversationBufferMemory

memory_chain = ConversationBufferMemory(memory_key="chat_history", return_messages=True)
qa = ConversationalRetrievalChain.from_llm(
    llm=llm_text, 
    retriever=vectorstore_faiss_aws.as_retriever(), 
    memory=memory_chain,
    condense_question_prompt=CONDENSE_QUESTION_PROMPT,
    #verbose=True, 
    chain_type='stuff', # 'refine',
    #max_tokens_limit=300
)

채팅을 해보죠. 아래와 같은 질문을 해보세요. 
1. 아마존의 GeneraTve AI 전략이 무엇인가요?

In [39]:
chat = ChatUX(qa, retrievalChain=True)
chat.start_chat()

Starting chat bot


Output()

이는 이 노트북의 시작 부분에 설명된 것과 동일한 이유로 발생합니다. 기본 랭체인 프롬프트는 Claude에게 최적이 아닙니다.
다음 셀에서는 두 개의 새로운 프롬프트를 설정하겠습니다. 하나는 질문의 표현을 변경하기 위한 것이고, 다른 하나는 해당 질문의 답변을 얻기 위한 것입니다.

In [40]:
# turn verbose to true to see the full logs and documents
from langchain.chains import ConversationalRetrievalChain
from langchain.schema import BaseMessage


# We are also providing a different chat history retriever which outputs the history as a Claude chat (ie including the \n\n)
_ROLE_MAP = {"human": "\n\nHuman: ", "ai": "\n\nAssistant: "}
def _get_chat_history(chat_history):
    buffer = ""
    for dialogue_turn in chat_history:
        if isinstance(dialogue_turn, BaseMessage):
            role_prefix = _ROLE_MAP.get(dialogue_turn.type, f"{dialogue_turn.type}: ")
            buffer += f"\n{role_prefix}{dialogue_turn.content}"
        elif isinstance(dialogue_turn, tuple):
            human = "\n\nHuman: " + dialogue_turn[0]
            ai = "\n\nAssistant: " + dialogue_turn[1]
            buffer += "\n" + "\n".join([human, ai])
        else:
            raise ValueError(
                f"Unsupported chat history format: {type(dialogue_turn)}."
                f" Full chat history: {chat_history} "
            )
    return buffer

# the condense prompt for Claude
condense_prompt_claude = PromptTemplate.from_template("""{chat_history}

새로운 질문으로만 대답하세요.


Human: 이전 대화를 고려하여 질문을 어떻게 하시겠습니까?: {question}


Assistant: Question:""")

# recreate the Claude LLM with more tokens to sample - this provide longer responses but introduces some latency
cl_llm = Bedrock(model_id="anthropic.claude-v2", client=boto3_bedrock, model_kwargs={"max_tokens_to_sample": 500})
memory_chain = ConversationBufferMemory(memory_key="chat_history", return_messages=True)
qa = ConversationalRetrievalChain.from_llm(
    llm=cl_llm, 
    retriever=vectorstore_faiss_aws.as_retriever(), 
    #retriever=vectorstore_faiss_aws.as_retriever(search_type='similarity', search_kwargs={"k": 8}),
    memory=memory_chain,
    get_chat_history=_get_chat_history,
    verbose=True,
    condense_question_prompt=condense_prompt_claude, 
    chain_type='stuff', # 'refine',
    #max_tokens_limit=300
)

# the LLMChain prompt to get the answer. the ConversationalRetrievalChange does not expose this parameter in the constructor
qa.combine_docs_chain.llm_chain.prompt = PromptTemplate.from_template("""
{context}


Human: <q></q> XML 태그 내의 질문에 답하려면 최대 3개의 문장을 사용하세요.

<q>{question}</q>

답변에 XML 태그를 사용하지 마세요. 답변이 context에 없으면 "죄송합니다. 문맥에서 답을 찾을 수 없어서 모르겠습니다."라고 말합니다.

Assistant:""")

채팅을 해보죠. 아래와 같은 질문을 해보세요. 
1. 아마존의 Generative AI 의 전략이 무엇인가요?

In [41]:
chat = ChatUX(qa, retrievalChain=True)
chat.start_chat()

Starting chat bot


Output()

## 6.2. 신한은행 FAQ 데이터 세트로 구현

### 데이터 로딩 및 확인

In [42]:
import pandas as pd
pd.options.display.max_rows = 20

data_file_path = "./rag_data_kr_csv/fsi_smart_faq_ko.csv"
df = pd.read_csv(data_file_path)
df

Unnamed: 0,no,question,context,type,source
0,89,타기관OTP 이용등록방법 알려주세요,타기관에서 발급받으신 OTP가 통합OTP카드인 경우 당행에 등록하여 이용가능합니다....,인터넷뱅킹,신한은행
1,88,공동인증서와 금융인증서 차이점이 무엇인가요?,공동인증서 (구 공인인증서)는 용도에 따라 은행/신용카드/보험용 무료 인증서와 전자...,인증서,신한은행
2,87,금융인증서 해외에서 발급할 수 있나요?,"해외에서도 인증서 발급 업무는 가능합니다. 다만, 금융인증서 저장을 위한 금융결제원...",금융인증서,신한은행
3,86,클라우드에 보관 중인 인증서는 얼마나 유지 되나요?,"정상적으로 이용하실 경우 금융인증서의 유효기간은 3년이며, 1년 동안 클라우드 이용...",금융인증서,신한은행
4,85,금융인증서 발급대상은 누구인가요?,금융인증서는 은행 등의 금융회사에서 실명 확인된 고객을 대상으로 안전하게 발급되며 ...,금융인증서,신한은행
...,...,...,...,...,...
84,5,인터넷에서 이체한 거래의 상세내역 및 영수증을 인쇄하고 싶어요,"인터넷상에서 이체한 거래의 경우 인터넷상에서 제공하는 영수증은 없으며, 거래의 참고...",인터넷뱅킹,신한은행
85,4,타행으로 자동이체를 신청하고 싶은데요,인터넷뱅킹을 통한 타은행 계좌로의 자동이체(납부자 자동이체)신청이 가능하며 수수료는...,인터넷뱅킹,신한은행
86,3,공과금 자동이체 신청이 가능한가요?,"인터넷뱅킹에 로그인하신 후 ""공과금/법원 > 공과금센터"" 페이지에 가시면 ""지로자동...",인터넷뱅킹,신한은행
87,2,인터넷뱅킹 거래에 대한 책임 범위를 알고싶습니다.,기본적으로 은행이 인터넷뱅킹 사고에 대한 책임을 집니다. 해커의 침입에 의해 자금이...,인터넷뱅킹,신한은행


### 데이터 전처리
- 여기서 데이터 컬럼인 context 만을 사용 합니다.
- char_size <= 210 인 데이터만 사용합니다. (Embedding Model 최대 입력 토큰이 512 여서 제한을 둡니다.)

In [43]:
def preprocess_data(df, char_size):
    ldf = df.copy()
    ldf['Len'] = ldf['context'].apply(lambda x : len(x))
    ldf = ldf[ldf['Len'] < char_size]

    df_index = ldf.drop(['no','question','type','source','Len'], axis=1)
    # df_index.to_csv("rag_data_kr/fsi_smart_faq_ko_answer.csv", index=None, header=None)
    df_index.to_csv("rag_data_kr_csv/fsi_smart_faq_ko_answer.csv", index=None)

    return df_index

pre_df = preprocess_data(df, char_size=210)
pre_df

Unnamed: 0,context
2,"해외에서도 인증서 발급 업무는 가능합니다. 다만, 금융인증서 저장을 위한 금융결제원..."
3,"정상적으로 이용하실 경우 금융인증서의 유효기간은 3년이며, 1년 동안 클라우드 이용..."
4,금융인증서는 은행 등의 금융회사에서 실명 확인된 고객을 대상으로 안전하게 발급되며 ...
5,공동인증서와 금융인증서는 별개의 인증서로 두 가지 인증서를 모두 사용할 수 있습니다.
6,"뱅크아이디란, 블록체인기반의 은행권 공동인증서비스로 블록체인 원장을 분산하여 저장/..."
...,...
80,"인터넷뱅킹에 로그인 하신 후 ""사용자관리""를 클릭하신 후 ""고객정보"" > ""고객정보..."
82,인터넷상으로 예금/신탁을 신규가입하시려면 우선 고객님께서는인터넷뱅킹에 가입하셔야 하...
83,인터넷뱅킹(bank.shinhan.com) 송금 수수료는 우측 퀵메뉴 이용안내 수수...
86,"인터넷뱅킹에 로그인하신 후 ""공과금/법원 > 공과금센터"" 페이지에 가시면 ""지로자동..."


### 문서 로딩 및 청킹

In [44]:
from langchain.document_loaders import CSVLoader
from langchain.text_splitter import CharacterTextSplitter, RecursiveCharacterTextSplitter
from langchain.indexes.vectorstore import VectorStoreIndexWrapper
from langchain.vectorstores import FAISS

loader = CSVLoader("rag_data_kr_csv/fsi_smart_faq_ko_answer.csv", source_column="context") # --- > 219 docs with 400 chars, each row consists in a question column and an answer column
documents_fsi = loader.load() #
print(f"Number of documents={len(documents_fsi)}")


text_splitter = CharacterTextSplitter(chunk_size=210, 
                                      chunk_overlap=20,
                                      #separator=","
                                     )

docs = text_splitter.split_documents(documents_fsi)

print(f"Number of documents after split and chunking={len(docs)}")

Number of documents=43
Number of documents after split and chunking=43


### 문서 사이즈 등 통계

In [45]:

def show_chunk_stat(documents):
    doc_len_list = [len(doc.page_content) for doc in documents]
    print(pd.DataFrame(doc_len_list).describe())
    avg_doc_length = lambda documents: sum([len(doc.page_content) for doc in documents])//len(documents)
    avg_char_count_pre = avg_doc_length(documents)
    print(f'Average length among {len(documents)} documents loaded is {avg_char_count_pre} characters.')
    
    max_idx = doc_len_list.index(max(doc_len_list))
    print("\nShow document at maximum size")
    print(documents[max_idx].page_content)    
    
show_chunk_stat(docs)

                0
count   43.000000
mean   143.116279
std     52.944360
min     33.000000
25%    103.500000
50%    142.000000
75%    196.000000
max    214.000000
Average length among 43 documents loaded is 143 characters.

Show document at maximum size
context: 인터넷뱅킹 가입과 홈페이지 회원은 개별로 운영되고 있습니다. 
인터넷뱅킹만 가입을 하셨다면 별도로 홈페이지에 회원가입 후 홈페이지 로그인이 가능합니다. 
※ 영업점에서 인터넷뱅킹 가입 시 전계좌조회서비스 가입하신 고객은 홈페이지 상에서 이용자비밀번호 등록 후 이용가능합니다. 
기타 궁금하신 내용은 신한은행 고객센터 1599-8000로 문의하여 주시기 바랍니다.


### FAISS Vector Store 생성

In [46]:
%%time
from langchain.indexes.vectorstore import VectorStoreIndexWrapper
vectorstore_faiss_fsi = FAISS.from_documents(
    documents=docs,
    embedding = bedrock_embeddings
)

print(f"vectorstore_faiss_aws: number of elements in the index={vectorstore_faiss_fsi.index.ntotal}::")
wrapper_store_faiss = VectorStoreIndexWrapper(vectorstore=vectorstore_faiss_fsi)

vectorstore_faiss_aws: number of elements in the index=43::
CPU times: user 110 ms, sys: 3.33 ms, total: 113 ms
Wall time: 3.87 s


In [47]:
print("docs[0].page_content: \n", docs[0].page_content)

docs[0].page_content: 
 context: 해외에서도 인증서 발급 업무는 가능합니다. 다만, 금융인증서 저장을 위한 금융결제원 클라우드 계정 생성 및 연결이 필요한 업무로 해외연락처를 통한 ARS인증이 진행됩니다.


#### Semantic search

LangChain에서 제공하는 Wrapper 클래스를 사용하여 벡터 데이터베이스 저장소를 쿼리하고 관련 문서를 반환할 수 있습니다. 뒤에서는 RetrievalQA 체인만 실행됩니다.

In [48]:
from langchain.chains import RetrievalQA
from langchain.prompts import PromptTemplate

prompt_template = """Human: 다음 문맥을 사용하여 마지막 질문에 대한 간결한 답변을 제공하세요. 답을 모르면 모른다고 말하고 답을 만들어내려고 하지 마세요.

{context}

Question: {question}
Assistant:"""

PROMPT = PromptTemplate(
    template=prompt_template, input_variables=["context", "question"]
)

qa = RetrievalQA.from_chain_type(
    llm=cl_llm,
    chain_type="stuff",
    retriever=vectorstore_faiss_fsi.as_retriever(
        search_type="similarity", search_kwargs={"k": 5}
    ),
    return_source_documents=True,
    chain_type_kwargs={"prompt": PROMPT}
)


#query = "증권사에서 발급받은 인증서는 은행에서 사용 불가한가요?"
# query = "인터넷뱅킹 자동이체 신청 및 해지 방법을 알려주세요"
query = "신한은행 고객센터 전화 번호 알려줘?"
result = qa({"query": query})
print_ww(result['result'])

 신한은행 고객센터 전화번호는 1599-8000입니다.


In [49]:
def show_context_used(context_list):
    for idx, context in enumerate(context_list):
        print("-----------------------------------------------")                
        print(f"{idx+1}. context to be fed into FM(e.g. Claude-v2)")
        print("-----------------------------------------------")        
        print_ww(context.page_content)        
        
show_context_used(result['source_documents'])        

-----------------------------------------------
1. context to be fed into FM(e.g. Claude-v2)
-----------------------------------------------
context: 이체서비스가 되지 않는 경우 여러가지 사유가 있을수 있으니, 신한은행 고객상담센터 1599-8000번으로 문의 주시면 자세히 상담해드리겠습니다.
-----------------------------------------------
2. context to be fed into FM(e.g. Claude-v2)
-----------------------------------------------
context: 씨크리트(보안)카드는 고객님이 은행에서 신한온라인서비스(인터넷뱅킹)에 가입하신 후 받은 카드입니다.  보안카드번호가 필요한 모든 거래에  기타 궁금하신 내용은
신한은행 고객센터 1599-8000로 문의하여 주시기 바랍니다.
-----------------------------------------------
3. context to be fed into FM(e.g. Claude-v2)
-----------------------------------------------
context: 인터넷뱅킹에 로그인하시려면 신한은행 홈페이지에서 개인 → 뱅킹로그인 버튼을 클릭하시면 됩니다. 참고로 인터넷뱅킹에 로그인하시려면 우선 공동인증서 또는 금융인증서를
발급받으셔야 하며, '인증센터'에서 발급받으실 수 있습니다. 기타 궁금하신 내용은 신한은행 고객센터 1599-8000로 문의하여 주시기 바랍니다.
-----------------------------------------------
4. context to be fed into FM(e.g. Claude-v2)
-----------------------------------------------
context: 홈페이지 로그인 후 회원탈퇴를 하실 수

### 챗봇 (ConversationalRetrievalChain) 의로 질문

In [52]:
# turn verbose to true to see the full logs and documents
from langchain.chains import ConversationalRetrievalChain
from langchain.schema import BaseMessage


condense_prompt_claude = PromptTemplate.from_template("""{chat_history}

새로운 질문으로만 대답하세요.


Human: 이전 대화를 고려하여 질문을 어떻게 하시겠습니까?: {question}


Assistant: Question:""")


# recreate the Claude LLM with more tokens to sample - this provide longer responses but introduces some latency
cl_llm = Bedrock(
    model_id=bedrock_info.get_model_id(model_name="Claude-V2"),
    client=boto3_bedrock,
    model_kwargs={
        "max_tokens_to_sample": 500
    },
    streaming=True,
    callbacks=[StreamingStdOutCallbackHandler()],
)

memory_chain = ConversationBufferMemory(memory_key="chat_history", return_messages=True)
qa = ConversationalRetrievalChain.from_llm(
    llm=cl_llm, 
    retriever=vectorstore_faiss_fsi.as_retriever(), 
    #retriever=vectorstore_faiss_aws.as_retriever(search_type='similarity', search_kwargs={"k": 8}),
    memory=memory_chain,
    get_chat_history=_get_chat_history,
    verbose=True,
    condense_question_prompt=condense_prompt_claude, 
    chain_type='stuff', # 'refine',
    #max_tokens_limit=300
)

qa.combine_docs_chain.llm_chain.prompt = PromptTemplate.from_template("""
{context}


Human: <q></q> XML 태그 내의 질문에 답하려면 최대 3개의 문장을 사용하세요.

<q>{question}</q>

답변에 XML 태그를 사용하지 마세요. 답변이 context에 없으면 "죄송합니다. 문맥에서 답을 찾을 수 없어서 모르겠습니다."라고 말합니다.

Assistant:""")

Let's start another chat. Feel free to ask the following questions:

신한은행 고객센터 전화 번호 알려줘?


In [53]:
chat = ChatUX(qa, retrievalChain=True)
chat.start_chat()

Starting chat bot


Output()

# 7.Next Action

자신만의 챗봇 시스템을 만들고 챗봇과 대화한 내역을 캡쳐해서 올려주세요. 웹 페이지 정보를 가져오기 위해서 'WebBaseLoader' 를 사용하는 것도 가능합니다.

### 요약
- 이 데모에서는 Claude LLM을 사용하여 다음 패턴으로 대화형 인터페이스를 만들었습니다.

1. 챗봇(기본 - 맥락 없음)

2. 프롬프트 템플릿(Langchain)을 이용한 챗봇

3. 페르소나를 갖춘 챗봇
4. 맥락을 갖춘 챗봇