# 베드락을 이용해서 리테일 제품 설명문구 만들기

> *이 노트북은 SageMaker Studio*의 `Data Science 3.0` 커널과 잘 작동해야 합니다.

## 소개

이 노트북에서는 리테일 고객이 홈페이지에 제품에 대한 설명을 생상하는 방법을 보여드립니다. 다른 제품에 대한 설명을 예시로 포함하여 모델에 추가 컨텍스트를 제공합니다. 이로 인해 제로 샷 프롬프트를 통해 생성된 컨텐츠보다 품질과 관련성이 훨씬 더 우수합니다. 

[LangChain](https://python.langchain.com/docs/get_started/introduction.html)은 언어 모델로 구동되는 애플리케이션을 개발하기 위한 프레임워크입니다. 이 프레임워크의 핵심 측면을 통해 다양한 구성 요소를 연결하여 고급 사용 사례를 만들어 대규모 언어 모델을 보강할 수 있습니다.

이 노트북에서는 LangChain에서 제공하는 Bedrock API를 사용하겠습니다. 이 예제에서 사용된 프롬프트는 텍스트 생성 요청에 컨텍스트를 추가하기 위한 사용자 정의 LangChain 프롬프트 템플릿을 생성합니다.

**참고:** *이 노트북은 AWS 환경 내부 또는 외부에서 실행할 수 있습니다*.

#### 컨텍스트

이 노트북에서는 LangChain 프레임워크 내에서 Amazon Bedrock과 통합하여 사용는 방법과 PromptTemplate의 도움으로 텍스트를 생성하는 데 어떻게 사용될 수 있는지 살펴보겠습니다.

#### 패턴

작업, 명령어로 구성된 입력과 모델 내부에서 출력을 생성하기 위한 입력, 두가지로 구성된 Amazon Bedrock API의 LangChain 구현을 간단히 제공하겠습니다. 이 패턴의 목적은 강력한 LLM이 어떻게 당면한 작업을 쉽게 이해하고 매력적인 출력을 생성하는지 보여주기 위함입니다.

![bedrock_langchian_image](./image/bedrock_langchain.jpg)

#### 사용사례
Amazon Bedrock에서 모델의 텍스트 생성 기능을 설명하기 위해 리테일 제품의 설명 생성의 사용 사례를 살펴보겠습니다.

#### 페르소나

리테일 회사인 애니컴퍼니의 제품 담당 매니저인 "김소매"는 하루에도 수십개 이상 신규로 등록되는 제품을 홈페이지에 등록해야 합니다. 제품이 어떤 특징을 가지고 있는지는 납품 업체를 통해 전달받았지만, 이를 고객이 이해하기 쉽게 문장으로 작성하는데는 많은 시간이 소요되었습니다. 이에, 제품의 특징은 다 포함하면서 고객들이 이해하기 쉬운 대량의 제품 설명을 생성하려면 LLM의 도움이 필요합니다.

#### 구현 방법

이 사용 사례를 보여주기 위해 이 노트북에서는 고객의 이전 제품 설명을 기반으로 신규 제품 설명을 생성하는 방법을 보여드리며, Boto3 클라이언트와 함께 Amazon Bedrock API를 사용하는 Anthropic Claude 모델을 사용하겠습니다.


## Setup

이 노트북의 나머지 부분을 실행하기 전에 아래 셀을 실행하여 (필요한 라이브러리가 설치되어 있는지 확인하고) 베드락에 연결해야 합니다.

우선 사전에 설치가 필요한 패키지들을 설치하세요. 그 이후에 셋업에 필요한 라이브러리들을 설치합니다. 

In [3]:
%pip install -r ./dependencies/requirements.txt > /dev/null 2>&1

Note: you may need to restart the kernel to use updated packages.


In [4]:
import os
import boto3

my_region = os.environ["AWS_DEFAULT_REGION"]
#os.environ["AWS_DEFAULT_REGION"] = "us-east-1"  # E.g. "us-east-1"
os.environ["BEDROCK_ENDPOINT_URL"] = f"https://bedrock-runtime.{my_region}.amazonaws.com"  # E.g. "https://..."

session = boto3.Session(
    profile_name=os.environ.get("AWS_PROFILE")
) # sets the profile name to use for AWS credentials

bedrock = session.client(
    service_name='bedrock-runtime', # creates a Bedrock client
    region_name=os.environ.get("AWS_DEFAULT_REGION"),
    endpoint_url=os.environ.get("BEDROCK_ENDPOINT_URL")
) 

## 베드락 LLM 모델 호출하기

LLM에서 Bedrock 클래스의 인스턴스를 생성하는 것으로 시작하겠습니다. 여기에는 Amazon Bedrock에서 사용할 수 있는 모델의 ARN인 model_id가 필요합니다.

선택적으로 이전에 생성한 boto3 클라이언트를 전달할 수 있으며, `temperature`, `topP`, `maxTokenCount` 또는 `stopSequences`와 같은 매개 변수를 보유할 수 있는 일부 `model_kwargs`도 전달할 수 있습니다(매개 변수에 대한 자세한 내용은 Amazon Bedrock 콘솔에서 살펴볼 수 있습니다).

Amazon Bedrock에서 사용 가능한 텍스트 생성 모델 ID에 대한 [설명서](https://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/model-ids-arns.html)를 확인하세요.

모델마다 지원하는 `model_kwargs`가 다르다는 점에 유의하세요.

In [5]:
from langchain.llms.bedrock import Bedrock


model_kwargs = {'max_tokens_to_sample':1024, 
                "temperature":0,
                "top_k":250,
                "top_p":1,
                "stop_sequences": ["\n\nHuman:"]
                }

llm = Bedrock(model_id = "anthropic.claude-v2",
                    client = bedrock, 
                    model_kwargs = model_kwargs 
                    )

## LangChain 사용자 지정 프롬프트 템플릿 생성

프롬프트에 대한 템플릿을 생성하면 실행할 때마다 다른 입력 변수를 전달할 수 있습니다. 이는 데이터베이스에서 가져올 수 있는 다양한 입력 변수를 사용하여 콘텐츠를 생성해야 할 때 유용합니다. 다음 셀에서는 PromptTemplate을 만드는 방법을 살펴봅니다.

In [6]:
from langchain.prompts import PromptTemplate

# Create a prompt template that has multiple input variables
multi_var_prompt = PromptTemplate(
    input_variables = ["keyword", "productType"],
    template="""
    \n\nHuman: 
    <keywords> 뚜껑이 달린 퇴비화 가능한 컵, 아이스 커피 컵, 빨대없는 뚜껑, \
    뚜껑이 달린 생분해성 컵, 생분해 성 컵, 커피, 스무디, 음료, 이동 중, 일회용 컵, 친환경, 식물 기반</keywords>
    <command> 위에 나열된 keywords를 사용하여 일회용 컵에 대한 설명을 작성하세요.</command>
    \n\nAssistant: 편리함과 친환경이 드디어 만났습니다! \
    뚜껑이 있는 일회용 스무디 컵은 100% 식물로 만들어집니다. \
    산업 퇴비 시설로 가져가세요.이 퇴비화 가능한 차가운 컵은 모든 종류의 음료에 적합합니다.\
    재사용 가능한 빨대는 훌륭하지만 휴대하기에는 번거롭습니다. \
    스냅 오픈 뚜껑이 있는 빨대 없는 컵은 적당한 크기의 빨대 구멍이 있습니다. \
    새지 않는 텀블러는 아침에 스무디를 마실 때 사용하면 지구에도 좋을지 모르지만 \
    세척하는 데 시간이 더 걸립니다. 저희도 이해합니다, \
    저희도 여기 지구에 살고 있으니까요.\
    대신에 컴포저블 컵을 사용해보시는 건 어떨까요? \
    회사, 학교, 운전할 때 식물성 컵을 가지고 다니세요.

    \n\nHuman:
    <keywords> ${keyword}</keywords>
    <command> 위에 나열된 ${keyword}를 사용하여 ${productType}에 대한 설명을 작성하세요 $는 빼고 작성하세요.</command>
    \n\nAssistant:
    """
)

## 다시 호출
프롬프트 템플릿을 사용하여 호출하면 선별된 응답을 기대할 수 있습니다.

In [7]:
# Pass in values to the input variables

prompt = multi_var_prompt.format(keyword="편광, 디자이너, 컴포터블, 자외선 차단, 에비에이터", productType="썬글라스")

prompt_outcome = llm.predict(prompt)

print(prompt_outcome)

 편안함과 스타일이 만나다!

이 디자이너 선글라스는 최고의 편안함과 자외선 차단을 제공합니다. 편광 렌즈는 반사광을 줄여 시야를 선명하게 만들어줍니다. 

에비에이터 스타일 프레임은 클래식하면서도 세련된 느낌을 연출합니다. 얼굴 모양에 맞춰진 컴퍼터블한 디자인이 편안함을 선사합니다. 

일상 생활에서 눈을 보호하고 패션을 즐기세요. 이 선글라스는 실내외 활동 모두에 적합합니다. 자외선 차단, 선명한 시야, 스타일리시한 디자인을 한 번에 즐겨보세요!


## Streamlit 어플리케이션 수행하기

#### (1) 어플리케이션 수행을 위한 스크립트 준비하기


In [8]:
%%writefile listing_app.py
import os
from langchain.llms.bedrock import Bedrock
#from langchain import PromptTemplate
from langchain.prompts import PromptTemplate

def get_llm():
    
    model_kwargs = { #Claude
        "max_tokens_to_sample": 1024,
        "temperature": 0,
        "top_k": 250, 
        "top_p": 1,
        "stop_sequences":["\n\nHuman:"]
    }
    
    
    llm = Bedrock(
        credentials_profile_name=os.environ.get("AWS_PROFILE"), #AWS 자격 증명에 사용할 프로필 이름을 설정합니다(기본값이 아닌 경우)
        region_name=os.environ.get("AWS_DEFAULT_REGION"), #리전 이름을 설정합니다(기본값이 아닌 경우)
        endpoint_url=os.environ.get("BEDROCK_ENDPOINT_URL"), #엔드포인트 URL 설정(필요한 경우)
        model_id="anthropic.claude-v2", #파운데이션 모델 설정하기
        #model_id="anthropic.claude-instant-v1", #파운데이션 모델 설정하기
        model_kwargs=model_kwargs) #Claude의 속성을 구성합니다.
    
    return llm
    
def get_prompt(keyword, productType):
    template = """
    \n\nHuman: 
    <keywords> 뚜껑이 달린 퇴비화 가능한 컵, 아이스 커피 컵, 빨대없는 뚜껑, \
    뚜껑이 달린 생분해성 컵, 생분해 성 컵, 커피, 스무디, 음료, 이동 중, 일회용 컵, 친환경, 식물 기반</keywords>
    <command> 위에 나열된 keywords를 사용하여 일회용 컵에 대한 설명을 작성하세요.</command>
    \n\nAssistant: 편리함과 친환경이 드디어 만났습니다! \
    뚜껑이 있는 일회용 스무디 컵은 100% 식물로 만들어집니다. \
    산업 퇴비 시설로 가져가세요.이 퇴비화 가능한 차가운 컵은 모든 종류의 음료에 적합합니다.\
    재사용 가능한 빨대는 훌륭하지만 휴대하기에는 번거롭습니다. \
    스냅 오픈 뚜껑이 있는 빨대 없는 컵은 적당한 크기의 빨대 구멍이 있습니다. \
    새지 않는 텀블러는 아침에 스무디를 마실 때 사용하면 지구에도 좋을지 모르지만 \
    세척하는 데 시간이 더 걸립니다. 저희도 이해합니다, \
    저희도 여기 지구에 살고 있으니까요.\
    대신에 컴포저블 컵을 사용해보시는 건 어떨까요? \
    회사, 학교, 운전할 때 식물성 컵을 가지고 다니세요.
    
    \n\nHuman:
    <keywords> ${keyword}</keywords>
    <command> 위에 나열된 ${keyword}를 사용하여 ${productType}에 대한 설명을 작성하세요 $는 빼고 작성하세요.</command>
    \n\nAssistant:
    """
    prompt_template = PromptTemplate.from_template(template)
    prompt = prompt_template.format(keyword=keyword, productType=productType)
    return prompt

def get_text_response(keyword, productType):
    llm = get_llm()
    prompt = get_prompt(keyword, productType)
    return llm.predict(prompt)
    
    
#import quicklist_lib_kr as glib
import streamlit as st

st.set_page_config(page_title="Amazon.com 셀러를 위한 Product Listing Tool")
st.title("Amazon.com 셀러를 위한 Product Listing Tool")

keyword = st.text_input("키워드")
productType = st.text_input("프로덕트 타입")
go_button = st.button("Go", type="primary")

if go_button:

    with st.spinner("Working"):
        response_content = get_text_response(keyword=keyword, productType=productType)
        st.write(response_content)


Overwriting listing_app.py


In [9]:
%%writefile listing-setup.sh
pip install --no-cache-dir -r ./dependencies/requirements.txt

Overwriting listing-setup.sh


In [10]:
%%writefile listing-run.sh

#!/bin/sh
CURRENTDATE=`date +"%Y-%m-%d %T"`
RED='\033[0;31m'
CYAN='\033[1;36m'
GREEN='\033[1;32m'
NC='\033[0m'
S3_PATH=$1

# Run the Streamlit app and save the output to "temp.txt"
streamlit run summarize_app.py > temp.txt & 

# Read the text file using cat
echo "Getting the URL to view your Streamlit app in the browser"

# Extract the last four digits of the port number from the Network URL
sleep 5
PORT=$(grep "Network URL" temp.txt | awk -F':' '{print $NF}' | awk '{print $1}' | tail -c 5)
echo -e "${CYAN}${CURRENTDATE}: [INFO]:${NC} Port Number ${PORT}" 


# Get Studio domain information
DOMAIN_ID=$(jq .DomainId /opt/ml/metadata/resource-metadata.json || exit 1)
RESOURCE_NAME=$(jq .ResourceName /opt/ml/metadata/resource-metadata.json || exit 1)
RESOURCE_ARN=$(jq .ResourceArn /opt/ml/metadata/resource-metadata.json || exit 1)

# Remove quotes from string
DOMAIN_ID=`sed -e 's/^"//' -e 's/"$//' <<< "$DOMAIN_ID"`
RESOURCE_NAME=`sed -e 's/^"//' -e 's/"$//' <<< "$RESOURCE_NAME"`
RESOURCE_ARN=`sed -e 's/^"//' -e 's/"$//' <<< "$RESOURCE_ARN"`
RESOURCE_ARN_ARRAY=($(echo "$RESOURCE_ARN" | tr ':' '\n'))

# Get Studio domain region
REGION=$(echo "${RESOURCE_ARN_ARRAY[3]}")

# Check if it's Collaborative Space
SPACE_NAME=$(jq .SpaceName /opt/ml/metadata/resource-metadata.json || exit 1)

# if it's not a collaborative space 
if [ -z "$SPACE_NAME" ] || [ $SPACE_NAME == "null" ] ;
then
    # If it's a user-profile access
    echo -e "${CYAN}${CURRENTDATE}: [INFO]:${NC} Domain Id ${DOMAIN_ID}"
    STUDIO_URL="https://${DOMAIN_ID}.studio.${REGION}.sagemaker.aws"
    
# It is a collaborative space
else

    SEM=true
    SPACE_ID=

    # Check if Space Id was previously configured
    if [ -f /tmp/space-metadata.json ]; then
        SAVED_SPACE_ID=$(jq .SpaceId /tmp/space-metadata.json || exit 1)
        SAVED_SPACE_ID=`sed -e 's/^"//' -e 's/"$//' <<< "$SAVED_SPACE_ID"`

        if [ -z "$SAVED_SPACE_ID" ] || [ $SAVED_SPACE_ID == "null" ]; then
            ASK_INPUT=true
        else
            ASK_INPUT=false
        fi
    else
        ASK_INPUT=true
    fi

    # If Space Id is not available, ask for it
    while [[ $SPACE_ID = "" ]] ; do
        # If Space Id already configured, skeep the ask
        if [ "$ASK_INPUT" = true ]; then
            echo -e "${CYAN}${CURRENTDATE}: [INFO]:${NC} Please insert the Space Id from your url. e.g. https://${GREEN}<SPACE_ID>${NC}.studio.${REGION}.sagemaker.aws/jupyter/default/lab"
            read SPACE_ID
            SEM=true
        else
            SPACE_ID=$SAVED_SPACE_ID
        fi

        if ! [ -z "$SPACE_ID" ] && ! [ $SPACE_ID == "null" ] ;
        then
            while $SEM; do
                echo "${SPACE_ID}"
                read -p "Should this be used as Space Id? (y/N) " yn
                case $yn in
                    [Yy]* )
                        echo -e "${CYAN}${CURRENTDATE}: [INFO]:${NC} Domain Id ${DOMAIN_ID}"
                        echo -e "${CYAN}${CURRENTDATE}: [INFO]:${NC} Space Id ${SPACE_ID}"

                        jq -n --arg space_id $SPACE_ID '{"SpaceId":$space_id}' > /tmp/space-metadata.json

                        STUDIO_URL="https://${SPACE_ID}.studio.${REGION}.sagemaker.aws"

                        SEM=false
                        ;;
                    [Nn]* ) 
                        SPACE_ID=
                        ASK_INPUT=true
                        SEM=false
                        ;;
                    * ) echo "Please answer yes or no.";;
                esac
            done
        fi
    done
fi

echo -e "${CYAN}${CURRENTDATE}: [INFO]:${NC} Studio Url ${STUDIO_URL}"


link="${STUDIO_URL}/jupyter/${RESOURCE_NAME}/proxy/${PORT}/"

echo -e "${CYAN}${CURRENTDATE}: [INFO]:${NC} Starting Streamlit App"
echo -e "${CYAN}${CURRENTDATE}: [INFO]: ${GREEN}${link}${NC}"

exit 0
fi


Overwriting listing-run.sh


## (2) Streamlit 어플리케이션 실행하기

1. listing 어플리케이션 수행을 위한 디렉토리 경로로 이동합니다.
    
    cd /aws-gen-for-retail/l_lab

2. Streamlit 수행을 위한 라이브러리를 설치합니다. 

    . listing-setup.sh

3. Streamlit 실행을 위한 스크립트를 수행합니다. 

    . listing-run.sh 

4. 스크립트 수행 결과 생성되는 링크를 클릭하면 Streamlit 어플리케이션을 시작할 수 있습니다. 

5. **Amazon Seller를 위한 Product Listing Tool** 어플리케이션을 확인합니다. 

![bedrock_langchian_image](./image/streamlitoutcome.png)


6. 키워드와 프로덕트 타입에 적절한 내용을 넣고 제품에 대한 설명이 생성되는 것을 확인합니다.

 * 키워드 : 편광, 디자이너, 컴포터블, 자외선 차단, 에비에이터
 * 프로덕트 타입 : 썬글라스

![bedrock_langchian_image](./image/streamlitoutput.png)



