# Setup for Amazon Bedrock
* Container: `conda_python3` <BR>
* We recommend `python 3.10` or later. 
    - version check: !python -V

## 0. Materials
- Bedrock user guide
    - https://docs.aws.amazon.com/bedrock/latest/userguide/what-is-service.html
- Step by step vidio tutorial
    - https://www.youtube.com/watch?v=ab1mbj0acDo

## 1. role setting (adding trust relationship)

### 1.1. role check

In [1]:
from sagemaker import get_execution_role

  import scipy.sparse


sagemaker.config INFO - Not applying SDK defaults from location: /etc/xdg/sagemaker/config.yaml
sagemaker.config INFO - Not applying SDK defaults from location: /home/ec2-user/.config/sagemaker/config.yaml


In [2]:
strSageMakerRoleName = get_execution_role().rsplit('/', 1)[-1]
print (f"SageMaker Execution Role Name: {strSageMakerRoleName}")

SageMaker Execution Role Name: AmazonSageMaker-ExecutionRole-20241014T132050


### 1.2. policy
- Add the following 4 permissions to the roles confirmed in 1.1
    - AmazonBedrockFullAccess
    - AmazonOpenSearchServiceFullAccess
    - AmazonSSMFullAccess
    - AWSMarketplaceFullAccess
    - AWSCloud9SSMAccessRole

## 2. Model access

### 2.1. Amazon Bedrock Console
![nn](../imgs/model-access/1.png)

### 2.2. "Get Started"
![nn](../imgs/model-access/2.png)

### 2.3. "Model access" - "Edit"
Model Activation Window
![nn](../imgs/model-access/3.png)

### 2.3. "Save Changes"
Activate the model to be used and then save.
![nn](../imgs/model-access/4.png)

## 3. Install python SDK for bedrock

- #### **Please change to `install_complex_pdf = True` when utilizing Complex PDF**.
    - ####  [Note] install_complex_pdf will take about 30 minutes.

In [3]:
install_needed = True
install_complex_pdf = False

In [4]:
import os
import sys
import IPython
import subprocess

if install_needed:
    print("installing deps and restarting kernel")
    !{sys.executable} -m pip install -U pip
    !{sys.executable} -m pip install -U awscli
    !{sys.executable} -m pip install -U botocore
    !{sys.executable} -m pip install -U boto3
    !{sys.executable} -m pip install -U sagemaker 
    !{sys.executable} -m pip install -U langchain
    !{sys.executable} -m pip install -U langchain-community
    !{sys.executable} -m pip install -U langchain_aws
    !{sys.executable} -m pip install -U langchain-experimental
    !{sys.executable} -m pip install -U termcolor
    !{sys.executable} -m pip install -U transformers
    !{sys.executable} -m pip install -U opensearch-py
    !{sys.executable} -m pip install -U sqlalchemy #==2.0.1
    !{sys.executable} -m pip install -U anthropic
    !{sys.executable} -m pip install -U pydantic
    !{sys.executable} -m pip install -U python-dotenv
    !{sys.executable} -m pip install -U llama-parse
    !{sys.executable} -m pip install -U pymupdf
    !{sys.executable} -m pip install -U pypdf
    !{sys.executable} -m pip install -U pdf2image
    !{sys.executable} -m pip install nltk==3.8.1
    !{sys.executable} -m pip install jq    
    !{sys.executable} -m pip install requests_toolbelt
    !{sys.executable} -m pip install opencv-python
    !sudo yum install -y poppler-utils
    
    response = subprocess.run(['cat', '/etc/os-release'], capture_output=True)
    response = response.stdout.decode("utf-8")
    
    if install_complex_pdf:
        if "Amazon Linux" in response: ## SageMaker Notebook

            !sudo yum-config-manager --disable centos-extras
            !sudo rpm -Uvh https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm
            !sudo yum -y update
            !sudo yum install -y poppler-utils
            !{sys.executable} -m pip install -U lxml
            !{sys.executable} -m pip install -U kaleido
            !{sys.executable} -m pip install -U uvicorn
            !{sys.executable} -m pip install -U pandas
            !{sys.executable} -m pip install -U numexpr
            !sudo sh install_tesseract.sh
            !sudo amazon-linux-extras install libreoffice -y
            !{sys.executable} -m pip install -U "unstructured[all-docs]"
            !sudo rm -rf leptonica-1.84.1 leptonica-1.84.1.tar.gz tesseract-5.3.1 5.3.1.tar.gz

        else: ## SageMaker Studio
            !sudo apt-get install software-properties-common -y
            !sudo add-apt-repository ppa:alex-p/tesseract-ocr5 -y
            !sudo apt-get update -y
            !sudo apt-get install poppler-utils tesseract-ocr -y
            !sudo apt-get install libgl1-mesa-glx libglib2.0-0 -y
            !sudo apt install libreoffice -y
            !{sys.executable} -m pip install -U "unstructured[all-docs]==0.13.2"

    IPython.Application.instance().kernel.do_shutdown(True)

installing deps and restarting kernel
Collecting pip
  Downloading pip-24.2-py3-none-any.whl.metadata (3.6 kB)
Downloading pip-24.2-py3-none-any.whl (1.8 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.8/1.8 MB[0m [31m33.8 MB/s[0m eta [36m0:00:00[0ma [36m0:00:01[0m
[?25hInstalling collected packages: pip
  Attempting uninstall: pip
    Found existing installation: pip 23.3.2
    Uninstalling pip-23.3.2:
      Successfully uninstalled pip-23.3.2
Successfully installed pip-24.2
Collecting awscli
  Downloading awscli-1.35.6-py3-none-any.whl.metadata (11 kB)
Collecting botocore==1.35.40 (from awscli)
  Downloading botocore-1.35.40-py3-none-any.whl.metadata (5.7 kB)
Downloading awscli-1.35.6-py3-none-any.whl (4.5 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m4.5/4.5 MB[0m [31m83.5 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading botocore-1.35.40-py3-none-any.whl (12.6 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m12.6/12.6

## 4. Check setting 
Model List <BR>
![nn](../imgs/check.png)


In [1]:
%load_ext autoreload
%autoreload 2

In [2]:
import os
import sys
module_path = ".."
sys.path.append(os.path.abspath(module_path))

In [3]:
import boto3
import awscli
import botocore
import langchain
from pprint import pprint
from termcolor import colored
from utils.bedrock import bedrock_info

In [4]:
print(f"langchain version check: {langchain.__version__}")
print(f"boto3 version check: {boto3.__version__}")
print(f"botocore version check: {botocore.__version__}")
print(f"awscli version check: {awscli.__version__}")

langchain version check: 0.3.3
boto3 version check: 1.35.40
botocore version check: 1.35.40
awscli version check: 1.35.6


In [5]:
bedrock_region=boto3.Session().region_name

In [6]:
bedrock_client = boto3.client(
    service_name='bedrock-runtime',
    region_name=bedrock_region,
    endpoint_url=f"https://bedrock-runtime.{bedrock_region}.amazonaws.com"
)

In [7]:
print (colored("\n== FM lists ==", "green"))
pprint (bedrock_info.get_list_fm_models(verbose=False))

[32m
== FM lists ==[0m
{'Claude-Instant-V1': 'anthropic.claude-instant-v1',
 'Claude-V1': 'anthropic.claude-v1',
 'Claude-V2': 'anthropic.claude-v2',
 'Claude-V2-1': 'anthropic.claude-v2:1',
 'Claude-V3-5-Sonnet': 'anthropic.claude-3-5-sonnet-20240620-v1:0',
 'Claude-V3-Haiku': 'anthropic.claude-3-haiku-20240307-v1:0',
 'Claude-V3-Opus': 'anthropic.claude-3-sonnet-20240229-v1:0',
 'Claude-V3-Sonnet': 'anthropic.claude-3-sonnet-20240229-v1:0',
 'Cohere-Embeddings-En': 'cohere.embed-english-v3',
 'Cohere-Embeddings-Multilingual': 'cohere.embed-multilingual-v3',
 'Command': 'cohere.command-text-v14',
 'Command-Light': 'cohere.command-light-text-v14',
 'Jurassic-2-Mid': 'ai21.j2-mid-v1',
 'Jurassic-2-Ultra': 'ai21.j2-ultra-v1',
 'Llama2-13b-Chat': 'meta.llama2-13b-chat-v1',
 'Titan-Embeddings-G1': 'amazon.titan-embed-text-v1',
 'Titan-Text-Embeddings-V2': 'amazon.titan-embed-text-v2:0',
 'Titan-Text-G1': 'amazon.titan-text-express-v1',
 'Titan-Text-G1-Express': 'amazon.titan-text-express

## 5. Generation

In [8]:
import base64
from textwrap import dedent
from langchain_aws import ChatBedrock, BedrockLLM
from langchain.schema.output_parser import StrOutputParser
from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler
from langchain_core.prompts import ChatPromptTemplate, HumanMessagePromptTemplate, SystemMessagePromptTemplate

### Titan

In [12]:
llm = BedrockLLM(
    model_id=bedrock_info.get_model_id(model_name="Titan-Text-G1"),
    client=bedrock_client,
    model_kwargs={
        "maxTokenCount":512,
        "stopSequences":[],
        "temperature":0,
        "topP":0.9
    },
    streaming=True,
    callbacks=[StreamingStdOutCallbackHandler()]
)

In [13]:
prompt = "Please let us know Amazon Bedrock's advantages in 100 words"

In [14]:
print (colored(llm(prompt), "green"))

[32m
Amazon Bedrock is a cloud-based platform that provides developers with the tools and services they need to build, deploy, and manage applications in the cloud. It offers a wide range of services, including compute, storage, databases, machine learning, and more, and is designed to be highly scalable, reliable, and secure. Amazon Bedrock also provides a variety of developer tools and services, such as the AWS SDK, AWS Lambda, and Amazon S3, that make it easy to build and deploy applications. Additionally, Amazon Bedrock is integrated with other AWS services, such as Amazon EC2, Amazon EKS, and Amazon S3, which allows developers to build and deploy applications in a variety of environments.[0m


### Claude v3.5

In [17]:
llm = ChatBedrock(
    model_id=bedrock_info.get_model_id(model_name="Claude-V3-5-Sonnet"),
    client=bedrock_client,
    model_kwargs={
        "max_tokens": 1024,
        "temperature":0,
        "top_p":0.9,
        "stop_sequences": ["\n\nHuman"],
    },
    #streaming=True,
    callbacks=[StreamingStdOutCallbackHandler()],
)
llm

ChatBedrock(callbacks=[<langchain_core.callbacks.streaming_stdout.StreamingStdOutCallbackHandler object at 0x7f0d20e64160>], client=<botocore.client.BedrockRuntime object at 0x7f0d20e65a80>, model_id='anthropic.claude-3-5-sonnet-20240620-v1:0', model_kwargs={'top_p': 0.9, 'stop_sequences': ['\n\nHuman']}, temperature=0, max_tokens=1024)

In [18]:
prompt = ChatPromptTemplate(
    [
        ("system", "You are a master answer bot designed to answer user's questions. I'm going to ask you a question."),
        ("human", [{
            "type": "text",
            "text": dedent(
                """
                Here is the question: <question>{question}</question>
                Answer in Korean.
                If the question cannot be answered by the contexts, say "No relevant contexts". 
                """
                )
            }]
        )
    ]
)

In [19]:
chain = prompt | llm | StrOutputParser()

In [20]:
stream = chain.stream(
    {
        "question": "세이지메이커의 장점을 100단어로 알려주세요."
    }
)
response = ""
for chunk in stream:
    response += chunk
    

SageMaker의 주요 장점을 100단어로 요약하면 다음과 같습니다:

SageMaker는 AWS의 완전 관리형 기계학습 플랫폼으로, 데이터 준비부터 모델 배포까지 전체 ML 워크플로우를 간소화합니다. 내장된 알고리즘과 프레임워크를 제공하여 빠른 개발이 가능하고, 자동 하이퍼파라미터 튜닝으로 모델 성능을 최적화합니다. 유연한 노트북 환경과 분산 학습 기능으로 대규모 데이터 처리가 용이하며, 모델 모니터링 및 설명 가능성 도구로 신뢰할 수 있는 AI를 구축할 수 있습니다. 서버리스 인프라로 비용 효율적이며, 보안 및 규정 준수 기능이 내장되어 있어 엔터프라이즈급 ML 프로젝트에 적합합니다. 전반적으로 ML 개발 및 운영을 가속화하고 단순화하는 강력한 플랫폼입니다.

In [21]:
prompt = ChatPromptTemplate(
    [
        ("system", "You are a master answer bot designed to answer user's questions. I'm going to ask you a question."),
        ("human", [{
            "type": "text",
            "text": dedent(
                """
                세이지메이커의 장점을 100단어로 알려주세요.
                """
                )
            }]
        ),
        ("ai", "SageMaker는 AWS의 완전 관리형 기계학습 플랫폼으로, 데이터 준비부터 모델 배포까지 전체 ML 워크플로우를 간소화합니다. 내장된 알고리즘과 프레임워크를 제공하여 빠른 개발이 가능하고, 자동 하이퍼파라미터 튜닝으로 모델 성능을 최적화합니다. 유연한 노트북 환경과 분산 학습 기능으로 대규모 데이터 처리가 용이하며, 서버리스 추론으로 비용 효율적인 배포가 가능합니다. 또한 MLOps 도구를 통해 모델 관리와 모니터링을 지원하고, 보안 및 규정 준수 기능을 제공합니다. 통합된 개발 환경으로 생산성을 높이고 시간과 비용을 절감할 수 있어 기업의 AI/ML 프로젝트 구현을 가속화합니다."),
        ("human", [{
            "type": "text",
            "text": dedent(
                """
                {command}
                """
                )
            }]
        ),
    ]
)

In [22]:
chain = prompt | llm | StrOutputParser()
stream = chain.stream(
    {
        "command": "궁서체로 진지하게 말해줘."
    }
)
response = ""
for chunk in stream:
    response += chunk

죄송합니다만, 저는 실제로 글꼴을 변경하거나 텍스트의 시각적 스타일을 바꿀 수 있는 능력이 없습니다. 저는 텍스트 기반의 AI 어시스턴트이기 때문에 일반 텍스트로만 응답할 수 있습니다. 

하지만, 귀하의 요청의 의도를 이해하였습니다. 궁서체는 전통적이고 격식 있는 느낌을 주는 서체입니다. 그래서 좀 더 진중하고 격식 있는 톤으로 다시 한 번 세이지메이커의 장점에 대해 말씀드리겠습니다:

세이지메이커는 AWS가 제공하는 최고 수준의 기계학습 플랫폼으로서, 그 우수성과 효율성은 실로 탁월하다 할 수 있습니다. 데이터의 준비에서부터 모델의 배포에 이르기까지, 전 과정을 아우르는 통합된 환경을 제공함으로써 기업의 인공지능 역량을 한층 강화시켜 줍니다. 뿐만 아니라, 최적화된 알고리즘과 고도의 자동화 기능을 통해 모델의 성능을 극대화하며, 탁월한 확장성과 비용 효율성으로 기업의 경쟁력 제고에 크게 이바지하고 있습니다.