# ***Stable Diffusion XL 1.0 と Segment Anything Model で始める画像生成から自動マスク生成、インペインティングまで***

***Image generation, automatic mask generation and inpainting starting with Stable Diffusion XL 1.0 and Segment Anything Model - Then share it with your colleagues on the Internet and collaborate with them!***

# **前提条件（Prerequisites）**
**Amazon SageMaker Studio**

- このノートブックは、Amazon SageMaker Studio環境で実行することを意図して作成されています。（This notebook is designed to run in the Amazon SageMaker Studio environment.）

**クオータ（Quota）:**

- ml.g5.2xlarge for endpoint usage >= 1

**エンドポイント（Endpoint）:**

- このノートブックでAWS Jumpstart を使って新規にエンドポイントをデプロイすることも、既にAWS Jumpstart によってデプロイされているエンドポイントを使用することもできます。なお、エンドポイントをデプロイするには、まずSDXLモデルパッケージをサブスクライブする必要があります。（You have the option to use an existing endpoint, or You can deploy a new endpoint using AWS Jumpstart within this notebook. To deploy a new endpoint, you first need to subscribe to the SDXL Model Package.）

    
    SDXLモデルパッケージをサブスクライブするには（To subscribe to the SDXL Model Package）:
    
    1.SDXLモデルパッケージのページを開きます（Open the SDXL Model Package listing page）: https://aws.amazon.com/marketplace/pp/prodview-pe7wqwehghdtm
    
    2.AWSマーケットプレイスのリストで、"Continue to subscribe"ボタンをクリックします。（On the AWS Marketplace listing, click on the Continue to subscribe button.）
    
    3."Subscribe to this software"ページで、EULA、価格、およびサポート条件を確認します。あなたとあなたの所属組織がこれらの条件を受け入れられる場合は"Accept Offer"をクリックします。（On the Subscribe to this software page, review and click on "Accept Offer" if you and your organization accept the EULA, pricing, and support terms.）

**ノートブックの環境（Notebook Environment）:**

- **Image:**
    PyTorch 2.0.0 GPU optimized Python 3.10

- **Kernel:**
    Python3

- **Instance Type:**
    GPU instances such as ml.g4dn.xlarge (RECOMMEND)

> このノートブックはGPUを搭載しないインスタンスでも実行できますが、マスクの生成に非常に長い時間がかかるため、GPUインスタンスの使用を強く推奨します。GPUを搭載しないインスタンスタイプを使用する場合は、少なくとも8GBのメモリを持つインスタンスタイプが必要です。メモリが不足すると、カーネルがクラッシュすることがあります。
> また、GPUを使用するかCPUを使用するかによって、セグメンテーション（マスク画像の生成）の結果が異なることに注意してください。
> （This notebook can be run on an instance without a GPU, but it takes a very long time to generate masks, so using a GPU instance is strongly recommended. If you're going to use an instance type without a GPU, you'll need an instance type with at least 8GB of memory. If the memory is insufficient, the kernel will crash.
> Also, please note that the results of segmentation can vary depending on whether you use GPU or CPU.）

# **セキュリティに関する留意事項（Security Notes）**

**このノートブックでは、Gradio( https://www.gradio.app/ )の "share"オプションを使用しています。Gradioを使用する理由は、ノートブック上で簡単に画像ギャラリーを表示し、それをインターネット経由で他の人と共有できるからです。 "share"オプションを使用しない場合は、GradioはSageMaker Studio環境では動作しません。インターネット経由で共有したくない場合は、マスク画像のギャラリーと最終的なインペイント画像を表示するための独自のコードを実装することを検討してください。
In this notebook, we are using Gradio (https://www.gradio.app/) with its share option. The reason for using Gradio is that it allows us to easily display an image gallery on the notebook and share it with others over the internet. Without the 'share' option, Gradio will not work in the SageMaker Studio environment.　If you do not wish to share over the internet, consider implementing your own code for displaying the gallery of mask images and the final inpainted images.**

# **ノートブックの実行について（Execute this notebook）**

**"Run All Cells"を実行すると、このノートブックは生成されたマスク画像のギャラリーを表示したところで停止します。ギャラリーからインペイントしたい領域に一致するマスクを選択し、一時停止したセルの直下の入力エリアでEnterキーを押してノートブックの実行を再開することができます。まずは一行ずつ実行して、このノートブックが何をしているのかを確認しましょう。
If you run "Run All Cells," this notebook will stop at the gallery display of the generated mask images. Select the mask from the gallery that matches the area to be inpainted, and press the Enter key in the input area directly below the paused cell to resume the notebook's execution. Let's run it line by line at first to see what this notebook is doing.**

# **前提条件の確認（Checking Prerequisites）**

In [None]:
try:
    import torch
    print("PyTorch is installed. Please run next cell.")
except ImportError:
    print("PyTorch is not installed. Please check your docker container image. Your should use PyTorch 2.0.0 Python 3.10.")

In [None]:
if torch.cuda.is_available():
    print("PyTorch can use GPU. Please run next cell.")
else:
    print("PyTorch cannot use GPU. Please check your instance type. GPU instance is better.")

# **各種ライブラリーのインストール（Installing libraries）**

In [None]:
### General Libraries
!pip install -q --upgrade pip
!pip install -q opencv-python
!pip install -q gradio
!pip install -q ipywidgets 
### stability.ai SDK Library
!pip install -q 'stability-sdk[sagemaker] @ git+https://github.com/Stability-AI/stability-sdk.git@sagemaker'
### pip の WARNING メッセージは無視してください。
### You can ignore all WARNIG messages from pip.

In [None]:
### Meta AI's Segment Anything Model(SAM) libraries
!pip install -q git+https://github.com/facebookresearch/segment-anything.git
!pip install -q pycocotools matplotlib onnxruntime onnx
### pip の WARNING メッセージは無視してください。
### You can ignore all WARNIG messages from pip.

In [None]:
### Import libraries
import os
import io

import boto3
import sagemaker
from sagemaker import ModelPackage, get_execution_role

from stability_sdk_sagemaker.predictor import StabilityPredictor
from stability_sdk.api import GenerationRequest, GenerationResponse, TextPrompt

import PIL, cv2
from PIL import Image
from io import BytesIO
from IPython.display import display
import base64, json
from matplotlib import pyplot as plt
import numpy as np
from numpy import asarray

import gradio as gra

from segment_anything import sam_model_registry, SamAutomaticMaskGenerator, SamPredictor

 # **Stable Diffusion XLのエンドポイントのデプロイ、もしくは、既存のエンドポイントの選択（Choose existing endpoint or create new one for Stable Diffusion XL）**

In [None]:
### 既存のエンドポイントの表示
### List your existing endpoint
!aws sagemaker list-endpoints

In [None]:
### 既存のエンドポイントを使用したい場合は、コード内にエンドポイント名を設定してください。 
### 新しいエンドポイントを作成する場合は、そのままにしてください。
### If you would like to use existing endpoint, set your endpoint name in the code.
### If you are creating a new endpoint, please leave it blank.
endpoint_name = ""

In [None]:
if endpoint_name == "":
    new_endpoint = True
    ### Choose your endpoint name
    from sagemaker.utils import name_from_base
    endpoint_name=name_from_base('sdxl-1-0-jumpstart') # 必要に応じて新規にデプロイするエンドポイント名を変更します（change this as desired）
    print(f"Creating new endpoint {endpoint_name}...")
else:
    new_endpoint = False
    print(f"Using existing endpoint {endpoint_name}.")

**Amazon SageMakerとのセッションを開始**

In [None]:
sagemaker_session = sagemaker.Session()

**エンドポイントの作成（Create endpoint）　　この処理には、１０分程度時間がかかります（It will take about 10 minutes.）**

***エンドポイントを作成する場合、まず、モデルパッケージの ARN を下記のリストから取得します。そして、エンドポイントをデプロイします。（When creating an endpoint, first, obtain the ARN of the model package from the map below. Then, deploy the endpoint.）:***

In [None]:
if new_endpoint == True:
    model_package_map = {
    "us-east-1": "arn:aws:sagemaker:us-east-1:865070037744:model-package/sdxl-v1-0-2042286-300c57d4fa1e39968d711d754640b0b6",
    "us-east-2": "arn:aws:sagemaker:us-east-2:057799348421:model-package/sdxl-v1-0-2042286-300c57d4fa1e39968d711d754640b0b6",
    "us-west-2": "arn:aws:sagemaker:us-west-2:594846645681:model-package/sdxl-v1-0-2042286-300c57d4fa1e39968d711d754640b0b6",
    "ca-central-1": "arn:aws:sagemaker:ca-central-1:470592106596:model-package/sdxl-v1-0-2042286-300c57d4fa1e39968d711d754640b0b6",
    "eu-central-1": "arn:aws:sagemaker:eu-central-1:446921602837:model-package/sdxl-v1-0-2042286-300c57d4fa1e39968d711d754640b0b6",
    "eu-west-1": "arn:aws:sagemaker:eu-west-1:985815980388:model-package/sdxl-v1-0-2042286-300c57d4fa1e39968d711d754640b0b6",
    "eu-west-2": "arn:aws:sagemaker:eu-west-2:856760150666:model-package/sdxl-v1-0-2042286-300c57d4fa1e39968d711d754640b0b6",
    "ap-northeast-2": "arn:aws:sagemaker:ap-northeast-2:745090734665:model-package/sdxl-v1-0-2042286-300c57d4fa1e39968d711d754640b0b6",
    "ap-northeast-1": "arn:aws:sagemaker:ap-northeast-1:977537786026:model-package/sdxl-v1-0-2042286-300c57d4fa1e39968d711d754640b0b6",
    "ap-south-1": "arn:aws:sagemaker:ap-south-1:077584701553:model-package/sdxl-v1-0-2042286-300c57d4fa1e39968d711d754640b0b6"
    }


    region = boto3.Session().region_name
    if region not in model_package_map.keys():
        raise ("UNSUPPORTED REGION")
    package_arn = model_package_map[region]

    role_arn = get_execution_role()

    model = ModelPackage(role=role_arn,model_package_arn=package_arn,sagemaker_session=sagemaker_session,predictor_cls=StabilityPredictor)
    # Deploy the ModelPackage. This will take 5-10 minutes to run
    instance_type="ml.g5.2xlarge" # valid instance types for this model are ml.g5.2xlarge, p4d.24xlarge, and p4de.24xlarge
    deployed_model = model.deploy(initial_instance_count=1,instance_type=instance_type,endpoint_name=endpoint_name)

# **エンドポイントへの接続の準備（Prepare to connect to endpoint）**

In [None]:
### List your endpoint
!aws sagemaker list-endpoints

In [None]:
deployed_model = StabilityPredictor(endpoint_name=endpoint_name, sagemaker_session=sagemaker_session)

# **Text to image**
**このノートブックには、"PERSON（人物）"、"CAR（車）"、"CAT（猫）"の3つのオブジェクトを生成するためのプロンプトが事前に入力されています。どのオブジェクトを生成したいか選んでください。もちろん、プロンプトを調整して自分だけの素晴らしい作品を作ることもできます。提供された各プロンプトを試したら、プロンプトを変更してみましょう！**

**The notebook comes pre-populated with prompts to generate three objects: "PERSON", "CAR", and "CAT". Please choose which object you would like to generate.Of course you can tweak the prompts to create your own wonderful creations. Once you've tried each of the prompts provided,let's tinker with the prompts!**

In [None]:
### 生成したいオブジェクトの行のコメントアウトを解除してください。（Uncomment the line of the object you wish to generate.）
#object = "PERSON"
#object = "CAR"
object = "CAT"

In [None]:
### Text to Image のプロンプトの準備
### Prepare t2i prompts
if object == "PERSON":
    positive_prompt = """Photo realistic, detailed 8K, Beautiful girl in camisole dress standing on sandy beach 
    with sea in background,  long blonde hair, blue sky ,closeup character portrait, cute detailed digital art,
    japanese anime, 1girl"""
    negative_prompt = "ugly, deformed"
elif object == "CAR":
    positive_prompt = """Photo realistic, detailed 8K, Sports car parked on the beach with the sea in the background"""
    negative_prompt = "ugly, deformed"
elif object == "CAT":
    positive_prompt = """Photo realistic, detailed 8K, Clothed cat sitting on a chair"""
    negative_prompt = "ugly, deformed"
else:
    print("Please check drawing object.")

In [None]:
print(f"positive_prompt = {positive_prompt}")
print(f"negative_prompt = {negative_prompt}")

In [None]:
### Call Stable Diffusion Model
output = deployed_model.predict(GenerationRequest(text_prompts=[TextPrompt(text=positive_prompt,weight=1), 
                                                                TextPrompt(text=negative_prompt,weight=-1)],
                                                  style_preset="cinematic",
                                                  #sampler = "K_DPMPP_2S_ANCESTRAL",
                                                  sampler="K_EULER_ANCESTRAL",
                                                  steps= 50,
                                                  cfg_scale=5,
                                                  samples=1,
                                                  seed = 2574847677, #3995923165,
                                                  width=1024,
                                                  height=1024.
                                                 ))

In [None]:
### ヘルパー関数：生成された画像を表示します。
### Helper function to display generated image
def decode_and_show(model_response: GenerationResponse) :
    """
    Decodes and displays an image from SDXL output

    Args:
        model_response (GenerationResponse): The response object from the deployed SDXL model.

    Returns:
        PNG Image
    """
    image = model_response.artifacts[0].base64
    image_data = base64.b64decode(image.encode())
    image = Image.open(io.BytesIO(image_data))
    print(image.format)
    display(image)
    return(image)

source_image = decode_and_show(output)
source_image.save(f"{object}-generated.png")

# **マスク画像の生成（Generate Masks）**

**自動マスク生成のためにMeta AIのSegment Anything Model（SAM）を設定します。（Setup Meta AI's Segment Anything Model(SAM) to automatically generate masks）**

Segment Anything Modelに関する詳細は、以下のリンクを参照してください。（For more information on the Segment Anything Model, please refer to the following link.）

https://github.com/facebookresearch/segment-anything/

In [None]:
### Segment Anything Model のチェックポイントファイルをダウンロードします
### Downloading Segment Anything Model Checkpoint file
checkpoint_file_name = "sam_vit_h_4b8939.pth"
if not os.path.exists(checkpoint_file_name):
    print(f"Download Segment Anything Checkpoint {checkpoint_file_name}")
    !wget https://dl.fbaipublicfiles.com/segment_anything/sam_vit_h_4b8939.pth
else:
    print(f"Segment Anything Checkpoint {checkpoint_file_name} already exists.")

In [None]:
### Segment Anything Model で使用できるように Text to Image で生成された画像をNumPy配列に変換します。
### convert the image into an array in order to use it later with the Segment Anything Model
segmentation_image = asarray(source_image)

In [None]:
### Segment Anything Model の初期化
### Initialize Segment Anything Model

sam_checkpoint = "sam_vit_h_4b8939.pth"
model_type = "vit_h"

### CUDA が利用できない場合は、CPUを使用します。
### If CUDA is not available in thid environment, cpu will be used.
device = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')
print(device)

sam = sam_model_registry[model_type](checkpoint=sam_checkpoint)
sam.to(device=device)

mask_generator = SamAutomaticMaskGenerator(
    model=sam,
    points_per_side=32,
    pred_iou_thresh=0.99,
    stability_score_thresh=0.90,
    crop_n_layers=1,
    crop_n_points_downscale_factor=2,
    min_mask_region_area=100,
)


In [None]:
### Segment Anything Model を実行
### Run Segment Anything Model
masks = mask_generator.generate(segmentation_image)

### 生成されたマスク画像の数とマスク画像に付与された Key を表示します。
### Print number of masks generated and the keys attached to each of them
print(f"Number of masks generated: {len(masks)}")
print(masks[0].keys())

In [None]:
### ヘルパー関数：オリジナル画像の上に色分けされたマスク画像を重ねて表示します。
###　Helper function to display color-coded masks generated over the original imag
def show_anns(anns):
    if len(anns) == 0:
        return
    sorted_anns = sorted(anns, key=(lambda x: x['area']), reverse=True)
    ax = plt.gca()
    ax.set_autoscale_on(False)

    img = np.ones((sorted_anns[0]['segmentation'].shape[0], sorted_anns[0]['segmentation'].shape[1], 4))
    img[:,:,3] = 0
    for ann in sorted_anns:
        m = ann['segmentation']
        color_mask = np.concatenate([np.random.random(3), [0.35]])
        img[m] = color_mask
    ax.imshow(img)

In [None]:
plt.figure(figsize=(20,20))
plt.imshow(segmentation_image)
show_anns(masks)
plt.axis('off')
plt.show() 

# **ギャラリー形式で生成された全てのマスクを表示（Display all masks in gallery format）**

*以下に表示されるギャラリーから、インペインティングに使用したいマスク画像をクリックして選択してください。マスクを選択したら、マウスカーソルを次のセルに移動し、セルを実行してください。シフト＋クリックではカーソルは自動的に移動しません。（Select the mask image you wish to use for inpainting by clicking on it from the gallery displayed below. Once you have selected on a mask, move the mouse cursor to the next cell and run the cell(Shift-clicking does not automatically move the cursor).）*

In [None]:
### ヘルパー関数：全てのマスク画像をギャラリー形式で表示します。
### Helper function to display all masks in gallery format
mask_images = []

for i in range(len(masks)):
    segmentation_mask=masks[i]['segmentation']
    mask_images.append((PIL.Image.fromarray(segmentation_mask), str(i)))

def process_image(selected_image: gra.SelectData):
    global mask_index
    mask_index = selected_image.index
    

with gra.Blocks() as allmasks:
    gra.Gallery(mask_images,columns=[4], rows=[len(masks)/4+1], object_fit="contain", height="auto").select(process_image)
    
allmasks.launch(share=True)

**上記の公開URLを同僚などに共有すると、彼らもこのマスク画像のギャラリーを閲覧し、マスクを選択することができます。（If you share the public URL above with your colleagues, they too can view this gallery of mask images and select a mask.）**

**インペインティングに使用するマスクIDを確認してください。（Confirm mask id you want to use for inpainting）**

*もし実行がすぐ下のセルで停止した場合、それはノートブックがあなたがマスク画像を選択するのを待っていることを意味します。上のギャラリーからマスク画像を選択し、入力を待っている次のセルの直下のエリアでエンターを押してください。その後、実行が再開され、選択したマスク画像を使用してインペインティングが開始されます。（If your execution stops at the cell immediately below, it means that the notebook is waiting for you to select a mask image. Select the mask image from the gallery above and press enter in the area directly below the next cell that is waiting for input. The execution will then resume and the inpainting will be performed using the mask image you selected.）*

In [None]:
### 選択されたマスクIDを表示します。
### Display mask id you selected.
while 'mask_index' not in globals():
    input("Please select a mask from the gallery above. Once you have chosen, press enter here to continue.")

print(f"Mask ID you selected is {mask_index}")

In [None]:
segmentation_mask=masks[mask_index]['segmentation']
mask_image=PIL.Image.fromarray(segmentation_mask)
display(mask_image)
mask_image.save(f"{object}-mask-{mask_index}.png")

# **インペイント（Inpaint）**

In [None]:
### あらかじめ準備されたマスクを使用したい場合は、以下のコードを使用できます。 
### その場合、以下の三重引用符を削除してファイル名を適切に変更してください。
### If you prefer to use a pre-prepared mask, you can use the code below. 
### In that case, remove the triple quotation marks below.
""" 
rgba_image = Image.open('CAT-mask-7-edited.png')
if rgba_image is None:
    print('Failed to load image. Please check the file name and path.')
else:
    print('Mask image successfully loaded.')
    print(rgba_image.format)
mask_image = rgba_image.convert('RGB')
print(mask_image.format)
"""

In [None]:
### Stable Diffusion の インペイントのプロンプトの設定
### Setup Stable Diffusion Inpaint prompts
if object == "PERSON":
    positive_prompt = """Photo realistic, detailed 8K, Cherry blossom petal pattern dress"""
    negative_prompt = "ugly, deformed"
elif object == "CAR":
    positive_prompt = """Photo realistic, detailed 8K, yellow Sports car"""
    negative_prompt = "ugly, deformed"    
else:
    positive_prompt = """Photo realistic, detailed 8K, Cat in sailor suit"""
    negative_prompt = "ugly, deformed"

In [None]:
print(f"positive_prompt = {positive_prompt}")
print(f"negative_prompt = {negative_prompt}")

In [None]:
### ヘルパー関数： 画像イメージを Base64 にエンコードします。
### Helper function: Encode the image in Base64
def encode_img(img):
    encoded_img = base64.b64encode(img).decode()
    return encoded_img

### ヘルパー関数： PNGイメージを JPEGイメージへ変換します。
### Helper function: Convert PNG image to JPEG image
def convert_image_to_jpeg(image):
    bytestream = io.BytesIO()
    image.save(bytestream, format='JPEG')
    byte_data = bytestream.getvalue()
    return byte_data

### Stable Diffusion XL 1.0 のエンドポイントを呼び出します。
### Call Stable Diffusion XL 1.0 Model
inpaint_output = deployed_model.predict(GenerationRequest(text_prompts=[TextPrompt(text=positive_prompt,weight=1),
                                                                TextPrompt(text=negative_prompt,weight=-1)],
                                                  init_image = encode_img(convert_image_to_jpeg(source_image)),
                                                  mask_source = "MASK_IMAGE_WHITE",
                                                  mask_image = encode_img(convert_image_to_jpeg(mask_image)),
                                                  cfg_scale =9,
                                                  clip_guidance_preset = "NONE",
                                                  sampler = "K_EULER_ANCESTRAL",
                                                  samples = 1,
                                                  seed = 44332211, #3 (for CAT)
                                                  steps = 50,
                                                  style_preset = "cinematic"
                                                 ))

### インペイントされた画像を表示します。
### Display the inpainted image
inpainted_image = decode_and_show(inpaint_output)

In [None]:
inpainted_image.save(f"{object}-inpainted.png")

In [None]:
with gra.Blocks() as results:
    gra.Gallery([(source_image,"Initially generated image"),(mask_image,"Used mask"),(inpainted_image,"Inpainted image")],columns=[3], rows=[1], object_fit="contain", height="auto")
    #gra.Gallery([source_image,inpainted_image,mask_image]).style(columns=[3], rows=[1], object_fit="contain", height="auto")
results.launch(share=True)

**上に表示された公開URLを共有すると、あなたの友人たちはあなたの素晴らしい作品を閲覧することができます。（Share the public URL above and your friends will be able to view your amazing creations.）**

# **エンドポイントの削除（Delete Endpoint）**

In [None]:
!aws sagemaker list-endpoints

**エンドポイントは、このノートブックまたは「エンドポイント設定」を使用していつでも再作成することができます。エンドポイントが長期間使用されていない場合は、料金を節約するためエンドポイントを削除することをお勧めします。次のセルのコードを使ってエンドポイントを削除することができます。
The endpoint can be recreated at any time using this notebook or the "Endpoint configuration". If the endpoint has not been used for a long time, it is recommended to delete the endpoint to save costs. You can delete the endpoint using the code in the next cell.**

In [None]:
deployed_model.sagemaker_session.delete_endpoint(endpoint_name)

**エンドポイントが削除されたことを確認します。（To confirm your endpoint gone, run next cell.）**

In [None]:
import time
time.sleep(10)
!aws sagemaker list-endpoints