# Module 3(Optional). Amazon A2I(Augmented AI) integration with Amazon SageMaker Inference

***[Note] 본 핸즈온은 필수가 아니며, 앞의 핸즈온들을 수월하게 마치셨을 경우에만 수행하시는 것을 권장드립니다.***


## Introduction

이 튜토리얼에서는 검증 데이터 및 테스트 데이터에 대해 추론 결과가 좋지 않은 경우들(예: 오분류, 미검출, 낮은 예측 score 등)에 대해 Amazon Augmented AI(이하 A2I)를 사용하는 법을 수행해 보겠습니다. 이를 통해 추론 결과에 대한 보정이나 점진적 훈련(incremental training)을 통해
모델 성능을 개선시킬 수 있습니다.

참고로 A2I는 워크샵을 위해 간소화하였기 때문에, 실제 프로덕션 적용 시에는 엣지 디바이스의 추론 결과를 IoT Core를 통해 AWS로 전송하여 A2I 및 점진적 훈련 수행 후 다시 엣지 디바이스로 배포하는 것을 권장드립니다. 아래는 프로덕션 적용 예시입니다.
  
- 어느 정도 학습이 완료된 모델 아티팩트를 s3에 미리 저장 (핸즈온 시간 단축 및 일관성 있는 성능을 위해)
- S3에 저장된 pre-trained 모델을 불러와서 1 epoch만 Incremental training (학습 데이터/검증 데이터 동일)
- 검증 데이터셋에서 추론 후, 오검출/미검출되거나 score가 낮은 샘플들 중 2-5장에 대해 A2I 수행(deploy는 로컬 모드에서 수행하거나 `model.tar.gz`를 로컬로 가져와서 직접 수행)
- Workteam (private team) 생성
- 휴먼 리뷰어의 작업이 완료 후 A2I JSON output 자동 생성
- A2I의 JSON output을 Ground Truth의 Augmented manifest 파일로 변환
- Augmented manifest 파일을 이용해 Incremental training 수행 (학습 데이터 2~5장만 사용)
- Score가 낮은 샘플에 대해 재학습한 모델로 추론 결과 보여주기 (deploy는 로컬 모드에서 수행하거나 model.tar.gz를 로컬로 가져와서 직접 수행)
- Edge 배포용 모델로 컴파일 

## Amazon A2I란?
Amazon A2I를 사용하면 머신 러닝 추론 결과가 잘못되거나 score가 낮은 경우, 사람(휴먼 리뷰어)이 개입하여 추론 결과를 보완하고 선택적으로 보완된 결과를 점진적 훈련(incremental training)을 통해 반영하는 머신 러닝 워크플로를 쉽게 구축할 수 있습니다.

Amazon A2I를 휴먼 리뷰 워크플로에 통합하려면 다음 세 가지 리소스들이 필요합니다.

* **Worker task template**: 작업자(worker) UI를 만들기 위한 템플릿입니다. Worker UI를 통해 휴먼 리뷰어에게 지시 사항 및 작업을 완료할 수 있는 interactive 도구들을 제공합니다. 자세한 내용은 https://docs.aws.amazon.com/sagemaker/latest/dg/a2i-instructions-overview.html 을 참조하세요.

* **Human review workflow**: 흐름 정의(flow definition)라고도 하는 휴먼 리뷰 워크플로우입니다. 이 흐름 정의를 사용하여 인력을 구성하고 인력 검토 작업을 수행하는 방법에 대한 정보를 제공합니다. A2I 콘솔 또는 A2I API를 사용하여 흐름 정의를 생성할 수 있습니다. 자세한 내용은 https://docs.aws.amazon.com/sagemaker/latest/dg/a2i-create-flow-definition.html 을 참조하세요.

* **Human loop**: 휴먼 리뷰 워크플로를 시작하는 휴먼 루프입니다. 휴먼 루프가 트리거되면 플로우 정의에 지정된 대로 휴먼 검토 태스크가 휴먼 리뷰어에게(즉, 작업자)에게 전송됩니다.


A2I에 대한 자세한 설명은 아래 웹페이지들을 참조해 주세요.
- https://aws.amazon.com/augmented-ai/ 
- https://docs.aws.amazon.com/sagemaker/latest/dg/a2i-getting-started.html

## 1. Inference Graph 구축

In [None]:
from PIL import Image
from matplotlib.pyplot import imshow
import os
import numpy as np
import glob
from os import listdir
from os.path import isfile, join
from utils import inference_utils as iu

In [None]:
with open('./img_datasets/labels.txt') as f:
    l_lines = f.readlines()
    labels = [ line.replace('\n','') for line in l_lines ]

모델은 초기화 시에만 생성하여 메모리에 로드합니다. 매번 입력 데이터에 대해 모델을 재생성하는 것은 많은 지연 시간을 초래합니다.

In [None]:
model_filepath='./model_result/inference_graph_frozen.pb'
model = iu.MobileNetInference(model_filepath, labels)

In [None]:
all_tensors = model.get_all_tensors()
print(all_tensors[-1])

In [None]:
model.get_input_node_info()

## 2. 샘플 데이터 추론

앞에서 정의한 클래스의 predict 메소드를 사용하여 간단하게 이미지 파일에 대한 추론 결과를 확인할 수 있습니다.

In [None]:
test_img_path = './samples/*/*'
test_img_list = glob.glob(test_img_path)

아래 코드 셀을 여러 번 반복해 보세요 :) `CTRL+Enter` 단축키를 사용하시면 편리합니다.

In [None]:
idx = np.random.randint(0,len(test_img_list))
test_image = test_img_list[idx]
print(test_image)
model.predict(test_image, img_size=224)

In [None]:
all_tensors = model.get_all_tensors()
print(all_tensors[-1])

In [None]:
model.get_input_node_info()

## 3. 배치 데이터 추론

여러분의 개인 랩탑/데스크탑이나 온프레미스에서 수행하는 방법과 동일하게 배치 데이터도 쉽게 추론이 가능합니다.  
본 예시에서는 테스트 데이터에 대해서 간단하게 배치 추론을 수행해 보고, 기본적인 평가 지표들인 ```Confusion Matrix```, ```AUROC(Area Under a ROC Curve)```, ```AUPRC(Area Under a Precision-Recall Curve)```를 확인해 보겠습니다.

In [None]:
!pip install scikit-learn==0.23.1

In [None]:
classnum_to_classname = {}
classname_to_classnum = {}
for class_name in labels:
    cls_split = class_name.split(':')
    classnum_to_classname[int(cls_split[0])] = cls_split[1]
    classname_to_classnum[cls_split[1]] = int(cls_split[0])

In [None]:
test_img_path = './samples/*/*'
test_img_list = glob.glob(test_img_path)

In [None]:
y_true_str = [img_list.split('/')[2] for img_list in test_img_list]
y_true = np.array([classname_to_classnum[s] for s in y_true_str])

아래 코드 셀에서 테스트 데이터셋에 대한 추론을 아래 절차로 수행합니다. 

- 정답값에 대한 One-hot encoding 변환 수행
- 배치 추론을 수행 후, 예측 score 및 결과(class) 리턴
- 예측 결과에 대한 One-hot encoding 변환 수행

In [None]:
from sklearn.preprocessing import OneHotEncoder
enc = OneHotEncoder(categories='auto', sparse=False)
num_classes = len(labels)

y_true_ohe = enc.fit_transform(y_true.reshape(-1, 1))
y_score, y_pred = iu.get_test_scores(model, test_img_list, '', num_classes)
y_pred_ohe = enc.transform(y_pred.reshape(-1,1))

y_pred_str = [classnum_to_classname[int(score)] for score in y_pred]

테스트 데이터셋에서 몇 개의 샘플 데이터만 가져옵니다. 참고로, 본 핸즈온에서는 20개의 샘플 데이터를 가져옵니다. 이 샘플 데이터로 A2I를 수행해 보겠습니다.

In [None]:
NUM_TEST_SAMPLES = 20
y_pred[:NUM_TEST_SAMPLES], y_pred_str[:NUM_TEST_SAMPLES]

# 3. Creating Human review Workteam or Workforce

인력(workforce)은 데이터셋에 레이블을 지정하기 위해 선택한 작업자 그룹입니다. 벤더가 관리하는 인력인 Amazon Mechanical Turk 인력을 선택하거나, private 인력을 생성할 수 있습니다.

본 섹션에서는 AWS 콘솔로 private 인력을 생성하겠습니다. 아래 순서를 따라 priavte 팀을 생성 후 한 명의 리뷰어를 추가해 봅시다.
역할(role)에 필요한 권한을 추가하려면 https://docs.aws.amazon.com/sagemaker/latest/dg/a2i-permissions-security.html 을 참조해 주세요.

1. AWS Console > Amazon SageMaker > **`Labeling workforces(레이블링 인력)`** 으로 이동 후, 상단의 **`Private(프라이빗)`** 탭을 클릭합니다.
2. 상단의 **`Private`** 탭을 클릭 후, **`Create private team(프라이빗 팀 만들기)`** 버튼을 클릭합니다.
3. Team name 이름에 임의의 이름을 입력하고 **`Create a new Amazon Cognito user group(Amazon Cognito 사용자 그룹 새로 만들기)`** 을 선택한 다음, 하단의 **`Create private team(프라이빗 팀 만들기)`** 버튼을 클릭합니다.
![Fig01](./imgs/fig01.png)
<br>
4. Amazon SageMaker > Labeling workforces 화면 맨 아래의 **`Workers(작업자)`** 탭에셔, 우측 하단의 **`Invite new workers(새 작업자 초대)`** 버튼을 클릭합니다.
![Fig02](./imgs/fig02.png)
<br>
5. 이메일 주소 항목에 여러분의 이메일 주소를 입력하고 **`Invite new workers(새 작업자 초대)`** 버튼을 클릭합니다.
![Fig03](./imgs/fig03.png)
<br>
6. Amazon SageMaker > Labeling workforces 화면으 **`Private teams`** 탭에서 여러분이 아까 생성한 private team 이름의 링크를 클릭합니다.
![Fig04](./imgs/fig04.png)
<br>
7. Workers 탭을 클릭 후, **`Add workers to team(팀에 작업자 추가)`** 버튼을 클릭합니다.
![Fig05](./imgs/fig05.png)
<br>
8. 이메일 주소를 선택 후, **`Add workers to team(팀에 작업자 추가)`** 버튼을 클릭합니다.
![Fig06](./imgs/fig06.png)
<br>
9. Private team 항목에서 private team 이름의 링크를 클릭하면, ARN을 아래 화면과 같이 확인할 수 있습니다. 이 arn을 아래 코드 셀에 붙여 넣으시면 됩니다.
    - `arn:aws:sagemaker:[YOUR REGION]:[YOUR ACCOUNT ID]:workteam/private-crowd/[YOUR PRIVATE TEAM NAME]`
![Fig07](./imgs/fig07.png)   
<br>
10. 참고로, 라벨링 작업이 이루어지는 포털 로그인 URL은 **`Private workforce summary(프라이빗 작업 인력 요약)`** 항목의 **`Labeling portal sign-in URL(레이블 지정 포털 로그인 URL)`** 입니다. 먼저, 여러분이 입력한 이메일을 확인하면 아래 그림과 같은 메일을 받을 수 있고, 이에 따라 포털로 로그인하시면 라벨링 작업을 수행하는 페이지로 접속할 수 있습니다. Human Loop가 활성화되면 여기에 신규 워크로드가 생성됩니다. 
![Fig08](./imgs/fig08.png)   
![Fig09](./imgs/fig09.png)  

상기 과정에서 복사한 `arn:aws:sagemaker:[YOUR REGION]:[YOUR ACCOUNT ID]:workteam/private-crowd/[YOUR PRIVATE TEAM NAME]` 을 아래의 코드 셀에 붙여 넣어 주세요.

In [None]:
WORKTEAM_ARN = "arn:aws:sagemaker:[YOUR REGION]:[YOUR ACCOUNT ID]:workteam/private-crowd/[YOUR PRIVATE TEAM NAME]"

## 4. A2I Client Setup

In [None]:
import io
import uuid
import boto3
import botocore
import sagemaker
import time
import json

timestamp = time.strftime("%Y-%m-%d-%H-%M-%S", time.gmtime())

sagemaker_session = sagemaker.Session()
region = sagemaker_session.boto_session.region_name

# Amazon SageMaker client
sagemaker_client = boto3.client('sagemaker', region)

# Amazon Augment AI (A2I) client
a2i = boto3.client('sagemaker-a2i-runtime')

# Amazon S3 client 
s3 = boto3.client('s3', region)

# Flow definition name - 이 값은 계정 및 지역마다 고유합니다. 여기에서 여러분의 고유 값을 제공할 수도 있습니다.
flowDefinitionName = 'fd-sagemaker-iot-public-workshop-demo-' + timestamp

# Task UI name - 이 값은 계정 및 지역마다 고유합니다. 여기에서 여러분의 고유 값을 제공할 수도 있습니다.
taskUIName = 'ui-sagemaker-iot-public-workshop-demo-' + timestamp

sess = sagemaker.Session()
BUCKET = sess.default_bucket()
OUTPUT_PATH = 's3://{}/a2i-results'.format(BUCKET)
MODEL_PATH = 's3://{}/model'.format(BUCKET)

### 4.1.  Human Task UI 생성

HTML로 구성된 UI 템플릿으로 휴먼 작업 UI 리소스를 생성할 수 있으며, 이 템플릿은 휴먼 루프가 필요할 때마다 휴먼 워커에게 렌더링됩니다.
참고로, 사전에 구축된 70여 가지의 UI를 https://github.com/aws-samples/amazon-a2i-sample-task-uis 에서 확인할 수 있습니다.


In [None]:
template = r"""
<script src="https://assets.crowd.aws/crowd-html-elements.js"></script>

<crowd-form>
  <crowd-image-classifier
    name="annotatedResult"
    src="{{ task.input.taskObject | grant_read_access }}"
    header="Please identify the class in this image"  
    categories="['4:British_Shorthair', '6:english_cocker_spaniel', 
    '9:Sphynx', '11:staffordshire_bull_terrier', '17:havanese',
    '28:scottish_terrier', '32:Russian_Blue']"
  >
    <full-instructions header="Classification Instructions">
      <p>Read the task carefully and inspect the image.</p>
      <p>Choose the appropriate label(s) that best suits the image.</p>
    </full-instructions>

    <short-instructions>
      <p>Read the task carefully and inspect the image.</p>
      <p>Choose the appropriate label that best suits the image.</p>
    </short-instructions>
  </crowd-image-classifier>
</crowd-form>
"""

In [None]:
def create_task_ui():
    '''
    Creates a Human Task UI resource.

    Returns:
    struct: HumanTaskUiArn
    '''
    response = sagemaker_client.create_human_task_ui(
        HumanTaskUiName=taskUIName,
        UiTemplate={'Content': template})
    return response

In [None]:
# Create task UI
humanTaskUiResponse = create_task_ui()
humanTaskUiArn = humanTaskUiResponse['HumanTaskUiArn']

### 4.2. Human Review Workflow 생성

이 섹션에서는 플로우 정의를 작성합니다. 플로우 정의를 통해 다음을 지정할 수 있습니다.

- 작업을 수행할 인력
- Worker task template; 인력이 받을 지침
- 작업을 받는 작업자 수 및 작업을 완료하기 위한 시간 제한을 포함한 worker task 구성
- 출력 데이터가 저장될 위치

In [None]:
from sagemaker import get_execution_role
role = get_execution_role()

create_workflow_definition_response = sagemaker_client.create_flow_definition(
        FlowDefinitionName= flowDefinitionName,
        RoleArn= role,
        HumanLoopConfig= {
            "WorkteamArn": WORKTEAM_ARN,
            "HumanTaskUiArn": humanTaskUiArn,
            "TaskCount": 1,
            "TaskDescription": "Identifythe class in an image.",
            "TaskTitle": "Image Classification a2i demo-hol"
        },
        OutputConfig={
            "S3OutputPath" : OUTPUT_PATH
        }
    )
flowDefinitionArn = create_workflow_definition_response['FlowDefinitionArn'] # let's save this ARN for future use

Flow Definition 생성 결과를 아래 코드 셀을 통해 확인합니다. Status는 `Active`가 되어야 합니다.

In [None]:
for x in range(60):
    describeFlowDefinitionResponse = sagemaker_client.describe_flow_definition(FlowDefinitionName=flowDefinitionName)
    print(describeFlowDefinitionResponse['FlowDefinitionStatus'])
    if (describeFlowDefinitionResponse['FlowDefinitionStatus'] == 'Active'):
        print("Flow Definition is active")
        break
    time.sleep(2)

### 4.3. Human Loop 시작

휴먼 리뷰 워크플로를 설정했으므로 휴먼 루프를 시작할 준비가 되었습니다. 여기에서 예측 결과가 좋지 않는 경우에만 Human Loop를 시작합니다.

먼저, A2I UI가 표시할 샘플 이미지를 s3 버킷에 복사합니다.

In [None]:
!aws s3 sync ./samples s3://{BUCKET}/a2i-results/sample-a2i-images/

In [None]:
human_loops_started = []

for fname, true_cls in (zip(test_img_list[:NUM_TEST_SAMPLES], y_true[:NUM_TEST_SAMPLES])):
    
    pred_cls, pred_cls_str, pred_score, pred_scores = model.predict(fname, show_image=False)  
    true_cls_str = '{}:{}'.format(true_cls, classnum_to_classname[true_cls])
    
    if pred_cls != true_cls:
        split = fname.split('/')
        s3_fname = 's3://%s/a2i-results/sample-a2i-images/%s/%s' % (BUCKET, split[2], split[3])
        humanLoopName = str(uuid.uuid4())        
        inputContent = {
            "initialValue": pred_cls_str,
            "taskObject": s3_fname # the s3 object will be passed to the worker task UI to render
        }
        # start an a2i human review loop with an input
        start_loop_response = a2i.start_human_loop(
            HumanLoopName=humanLoopName,
            FlowDefinitionArn=flowDefinitionArn,
            HumanLoopInput={
                "InputContent": json.dumps(inputContent)
            }
        )
        human_loops_started.append(humanLoopName)
        msg = "The model had to predict '{}', but incorrectly predicted '{}'.".format(true_cls_str, pred_cls_str)

        print(s3_fname)
        print(msg)
        print('Starting human loop with name: {} \n'.format(humanLoopName))

### 4.4. Human Loop Status 확인

In [None]:
completed_human_loops = []
for human_loop_name in human_loops_started:
    resp = a2i.describe_human_loop(HumanLoopName=human_loop_name)
    print('HumanLoop Name: {}'.format(human_loop_name))
    print('HumanLoop Status: {}'.format(resp["HumanLoopStatus"]))
    print('HumanLoop Output Destination: {}'.format(resp["HumanLoopOutput"]))
    print('\n')
    
    if resp["HumanLoopStatus"] == "Completed":
        completed_human_loops.append(resp)

본 코드셀 수행 후, A2I를 작업할 수 있는 전용 URL이 출력됩니다. 이 URL로 접속 후에 SSO(Single Sign On)으로 로그인하면 아래 figure와 같은 화면이 출력됩니다. Start working 버튼을 클릭하여 레이블링 작업을 시작합니다.<br>

![Fig10](./imgs/fig10.png)  

In [None]:
workteamName = WORKTEAM_ARN[WORKTEAM_ARN.rfind('/') + 1:]
print("Navigate to the private worker portal and do the tasks. Make sure you've invited yourself to your workteam!")
print('https://' + sagemaker_client.describe_workteam(WorkteamName=workteamName)['Workteam']['SubDomain'])

아래 코드 셀은 바로 2번째 위의 코드 셀과 동일합니다. 이 코드 셀을 실행하여 **HumanLoop Status**를 확인합니다.
모든 HumanLoop의 Status가 `Completed` 가 되어야 합니다. 참고로, A2I 전용 URL에서 레이블링 작업이 완료되면 아래 figure와 같은 화면이 출력됩니다.

![Fig11](./imgs/fig11.png)  

In [None]:
completed_human_loops = []
for human_loop_name in human_loops_started:
    resp = a2i.describe_human_loop(HumanLoopName=human_loop_name)
    print('HumanLoop Name: {}'.format(human_loop_name))
    print('HumanLoop Status: {}'.format(resp["HumanLoopStatus"]))
    print('HumanLoop Output Destination: {}'.format(resp["HumanLoopOutput"]))
    print('\n')
    
    if resp["HumanLoopStatus"] == "Completed":
        completed_human_loops.append(resp)

## 4.5. View Task Results  

레이블링 결과를 아래 코드셀을 통해 쉽게 확인할 수 있습니다.

In [None]:
import re
import pprint

pp = pprint.PrettyPrinter(indent=2)

for resp in completed_human_loops:
    splitted_string = re.split('s3://' +  BUCKET + '/', resp['HumanLoopOutput']['OutputS3Uri'])
    output_bucket_key = splitted_string[1]

    # load json
    response = s3.get_object(Bucket=BUCKET, Key=output_bucket_key)
    content = response["Body"].read()
    json_output = json.loads(content)
    pp.pprint(json_output)
    print('\n')

# 5. Incremental Training

위의 결과를 JSON 형태의 augmented Manifest 파일로 변경하거나 S3에 저장된 메타데이터 정보를 파싱 후 feature set(예: JPEG, TFRecord, RecordIO 등)으로 변환하여 점진적 훈련을 수행할 수 있습니다. 점진적 훈련은 모든 데이터를 다시 재훈련할 필요 없이
사전 훈련된 모델을 가져온 다음, 휴먼 리뷰어가 수정한 레이블링 결과만 입력 데이터로 사용하기에 훈련 시간이 오래 걸리지 않습니다.

본 핸즈온은 점진적 훈련까지 수행하지 않습니다. 만약 점진적 훈련에 대한 상세한 내용이나 예제 코드가 필요하면 아래 AWS 블로그를 참조해 주세요.

https://aws.amazon.com/ko/blogs/machine-learning/object-detection-and-model-retraining-with-amazon-sagemaker-and-amazon-augmented-ai/