# [모듈 1.1] CodeCommit을 하면 EventBridge를 통해 "모델  훈련" CodePipeline 수행

이 노트북은 CodeCommit 레파지토리에 'SageMaker Pipeline config 파일(sm_pipeline_train_config.json)'을 수정 후 push 하면, EventBridge를 통해 CodePipeline을 실행하는 노트북 입니다.

## 참고 자료
- Amazon EventBridge 유저 가이드
   (https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-what-is.html)
- Boto3 Docs : EventBridge
   (https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/events.html)



# 1. 환경 확인

In [None]:
%load_ext autoreload
%autoreload 2

import sys
import sagemaker
import boto3
sys.path.append('./src')

%store -r s3_input_data_uri
print("s3_input_data_uri: \n", s3_input_data_uri)


# 2. 리파지토리 로컬에 클로닝
- "4_sm-train-codepipeline" 에서 만든 훈련 용 repository name 을 사용하여, 이 repository 를 로컬에 복사 합니다.
- repository 의 repository_url 를 가져옵니다.
- 아래와 같은 형태 입니다.
```
repository_url =  "https://git-codecommit.<REGION>.amazonaws.com/v1/repos/ncf-training-repo"
```
- "repository_url" 확인하면 이후에 로컬에 클로닝 합니다.

In [None]:
## Codecommit Repo Name (ncf-training-repo)
repository_name = "ncf-training-repo"

print(repository_name)

In [None]:
repository_url = boto3.client('codecommit').get_repository(repositoryName = repository_name).get('repositoryMetadata').get('cloneUrlHttp')
print(repository_url)

# repository_url = "<Repository URL>"

### [알림] git clone 과정에서 아래와 같은 에러 발생시 트러블 슈팅 하세요.
- [에러 메세지] 
    - CalledProcessError: Command 'b'\nrepository_url=$1\nrepository_name=$2 
-  --> 솔루션 : Kernel Restart 후 노트북 처음부터 다시 실행시켜 주세요.

In [None]:
%%sh -s {repository_url} {repository_name}

repository_url=$1
repository_name=$2

rm -rf $repository_name

git clone $repository_url 

# 3. EventBridge Rule 생성을 위한 파라미터 세팅

In [None]:

# code pipeline name, arn, role_arn
codepipeline_name1 = "ncf-code-pipeline-training-sm-pipeline"
codepipeline_arn = boto3.client('codepipeline').get_pipeline(name = codepipeline_name1).get('metadata').get('pipelineArn')
eventbrideexcrole_arn = boto3.client('iam').get_role(RoleName = 'MLOps-EventBridgeRole').get('Role').get('Arn')

# EventBridge Rule Name
eventbridge_rule_name1 = "codepipelinerule1"

# Training data path (Prefix)
data_prefix = "NCFModel/data2"

# EventBridge Rule의 EventPattern json 파일 경로
eventpattern_json = f'src/train_eventpattern.json'


# 4. EventBridge Rule 정의
- EventBridge Rule 생성하기 위해서는 2 가지를 생성해야 합니다.
    - (1) EventPattern 정의 
        - "4_sm-train-codepipeline" 에서 만든 훈련 용 repository 에 변화가 (예: Commit) 생기는 것을 감지 합니다.
    - (2) Event Target 정의
        - "4_sm-train-codepipeline 에서 생성한 "ncf-code-pipeline-training-sm-pipeline" 을 실행하게 합니다.

## 4.1 EventPattern 정의

In [None]:
# Codecommit Arn
repository_arn = boto3.client('codecommit').get_repository(repositoryName = repository_name).get('repositoryMetadata').get('Arn')
print(repository_arn)

In [None]:
eventpattern_dict = {
    "source": ["aws.codecommit"],
    "detail-type": ["CodeCommit Repository State Change"],
    "resources": [repository_arn],
    "detail": {
            "referenceType": ["branch"],
            "referenceName": ["master"]
    }
}

# print(eventpattern_dict)

In [None]:
eventpattern_dict

#### API put_rule() 을 통해 Rule 생성

In [None]:
import json

eventclient = boto3.client('events')

eventresponse = eventclient.put_rule(
    Name = eventbridge_rule_name1,
    EventPattern = json.dumps(eventpattern_dict)
)


In [None]:
eventresponse

## 4.2 Event Target 생성

In [None]:
eventresponse = eventclient.put_targets(
    Rule = eventbridge_rule_name1,
    Targets = [
        {
            'Arn' : codepipeline_arn,
            'Id' : codepipeline_name1,
            'RoleArn' : eventbrideexcrole_arn
        }
    ]
)


In [None]:
eventresponse

# 5. 새로운 SageMaker Pipeline (Training) 설정 파일 준비
- 로컬로 클로닝한 코드 리파지토리에서 sm_pipeline_train_config.json 파일을 로딩 합니다. 이 파일은 아래와 같은 형태 입니다.
```
{'project_prefix': 'SageMaker-Train-NCF',
 's3_input_data_uri': 's3://sagemaker-ap-northeast-2-XXXXXX/NCFModel/data2',
 'sm_pipeline_name': 'ncf-training-code-pipeline-sm-pipeline',
 'training_instance_type': 'ml.p3.2xlarge',
 'training_instance_count': 1,
 'ModelApprovalStatus': 'PendingManualApproval',
 'inference_image_uri': '763104351884.dkr.ecr.ap-northeast-2.amazonaws.com/pytorch-inference:1.8.1-gpu-py3',
 'bucket': 'sagemaker-ap-northeast-2-XXXXXX',
 'update_time': '2022-12-28-12-50-05'}
```
- 여기서 아래 두개의 변수의 값을 수정 합니다.
    - s3_input_data_uri : 신규 생성한 훈련 파일의 경로
    - update_time : 현재 시간 저장



## 5.1. sm_pipeline_train_config.json 파일 로딩

In [None]:
from common_utils import save_json, load_json

# 레포지토리의 sm_pipeline_train_config.json 파일 위치 지정
sm_pipeline_train_config_json_path = repository_name +"/pipelines/ncf/src/sm_pipeline_train_config.json"

# sm_pipeline_train_config.json 파일 내용을 Load
sm_train_pipeline_dict = load_json(sm_pipeline_train_config_json_path)


현재 시간을 얻습니다.

In [None]:
from datetime import datetime
currentDateAndTime = datetime.now()

# 현재 시간을 Json 에 넣기 위함
currentTime = currentDateAndTime.strftime("%Y-%m-%d-%H-%M-%S")
print("The current time is", currentTime)

두개의 변수의 값을 재 설정 합니다. 
- 신규 훈련 데이터 위치
- 업데이트 시간

In [None]:
# sm_pipeline_train_config.json 파일에서 훈련 데이터 위치(s3 uri)와 현재 시간만 업데이트
sm_train_pipeline_dict['s3_input_data_uri'] = s3_input_data_uri
sm_train_pipeline_dict['update_time'] = currentTime

# print(sm_train_pipeline_dict)

신규로 생성한 설정 내용을 확인 합니다.

In [None]:
sm_train_pipeline_dict

## 5.2. sm_pipeline_train_config.json 덮어 쓰기 (Overwriting)
- 위에서 정의한 설정 딕션어리를 sm_pipeline_train_config.json 저장하고, 재 로딩하여 다시 내용을 확인 해봅니다.

In [None]:
import json
from common_utils import save_json, load_json

save_json(sm_pipeline_train_config_json_path, sm_train_pipeline_dict)
sm_pipeline_train_dict = load_json(sm_pipeline_train_config_json_path)
print (json.dumps(sm_pipeline_train_dict, indent=2))

# 6. CodeCommit 리파지토리에 푸시 (Evnet Bridge Rule 이 트리거)
- 로컬의 클로닝한 리파지토리의  "/pipelines/ncf/src/sm_pipeline_train_config.json" 파일 변경이 있어서, CodeCommit 에 Push 하면 생성한 Event Brige Rule 에 의하여 "ncf-code-pipeline-training-sm-pipeline" Code Pipeline 이 실행 됩니다.

In [None]:
%%sh -s {repository_name} 
repository_name=$1
cd $repository_name
date >> pushtime.log
echo $PWD
git add .
git commit -m "Add new files"
git push origin master


# 7. 변수 저장

In [None]:
%store eventbridge_rule_name1
%store codepipeline_name1

# 8. EventBridge Rule 및 CodePipeline 실행 확인 (콘솔 화면)

## 9.1 EventBridge Rule 생성 확인
#### 하단에 codepipeline1이 생성된 것을 확인할 수 있습니다.

![eventbridge1.png](img/eventbridge1.png)

## 9.2 codepipelinerule1 의 Event pattern 확인

![eventbridge1-eventpattern.png](img/eventbridge1-eventpattern.png)

## 9.3 codepipelinerule1의 Target 확인

![eventbridge1-target.png](img/eventbridge1-target.png)

## 9.4 EventBridge를 통한 CodePipeline 실행 확인

![codepipeline-training-inprogress1.png](img/codepipeline-training-inprogress1.png)