# Amazon SageMaker Studio 노트북 사용

이 노트북에서는 환경 초기화 및 설정 과정을 안내합니다. SageMaker Python SDK의 Amazon S3 helper 메서드를 사용하여 데이터를 Amazon Simple Storage Service(Amazon S3) 버킷에 업로드하고 해당 버킷에서 다운로드하는 방법도 이 노트북에서 확인할 수 있습니다.

먼저 환경을 초기화합니다. 이렇게 하려면 필요한 라이브러리를 가져온 후 SageMaker Studio가 사용하는 기본 Amazon S3 버킷을 가져옵니다.

In [None]:
# Install dependencies
import pandas as pd
import boto3


# SageMaker dependencies
import sagemaker
from sagemaker import get_execution_role, session
from sagemaker.s3 import S3Downloader, S3Uploader

region= boto3.Session().region_name

# This object represents the AWS Identity and Access Management (IAM) role that you are assigned
role = sagemaker.get_execution_role()
print("Role: ", role)

sm_session = session.Session(boto3.Session())
sm = boto3.Session().client("sagemaker")
sm_runtime = boto3.Session().client("sagemaker-runtime")

SageMaker Python SDK S3Downloader 메서드를 사용하여 Amazon S3 버킷에서 데이터 집합을 다운로드합니다. 이 다운로더 메서드에 관한 자세한 내용은 [SageMaker Python SDK S3Downloader 메서드](https://sagemaker.readthedocs.io/en/stable/api/utility/s3.html#sagemaker.s3.S3Downloader)를 참조하세요.

In [None]:
bucket = ''
s3 = boto3.resource('s3')
for buckets in s3.buckets.all():
    if 'labdatabucket' in buckets.name:
        bucket = buckets.name
print(bucket)
prefix = 'scripts/data'

S3Downloader.download(s3_uri=f"s3://{bucket}/{prefix}/iris.csv", local_path= 'data/')

다음 코드는 데이터 집합을 확인한 후 그리드에 표시합니다.

In [None]:
import pandas as pd
import numpy as np

shape=pd.read_csv("data/iris.csv", header=None)
shape.sample(3)

데이터 집합을 훈련 및 검정 집합으로 분할합니다. SageMaker Python SDK S3Uploader 메서드를 사용하여 Amazon S3 버킷에 업로드합니다. 이 업로더 메서드에 관한 자세한 내용은 [SageMaker Python SDK S3Uploader 메서드](https://sagemaker.readthedocs.io/en/stable/api/utility/s3.html#sagemaker.s3.S3Uploader)를 참조하세요.

In [None]:
train_data = shape.sample(frac=0.8,random_state=200)
test_data = shape.drop(train_data.index)

In [None]:
train_file = 'train_data.csv';
train_data.to_csv(train_file, index=False, header=True)
test_file = 'test_data.csv';
test_data.to_csv(test_file, index=False, header=True)

# Return the URLs of the uploaded file, so they can be reviewed or used elsewhere
s3url = S3Uploader.upload(train_file, 's3://{}/{}'.format(bucket, prefix + "/train", "train"))
print(s3url)
s3url = S3Uploader.upload(test_file, 's3://{}/{}'.format(bucket, prefix + "/test", "test"))
print(s3url)

### 마무리

축하합니다! 환경을 초기화했으며 Amazon S3 버킷에서 파일을 업로드 및 다운로드했습니다. 

### 정리

이 노트북을 완료했습니다. 실습의 다음 부분으로 이동하려면 다음을 수행합니다.

- 이 노트북 파일을 닫습니다.
- 실습 지침으로 돌아갑니다.