# Accu.Tuning Client

**Accu.Tuning**이 원격에 설치되어 있는 경우, 개인 노트북에서도 원격 서버 자원을 이용해서 automl 작업 전반을 수행할 수 있도록 Client를 제공합니다. Client를 활용하여 다양한 환경에서 튜토리얼에서 Accu.Tuning의 여러 기능들을 원격으로 제어할 수 있습니다. 

본 튜토리얼에서는 다른 튜토리얼에서 확인할 수 있었던 실험 생성, 데이터 전처리, 모델링, 배포, 모델 활용 등 **Accu.Tuning**의 전체 프로세스를 Client를 이용하여 간단하게 구동하고, 확인하는 과정을 제공합니다.

In [1]:
from accutuning_client.category import Sklearn
from accutuning_client.client import Client

Client 사용을 위하여 구동 중인 **Accu.Tuning**이 위치한 IP와 포트를 입력합니다.

In [2]:
client = Client('localhost', 8000)

연결에 성공하면 현재 Accu.Tuning 상에 존재하는 Experiments, Sources를 확인할 수 있습니다.

In [3]:
experiments = client.experiments()
print(f'현재 Experiments는 총 {len(experiments)}개 있습니다.')
print(experiments)

현재 Experiments는 총 2개 있습니다.
[{'id': '2', 'name': 'Experiment-2', 'metric': 'NEG_MEAN_SQUARED_ERROR', 'modelsCnt': 0, 'status': 'ready', 'targetColumnName': 'target', 'dataset': {'id': '2', 'name': 'boston', 'featureNames': ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'target'], 'processingStatus': 'READY'}, 'deploymentsCnt': 0}, {'id': '1', 'name': 'Experiment-1', 'metric': 'ACCURACY', 'modelsCnt': 0, 'status': 'ready', 'targetColumnName': 'target', 'dataset': {'id': '1', 'name': 'iris', 'featureNames': ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)', 'target'], 'processingStatus': 'FINISHED'}, 'deploymentsCnt': 0}]


In [4]:
sources = client.sources()
print(f'현재 Sources는 총 {len(sources)}개 있습니다.')
sources

현재 Sources는 총 2개 있습니다.


[{'id': 3,
  'filesize': '39.2 kB',
  'filename': 'sources/boston.csv',
  'fileurl': '/media/sources/boston.csv',
  'datasetCount': 0,
  'createdAt': '2021-02-04T17:43:07.733381',
  'name': None,
  'file': 'http://localhost:8000/media/sources/boston.csv',
  'hidden': False,
  'samplingSize': None,
  'samplingRatio': None,
  'samplingRandomSeed': 42,
  'colNames': 'CRIM,ZN,INDUS,CHAS,NOX,RM,AGE,DIS,RAD,TAX,PTRATIO,B,LSTAT,target',
  'colCount': 14,
  'createdBy': None},
 {'id': 1,
  'filesize': '3.1 kB',
  'filename': 'sources/iris.csv',
  'fileurl': '/media/sources/iris.csv',
  'datasetCount': 0,
  'createdAt': '2021-02-04T17:42:55.999539',
  'name': None,
  'file': 'http://localhost:8000/media/sources/iris.csv',
  'hidden': False,
  'samplingSize': None,
  'samplingRatio': None,
  'samplingRandomSeed': 42,
  'colNames': 'sepal length (cm),sepal width (cm),petal length (cm),petal width (cm),target',
  'colCount': 5,
  'createdBy': None}]

다음과 같이 작업을 실시할 Experiment를 선택하거나, 필요한 경우 Experiment를 생성합니다.

In [5]:
client.create_experiment(sources[1])
print(f'\n Experiment 생성: {client.experiments()[0]}')

{"id":4,"status":"creating","bestScore":null,"modelsCnt":0,"deploymentsCnt":0,"doneSlot":0,"totalSlot":3600,"availableMetrics":["accuracy","balanced_accuracy","f1_macro","f1_micro","f1_weighted","neg_log_loss","precision_macro","precision_micro","precision_weighted","recall_macro","recall_micro","recall_weighted","roc_auc_ovr"],"availableEstimators":["logistic_regression","bernoulli_nb","adaboost","decision_tree","extra_trees","gradient_boosting","hist_gradient_boosting","k_nearest_neighbor","lda","liblinear_svc","libsvm_svc","nusvc","mlp","multinomial_nb","passive_aggressive","qda","random_forest","sgd","xgboost","lightgbm","catboost"],"includeEstimators":["decision_tree","gradient_boosting","libsvm_svc","lightgbm","logistic_regression","random_forest","xgboost"],"includeScalingMethods":["none","standardize","none"],"includeFeatureEngineerings":["None","SelectFwe","SelectKBest","None"],"availableScalingMethods":["standardize","minmax","normalize"],"availableFeatureEngineerings":["Sele

In [6]:
experiment = experiments[0]
print(experiment)
print(experiment.get('id'))

{'id': '2', 'name': 'Experiment-2', 'metric': 'NEG_MEAN_SQUARED_ERROR', 'modelsCnt': 0, 'status': 'ready', 'targetColumnName': 'target', 'dataset': {'id': '2', 'name': 'boston', 'featureNames': ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'target'], 'processingStatus': 'READY'}, 'deploymentsCnt': 0}
2


Run 하기 전 데이터 전처리를 진행할 수 있습니다. 데이터로부터 전처리 설정을 추천받아 데이터에 맞는 전처리를 진행할 수도 있습니다.

In [7]:
client.preprocessor_config_recommend(experiment)
client.preprocess(experiment)

해당 코드를 통해 전처리를 실행하였을 경우, Accu.Tuning 화면 상에서도 전처리 설정이 자동으로 입력되어 작업이 진행되는 것을 확인할 수 있습니다.

![prep](img/client-preprocess.png)

전처리 작업을 마치고 Experiment가 준비되면 아래와 같이 AutoML 탐색을 시작할 수 있습니다.

In [8]:
if experiment.get('status') == 'ready':
    # Run AutoML
    client.run(experiment)
else:
    print('Run 실행 가능한 상태가 아님')

![models](img/client-models.png)

이와 같이 모델이 생성되는 것을 확인할 수 있습니다. 작업이 완료되면 해당 Experiment의 모델링 결과를 확인하고, 모델 배포를 진행할 수도 있습니다.

In [10]:
leaderboard = client.leaderboard(experiment)
print(f'leaderboad의 model 갯수는 {len(leaderboard)}')

leaderboad의 model 갯수는 16


In [11]:
model = leaderboard[0]
if model.get('deployedStatus') is None:
    # 모델 배포
    client.deploy(model)

In [12]:
# Deployement 정보 구해오기
deployments = client.deployments(experiment)
print(f'배포된 모델은 {len(deployments)}개 입니다.')
deployed_model = deployments[0]

{'deployments': [{'id': '1', 'name': 'gradient_boosting', 'description': None, 'status': 'DONE', 'modelType': 'model', 'modelPk': 15, 'allMetricsJson': None, 'createdAt': '2021-02-04T18:03:22.661894', 'testScore': None, 'model': {'id': '15', 'trainScore': -0.012175457401233148, 'validScore': -0.047847888319717424}, 'file': {'url': 'http://localhost:8000/media/runtime_0002/runtimeprocess_0009/output/pipeline.pkl', 'size': '221690', 'sizeHumanized': '221.7 kB', 'name': 'runtime_0002/runtimeprocess_0009/output/pipeline.pkl'}}]}
배포된 모델은 1개 입니다.


완료된 모델을 이용하여 예측을 실시하는 것도 가능합니다.

In [13]:
# 각 피쳐별 최빈값으로 예측
mostfrequent = client.mostfrequent(experiment)
print(mostfrequent)

[{'id': '6', 'name': 'CRIM', 'datatype': 'FLOAT64', 'mostFrequent': '14.3337', 'min': 0.01, 'max': 88.98}, {'id': '7', 'name': 'ZN', 'datatype': 'FLOAT64', 'mostFrequent': '0.0', 'min': 0.0, 'max': 100.0}, {'id': '8', 'name': 'INDUS', 'datatype': 'FLOAT64', 'mostFrequent': '18.1', 'min': 0.46, 'max': 27.74}, {'id': '9', 'name': 'CHAS', 'datatype': 'FLOAT64', 'mostFrequent': '0.0', 'min': 0.0, 'max': 1.0}, {'id': '10', 'name': 'NOX', 'datatype': 'FLOAT64', 'mostFrequent': '0.5379999999999999', 'min': 0.38, 'max': 0.87}, {'id': '11', 'name': 'RM', 'datatype': 'FLOAT64', 'mostFrequent': '6.405', 'min': 3.56, 'max': 8.78}, {'id': '12', 'name': 'AGE', 'datatype': 'FLOAT64', 'mostFrequent': '100.0', 'min': 2.9, 'max': 100.0}, {'id': '13', 'name': 'DIS', 'datatype': 'FLOAT64', 'mostFrequent': '3.4952', 'min': 1.13, 'max': 12.13}, {'id': '14', 'name': 'RAD', 'datatype': 'FLOAT64', 'mostFrequent': '24.0', 'min': 1.0, 'max': 24.0}, {'id': '15', 'name': 'TAX', 'datatype': 'FLOAT64', 'mostFrequent

In [14]:
input_val = {col.get('name'): col.get('mostFrequent') for col in mostfrequent}
print(input_val)

{'CRIM': '14.3337', 'ZN': '0.0', 'INDUS': '18.1', 'CHAS': '0.0', 'NOX': '0.5379999999999999', 'RM': '6.405', 'AGE': '100.0', 'DIS': '3.4952', 'RAD': '24.0', 'TAX': '666.0', 'PTRATIO': '20.2', 'B': '396.9', 'LSTAT': '14.1'}


In [15]:
predict_val = client.predict(deployed_model, input_val, experiment.get('id'))
print(f'예측값은 {predict_val} 입니다.')

예측값은 2.9632004449270677 입니다.
