<h1><font color="#f37626">[Lifecycle]</font> tensorflow-autolog 예제 코드</h1>

----
`autolog()`는 모델링 과정 중 실험 이력으로 저장하고자 하는 모델을 자동으로 accuinsight+ modeler 콘솔 화면에 기록해주는 메소드 입니다.

- data: TTC 1차 경연 데이터
- tensorflow.keras 사용


`autolog()`는 다음의 과정을 통해 실험 이력을 기록합니다.
1. `accuinsight()` 객체 생성
2. model.fit() 이전에 `autolog()` 선언
3. model.fit()을 사용하여 모델 학습 진행    

----

### 1. Accuinsight()
- accuinsight() 객체를 생성합니다.

In [1]:
from Accuinsight.Lifecycle.tensorflow import accuinsight

accu = accuinsight()

#### [option 1] DataCatalog에서 데이터 다운로드
- DataCatalog에서 관리하는 데이터를 받아올 수 있습니다.  

    1. Data catalog 서비스 화면에서 다운로드하려는 데이터의 경로를 __copy location__ 버튼을 클릭하여 복사합니다.
    2. 복사한 경로를 `get_file()`의 argument로 입력합니다.
    3. info의 출력값인 데이터가 저장된 경로를 사용하여 데이터를 불러올 수 있습니다. 

In [None]:
dataCatalog_endpoint = 'location'

accu.get_file(dataCatalog_endpoint)

#### [option 2] Slack 메시지 푸시 
1. slack api에서 발급받은 token과 메시지를 받아보고자 하는 channel의 id를 입력합니다.  
`set_slack(token, channel_id)`

2. slack으로 message를 푸시하는 방법은 다음과 같습니다.
    - 모델 학습 완료시   
    `send_message('your_message')`

    - 학습에 사용되는 metric이 일정 thresholds를 넘은 경우  
    `send_message(thresholds = 0.5)`
    
> 두 가지 방법을 동시에 사용할 수 없습니다.

In [2]:
token = 'your_token'        # 'xoxb-1115345314244-1094539075095-ypUn8dNSmsGnNYgEFpODay2Y'
cid = 'your_channel_id'     # 'C013X070NUQ'

accu.set_slack(token = token, channel_id = cid)

In [3]:
# accu.send_message(message = '[DL-classification-keras] 모델 학습 완료')

accu.send_message(thresholds = 0.1)  ### 예제에서는 thresholds를 넘을 경우에만 메시지를 푸시합니다.

### 2. Load data
- __target__  
(긍정: 1 / 부정: 0)

In [4]:
import numpy as np
import csv
import os
import tensorflow as tf
from tensorflow.keras.layers import Dropout, Dense
from tensorflow.keras import Input
from tensorflow.keras import metrics
import tensorflow.keras.backend as K
from tensorflow.keras.callbacks import ModelCheckpoint

num_classes = 2
num_features = 3076
nodes = '256, 256'
batch_size = 64
epochs = 2
learning_rate = 9.909011392402347e-05
drop_out = 0.3
train_data_path = 'sample/train.csv'

feature = np.zeros((8349, num_features))
label = np.zeros((8349, 1))
with open(train_data_path, newline='') as csvfile:
    reader = csv.reader(csvfile)
    next(reader)
    for i, row in enumerate(reader):
        label[i, :] = int(row[-1])
        feature[i, :] = row[1:num_features+1]

nrow, ncol = feature.shape

### reshape input feature
feature = tf.reshape(feature, (-1, num_features))
input_shape = num_features

### Using tf.data.Dataset
full_dataset = tf.data.Dataset.from_tensor_slices((feature, label))
train_size = int(0.9 * nrow)  ### train, validation data split (9:1)
val_size = nrow - train_size
train_dataset = full_dataset.take(train_size)
val_dataset = full_dataset.skip(train_size)

train_iter = train_dataset.shuffle(train_size).batch(batch_size).repeat()
val_iter = val_dataset.batch(val_size)

### 3. model compile

In [5]:
nodes_lst = []
for i in range(len(nodes.split(','))):
    nodes_lst.append(int(nodes.split(',')[i].strip()))

model = tf.keras.Sequential()
model.add(Input(shape=input_shape))

for i in range(0, len(nodes_lst)):
    nodes_ = nodes_lst[i]
    model.add(Dense(nodes_, kernel_initializer='glorot_uniform', activation='relu'))
    model.add(Dropout(drop_out))

model.add(Dense(2, activation='softmax'))
model.summary()

decay_rate = learning_rate / epochs
adam = tf.keras.optimizers.Adam(learning_rate=learning_rate, decay=decay_rate)
loss_fn = tf.keras.losses.SparseCategoricalCrossentropy()

def f1_score(y_true, y_pred):
    y_true = K.cast(K.reshape(y_true, (-1,)), float)
    y_pred = K.cast(K.argmax(y_pred), float)

    true_positives = K.sum(K.round(K.clip(y_true * y_pred, 0, 1)))
    possible_positives = K.sum(K.round(K.clip(y_true, 0, 1)))
    predicted_positives = K.sum(K.round(K.clip(y_pred, 0, 1)))
    precision = true_positives / (predicted_positives + K.epsilon())
    recall = true_positives / (possible_positives + K.epsilon())
    f1_val = 2*(precision*recall)/(precision+recall+K.epsilon())
    return f1_val

model.compile(optimizer=adam,
              loss=loss_fn,
              metrics=[f1_score, 'accuracy'])

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 256)               787712    
_________________________________________________________________
dropout (Dropout)            (None, 256)               0         
_________________________________________________________________
dense_1 (Dense)              (None, 256)               65792     
_________________________________________________________________
dropout_1 (Dropout)          (None, 256)               0         
_________________________________________________________________
dense_2 (Dense)              (None, 2)                 514       
Total params: 854,018
Trainable params: 854,018
Non-trainable params: 0
_________________________________________________________________


### 4. autolog() 
- `autolog()`에 현재 학습할 모델에 관한 간단한 tag를 입력할 수 있습니다.
- `autolog()`는 반드시 모델 학습(model.fit()) __이전에__ 호출이 되어야 합니다.

In [5]:
accu.autolog(tag = 'autolog-tensorflow-test')

### 5. model fitting

In [6]:
model.fit(train_iter,
          epochs= 3,
          steps_per_epoch=train_size // batch_size,
          validation_data=val_iter)

Train for 117 steps, validate for 1 steps
Epoch 1/3

Epoch 00001: val_f1_score improved from -inf to 0.79913, storing weights.

Epoch 2/3

Epoch 00002: val_f1_score did not improve

Epoch 3/3

Epoch 00003: val_f1_score improved from 0.79913 to 0.80265, storing weights.



Using epoch 00003 with val_f1_score: 0.80265


<tensorflow.python.keras.callbacks.History at 0x7fb2c44040d0>

__모델 학습이 완료되면 `autolog()`는 자동으로 해제됩니다.__  
따라서 모델 학습 이력을 추가하고자 할 경우, 다시 한 번 `autolog()` 호출 후 모델 훈련을 진행해야 합니다.

### 6. 저장된 모델 불러오기
- `autolog()`를 사용하여 모델의 학습 이력을 Lifecycle에 기록할 경우, 자동으로 훈련 도중 가장 좋은 metric을 기록한 epoch에서의 모델 가중치가 저장됩니다.
- 따라서 저장된 모델을 불러와 공동 작업자들과 모델을 공유하거나, 모델 재학습을 수행할 수 있습니다.

    1. Accuinsight+ workspace list 혹은 해당 모델의 상세화면으로 접속하여 _Experiment_ 중 불러오고자 하는 모델의 __Run name__을 복사합니다.
    2. ___utils___에서 `load_model()` 함수를 호출하여 모델을 불러올 수 있습니다.

In [8]:
from Accuinsight.Lifecycle.utils import load_model

In [11]:
loaded = load_model('tf.keras-22EFD5A2BAEA456A86058D753C082696_5')

In [12]:
loaded.get_weights()

[array([[ 0.0268689 , -0.00733192,  0.02800467, ..., -0.01865786,
          0.0111688 , -0.02869137],
        [-0.03657518, -0.01959282, -0.0255663 , ..., -0.00443056,
          0.03211622, -0.02195718],
        [-0.00326564,  0.02594056, -0.01623078, ...,  0.01043185,
          0.03757366, -0.01187944],
        ...,
        [-0.00087771,  0.01130018,  0.00527631, ..., -0.02420455,
          0.02681916,  0.03947695],
        [-0.0251298 ,  0.00779164,  0.00296635, ...,  0.02223781,
          0.02445504,  0.02082882],
        [ 0.03096442,  0.01268106, -0.01097602, ..., -0.0377523 ,
          0.02948582, -0.01749602]], dtype=float32),
 array([ 0.00000000e+00, -7.43379397e-03,  0.00000000e+00,  0.00000000e+00,
         0.00000000e+00,  0.00000000e+00,  0.00000000e+00,  0.00000000e+00,
         0.00000000e+00, -1.14700124e-02, -1.44583583e-02, -8.50690529e-03,
         7.21517997e-03,  0.00000000e+00, -9.78325959e-03,  2.90217251e-03,
         0.00000000e+00,  0.00000000e+00, -7.02771824e