In [8]:
import tensorflow as tf
from tensorflow import keras

In [9]:
import numpy as np

### 1. 데이터셋 만들기

In [3]:
# 데이터 불러오기

fashion_mnist = keras.datasets.fashion_mnist
(X_train_full, y_train_full), (X_test, y_test) = fashion_mnist.load_data()

In [4]:
print(X_train_full.shape)
print(X_train_full.dtype)

(60000, 28, 28)
uint8


In [5]:
# 검증셋 만들기 & 정규화(0~255 -> 0~1)

X_valid, X_train = X_train_full[:50000]/255.0, X_train_full[50000:]/255.0
y_valid, y_train = y_train_full[:50000], y_train_full[50000:]
X_test = X_test/255.0

In [6]:
# 레이블 달기

class_names = ["T-shirt/top",'Trouser','Pullover','Dress','Coat','Sandal',
              'Shirt','Sneaker','Bag','Ankle boot']

### 2. 시퀀셜 API를 사용하여 이미지 분류기
- .Flatten() : 이 층은 파라미터를 가지지 않고 간단한 전처리 수행(.reshape(-1,1))

In [11]:
model = keras.models.Sequential()
model.add(keras.layers.Flatten(input_shape = [28,28]))
model.add(keras.layers.Dense(300, activation = 'relu'))
model.add(keras.layers.Dense(100, activation = 'relu'))
model.add(keras.layers.Dense(10, activation = 'softmax'))

# 층을 하나씩 추가하지 않고 층의 리스트를 전달할 수도 있음
# model = keras.models.Sequential([
#     keras.layers.Flatten(input_shape = [28,28]),
#     keras.layers.Dense(300, activation = 'relu'),
#     keras.layers.Dense(100, activation = 'relu'),
#     keras.layers.Dense(10, activation = 'softmax')])

#### 모델 구조 확인하기

In [12]:
model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
flatten (Flatten)            (None, 784)               0         
_________________________________________________________________
dense (Dense)                (None, 300)               235500    
_________________________________________________________________
dense_1 (Dense)              (None, 100)               30100     
_________________________________________________________________
dense_2 (Dense)              (None, 10)                1010      
Total params: 266,610
Trainable params: 266,610
Non-trainable params: 0
_________________________________________________________________


#### 층 살펴보기

In [13]:
print(model.layers)

hidden1 = model.layers[1] # 인덱스로 선택가능
hidden1.name

[<tensorflow.python.keras.layers.core.Flatten object at 0x000002C3894B6B48>, <tensorflow.python.keras.layers.core.Dense object at 0x000002C3894B83C8>, <tensorflow.python.keras.layers.core.Dense object at 0x000002C38F1CEA48>, <tensorflow.python.keras.layers.core.Dense object at 0x000002C38F1CE3C8>]


'dense'

In [14]:
model.get_layer('dense') is hidden1

True

In [15]:
print(model.layers[2].name)

dense_1


#### 파라미터 확인하기
- get_weights() : 가중치 확인
- set_weights() : 가중치 설정

In [16]:
weights, biases = hidden1.get_weights()
print(weights)
print(biases)

[[-0.02534599 -0.04192099  0.06870961 ... -0.038114   -0.03956829
  -0.01147286]
 [-0.06417004 -0.03617382 -0.04614795 ...  0.04610377  0.06116448
  -0.01833124]
 [ 0.01217017 -0.04097137  0.06424288 ... -0.05396252 -0.00679654
   0.05566017]
 ...
 [-0.02627643  0.05009631  0.06108634 ...  0.00678161 -0.01065613
  -0.04615299]
 [-0.05122529 -0.0381493  -0.00525085 ...  0.06820393 -0.02921939
  -0.07296768]
 [ 0.00825323 -0.04135925  0.00708894 ...  0.02245706 -0.01231481
   0.04264469]]
[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 

In [17]:
print(weights.shape)
print(biases.shape)

(784, 300)
(300,)


#### 모델 컴파일
- .compile() 메서드를 호출하여 손실함수와 옵티마이저 지정

In [18]:
model.compile(loss = 'sparse_categorical_crossentropy',
             optimizer = 'sgd',
             metrics = ['accuracy'])

- 클래스가 배타적이므로 sparse_categorical_crossentropy 사용
- 만약 클래스별 확률을 가지고 있다면(원핫벡터) categorical_crossentropy 손실 사용
- if 이진분류, softmax -> sigmoid, binary_crossentropy 손실 사용

#### 모델 훈련과 평가

In [21]:
history = model.fit(X_train, y_train, epochs = 30,  # epoch 디폴트 : 1
                   validation_data = (X_valid, y_valid)) # valid data는 선택사항

Epoch 1/30
Epoch 2/30
Epoch 3/30
Epoch 4/30
Epoch 5/30
Epoch 6/30
Epoch 7/30
Epoch 8/30
Epoch 9/30
Epoch 10/30
Epoch 11/30
Epoch 12/30
Epoch 13/30
Epoch 14/30
Epoch 15/30
Epoch 16/30
Epoch 17/30
Epoch 18/30
Epoch 19/30
Epoch 20/30
Epoch 21/30
Epoch 22/30
Epoch 23/30
Epoch 24/30
Epoch 25/30
Epoch 26/30
Epoch 27/30
Epoch 28/30
Epoch 29/30
Epoch 30/30


- if 클래스가 불균형, class_weight 매개변수 지정하는게 좋음 (적게 등장하는 클래스는 높은 가중치를 많이 등장하는 클래스는 낮은 가중치를 부여)


- if 샘플별로 가중치를 부여하고 싶다면, sample_weight 매개변수 지정(class_weight와 sample_weight를 곱하여 사용됨)

#### 학습곡선

In [None]:
import pandas as pd
import matplotlib.pyplot as plt

pd.DataFrame(history.history).plot(figsize = (8,5))
plt.grid(True)
plt.gca().set_ylim(0,1)
plt.show()

#### 모델 평가하기

In [23]:
model.evaluate(X_test, y_test)



[0.474366158246994, 0.8306999802589417]

#### 예측하기

In [24]:
X_new = X_test[:3]
y_proba = model.predict(X_new)
y_proba.round(2)

array([[0.  , 0.  , 0.  , 0.  , 0.  , 0.08, 0.  , 0.11, 0.02, 0.79],
       [0.  , 0.  , 0.75, 0.  , 0.01, 0.  , 0.23, 0.  , 0.  , 0.  ],
       [0.  , 1.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  , 0.  ]],
      dtype=float32)

In [25]:
y_pred = model.predict_classes(X_new) # np.argmax(model.predict(x), axis=-1)
y_pred

Instructions for updating:
Please use instead:* `np.argmax(model.predict(x), axis=-1)`,   if your model does multi-class classification   (e.g. if it uses a `softmax` last-layer activation).* `(model.predict(x) > 0.5).astype("int32")`,   if your model does binary classification   (e.g. if it uses a `sigmoid` last-layer activation).


array([9, 2, 1], dtype=int64)

In [29]:
np.array(class_names)[y_pred]

array(['Ankle boot', 'Pullover', 'Trouser'], dtype='<U11')

### 3. 시퀀셜 API를 사용하여 회귀용 다층 퍼셉트론 만들기
- 출력층이 활성화 함수가 없는 하나의 뉴런, 손실함수로 MSE 사용
- 이 데이터에는 잡음이 많아 뉴런 수 적은 은닉층 하나만 사용(과대적합 방지)

In [10]:
from sklearn.datasets import fetch_california_housing # 캘리포니아 주택가격
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

In [11]:
housing = fetch_california_housing()

In [12]:
X_train_full, X_test, y_train_full, y_test = \
    train_test_split(housing.data, housing.target)
X_train, X_valid, y_train, y_valid = train_test_split(X_train_full, y_train_full)

In [13]:
# 스케이링

scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_valid = scaler.transform(X_valid)
X_test = scaler.transform(X_test)

In [11]:
X_train.shape

(11610, 8)

#### 모델 생성

In [12]:
model = keras.models.Sequential([
    keras.layers.Dense(30, activation  = 'relu', input_shape = X_train.shape[1:]),
    keras.layers.Dense(1)
])

In [13]:
model.compile(loss = 'mean_squared_error', optimizer = 'sgd')

In [51]:
history = model.fit(X_train, y_train, epochs = 20,
                   validation_data = (X_valid, y_valid))

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


In [26]:
mse_test = model.evaluate(X_test, y_test)
X_new = X_test[:3]
y_pred = model.predict(X_new)



### 4. 함수형 API를 사용해 복잡한 모델 만들기
- Sequential 모델은 널리 사용되지만 입력과 출력이 여러 개거나 더 복잡한 네트워크 토폴로지를 갖는 신경망을 만들기 위해서는 함수형 API를 사용해야
#### 1) 와이드 & 딥 신경망
![title](img/10_1.png)

In [46]:
input_ = keras.layers.Input(shape = X_train.shape[1:])
hidden1 = keras.layers.Dense(30, activation = 'relu')(input_)
hidden2 = keras.layers.Dense(30, activation = 'relu')(hidden1)
concat = keras.layers.Concatenate()([input_, hidden2])
output = keras.layers.Dense(1)(concat)
model = keras.Model(inputs = [input_], outputs = [output])

- 우선, keras.layers.Input를 이용하여 input 객체 만들어야! shape과 dtype을 포함하여 모델의 입력을 정의(한 모델은 여러개의 입력을 가질 수 있음)
- keras.layers.Concatenate를 이용하여 두번째 은닉층의 출력과 입력을 연결하기

#### 2) 여러개의 입력 다루기
![title](img/10_2.png)

In [47]:
input_A = keras.layers.Input(shape = [5], name = 'wide_input')
input_B = keras.layers.Input(shape = [6], name = 'deep_input')
hidden1 = keras.layers.Dense(30, activation = 'relu')(input_B)
hidden2 = keras.layers.Dense(30, activation = 'relu')(hidden1)
concat = keras.layers.Concatenate()([input_A, hidden2])
output = keras.layers.Dense(1, name = 'output')(concat)
model = keras.Model(inputs = [input_A, input_B], outputs = [output])

- fit() 메서드를 호출할 때 X_train -> (X_train_A, X_train_B) 튜플로 전달해야

In [48]:
model.compile(loss='mse',optimizer = keras.optimizers.SGD(lr = 1e-3))

In [49]:
X_train_A, X_train_B = X_train[:,:5], X_train[:, 2:]
X_valid_A, X_valid_B = X_valid[:,:5], X_valid[:, 2:]
X_test_A, X_test_B = X_test[:,:5], X_test[:, 2:]
X_new_A, X_new_B = X_test_A[:3], X_test_B[:3]

In [50]:
history = model.fit((X_train_A, X_train_B), y_train, epochs = 20,
                   validation_data = ((X_valid_A, X_valid_B), y_valid))

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


In [35]:
mse_test = model.evaluate((X_test_A, X_test_B), y_test)



In [36]:
ypred = model.predict((X_new_A, X_new_B))

#### 3) 여러개의 출력이 필요한 경우
- ex) 여러 출력이 필요한 경우, 다중 작업 분류(표정분류 + 안경유무), 규제 기법으로 사용(보조 출력을 사용해 하위 네트워크가 나머지 네트워크에 의존하지 않고 그 자체로 유용한 것을 학습하는지 확인)
<img src="img/10_3.png" width="300" height="300">

In [38]:
# 출력층까지는 이전과 동일
output = keras.layers.Dense(1, name = 'main_output')(concat)
aux_output = keras.layers.Dense(1, name = 'aux_output')(hidden2)
model = keras.Model(inputs = [input_A, input_B], outputs = [output, aux_output])

In [40]:
model.compile(loss=['mse','mse'], loss_weights = [0.9, 0.1], optimizer = 'sgd')

In [41]:
history = model.fit([X_train_A, X_train_B],[y_train, y_train], epochs = 20,
                   validation_data = ([X_valid_A, X_valid_B], [y_valid, y_valid]))

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


In [42]:
total_loss, main_loss, aux_loss = model.evaluate(
    [X_test_A, X_test_B], [y_test, y_test])



In [43]:
y_pred_main, y_pred_aux = model.predict([X_new_A, X_new_B])

### 5. 서브클래싱 API로 동적 모델 만들기
- 시퀀셜 API와 함수형 API는 모두 선언적(사용할 층과 연결방식을 먼저 정의해야)<br>
    \- 모델 저장, 복사, 공유, 구조 분석 쉬움. 프레임워크 크기 짐작하고 에러를 일찍 발견할 수 있음. but, 정적
    
    
- 반복문을 포함하고 다양한 크기를 다루거나 조건문을 가지는 등 여러가지 동적구조를 필요로 하는 모델(명령형(imperative) 프로그래밍 필요) -> 서브클래싱 API<br><br>
=> Model 클래스를 상속하여 생성자 안에서 필요한 층 만들기<br>
=> call() 메서드 안에서 수행하려는 연산 기술

In [44]:
class WideAndDeepModel(keras.Model):
    def __init__(self, units=30, activation='relu',**kwargs):
        super().__init__(**kwargs) # 표준 매개변수 처리
        self.hidden1 = keras.layers.Dense(units, activation=activation)
        self.hidden2 = keras.layers.Dense(units, activation=activation)
        self.main_output = keras.layers.Dense(1)
        self.aux_output = keras.layers.Dense(1)
        
    def call(self, inputs):
        input_A, input_B = inputs
        hidden1 = self.hidden1(input_B)
        hidden2 = self.hidden2(hidden1)
        concat = keras.layers.concatenate([input_A, hidden2])
        main_output = self.main_output(concat)
        aux_output = self.aux_output(hidden2)
        return main_output, aux_output

- Input 클래스의 객체를 만들 필요 x, 대신 call() 메서드의 input 매개변수를 사용
- call() 메서드 안에서느 for문, if문 등 저수준 연산가능
- But, 구조를 쉽게 분석하거나 모델 저장 및 복사 못함

In [45]:
model = WideAndDeepModel()

### 6. 모델 저장과 복원

In [68]:
model.save('my_keras_model.h5')

In [69]:
model = keras.models.load_model('my_keras_model.h5')

- 서브클래싱 모델에서는 X -> save_weights()와 load_weights()를 통해 파라미터만 저장 복원가능 

### 7. 콜백 사용하기
- callbacks 매개변수를 사용하여 훈련의 시작이나 끝에 호출할 객체리스트 저장, 에포크의 시작/끝, 각 배치 전후에 호출가능<br>
    ex) ModelCheckpoint는 훈련 중 일정 간격으로 체크포인트 저장

In [71]:
# [..] 모델 만들고 컴파일하기(시퀀스 모델이용)
checkpoint_cb = keras.callbacks.ModelCheckpoint('my_keras_model.h5') # 모델저장경로
history = model.fit(X_train, y_train, epochs = 10, callbacks = [checkpoint_cb])

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


- ModelCheckpoint에서 save_best_only=True를 지정하면 최상의 검증 세트 점수에서만 모델저장 -> 과대적합 걱정 x

#### 1) 일정한 간격으로 모델의 체크 포인트 저장
- ModelCheckpoint의 save_best_only 옵션 : 최상의 검증 세트 점수의 모델만 저장

In [72]:
model = keras.models.load_model('my_keras_model.h5')
checkpoint_cb = keras.callbacks.ModelCheckpoint('my_keras_model.h5',
                                               save_best_only = True)

In [73]:
history = model.fit(X_train, y_train, epochs = 10,
                   validation_data = (X_valid, y_valid),
                   callbacks = [checkpoint_cb])

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


In [74]:
model = keras.models.load_model('my_keras_model.h5')

#### 2) 조기 종료 구현하기 - EarlyStopping 콜백

In [77]:
early_stopping_cb = keras.callbacks.EarlyStopping(patience = 10, 
                                               restore_best_weights = True)

In [78]:
history = model.fit(X_train, y_train, epochs = 100,
                   validation_data = (X_valid, y_valid),
                   callbacks = [checkpoint_cb, early_stopping_cb])

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

#### 3) 사용자 정의 콜백

- 검증 손실과 훈련 손실의 비율(과대적합 감지)

In [80]:
class PrintValTrainRatioCallback(keras.callbacks.Callback):
    def on_epoch_end(self, epoch, logs):
        print('\nval/train: {:.2f}'.format(logs['val_loss']/logs['loss']))

### 8. 텐서보드를 사용해 시각화하기

In [14]:
# 텐서보드 로그를 위해 루트 로그 디렉터리 정의 &
# 실행할 때마다 날짜와 시간으로서브 디렉터리 경로를 생성하는 함수

import os
root_logdir = os.path.join(os.curdir,'my_logs')

def get_run_logdir():
    import time
    run_id = time.strftime('run_%Y_%m_%d-%H_%M_%S')
    return os.path.join(root_logdir, run_id)

In [15]:
run_logdir = get_run_logdir()

In [16]:
tensorboard_cb = keras.callbacks.TensorBoard(run_logdir)

In [17]:
history = model.fit(X_train, y_train, epochs = 30,
                   validation_data = (X_valid, y_valid),
                   callbacks = [tensorboard_cb])

Epoch 1/30
Epoch 2/30
Epoch 3/30
Epoch 4/30
Epoch 5/30
Epoch 6/30
Epoch 7/30
Epoch 8/30
Epoch 9/30
Epoch 10/30
Epoch 11/30
Epoch 12/30
Epoch 13/30
Epoch 14/30
Epoch 15/30
Epoch 16/30
Epoch 17/30
Epoch 18/30
Epoch 19/30
Epoch 20/30
Epoch 21/30
Epoch 22/30
Epoch 23/30
Epoch 24/30
Epoch 25/30
Epoch 26/30
Epoch 27/30
Epoch 28/30
Epoch 29/30
Epoch 30/30


In [20]:
# 프롬프트에서

tensorboard --logdir=./my_logs --port=6006

^C


#### 주피터안에서 텐서보드 사용하기

In [21]:
%load_ext tensorboard
%tensorboard --logdir=./my_log --port=6006

ERROR: Timed out waiting for TensorBoard to start. It may still be running as pid 24060.

- create_file_write() 함수를 사용하여 텐서보드를 사용해 스칼라, 히스토그램, 이미지, 오디오, 텍스트를 시각화할 수 있음

In [22]:
test_logdir = get_run_logdir()
writer = tf.summary.create_file_writer(test_logdir)
with writer.as_default():
    for step in range(1, 1000+1):
        tf.summary.scalar('my_scalar', np.sin(step/10) ,step=step)
        data = (np.random.rand(100) + 2) * step / 100 # 몇몇 랜덤 데이터
        tf.summary.histogram('my_hist', data, buckets = 50, step = step)
        images = np.random.rand(2,32,32,3) # 32 * 32 RGB 이미지
        tf.summary.image('my_images',images * step / 1000, step=step)
        text = ['The step is ' + str(step), 'Its square is ' + str(step**2)]
        tf.summary.text('my_text', text, step=step)
        sine_wave=tf.math.sin(tf.range(12000) / 48000 * 2 * np.pi * step)
        audio = tf.reshape(tf.cast(sine_wave, tf.float32),[1,-1,1])
        tf.summary.audio('my_audio', audio, sample_rate = 48000, step=step)

### 9. 파라미터 튜닝하기

#### 1) GridSearchCV등을 사용하기위해 케라스 모델을 사이킷런 추정기처럼(RandomForest처럼)

In [1]:
def build_model(n_hidden = 1, n_neurons = 30, learning_rate = 3e-3, input_shape = [8]):
    model = keras.models.Sequential()
    model.add(keras.layers.InputLayer(input_shape=input_shape))
    for layer in range(n_hidden):
        model.add(keras.layers.Dense(n_neurons, activation='relu'))
    model.add(keras.layers.Dense(1))
    optimizer = keras.optimizers.SGD(lr = learning_rate)
    model.compile(loss='mse', optimizer = optimizer)
    return model

In [2]:
# 데이터 셋 불러오기

from sklearn.datasets import fetch_california_housing # 캘리포니아 주택가격
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

In [4]:
housing = fetch_california_housing()

In [5]:
X_train_full, X_test, y_train_full, y_test = \
    train_test_split(housing.data, housing.target)
X_train, X_valid, y_train, y_valid = train_test_split(X_train_full, y_train_full)

In [6]:
# 스케이링

scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_valid = scaler.transform(X_valid)
X_test = scaler.transform(X_test)
X_new = X_test[:3]

In [14]:
# build_model() 함수를 사용해 KerasRegressor 클래스의 객체 만들기

keras_reg = keras.wrappers.scikit_learn.KerasRegressor(build_model)

keras_reg.fit(X_train, y_train, epochs = 100,
             validation_data = (X_valid, y_valid),
             callbacks = [keras.callbacks.EarlyStopping(patience = 10)])

mse_test = keras_reg.score(X_test, y_test)

y_pred = keras_reg.predict(X_new)
y_pred

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100


array([1.1011649, 1.8644428, 2.0912337], dtype=float32)

#### 2) 랜덤CV
- 하이퍼파라미터가 많으므로 그리드서치보다는 랜덤CV

In [15]:
from scipy.stats import reciprocal
from sklearn.model_selection import RandomizedSearchCV

In [16]:
param_distribs = {
    'n_hidden' : [0,1,2,3],
    'n_neurons' : np.arange(1,100),
    'learning_rate' : reciprocal(3e-4, 3e-2) # (상호 연속적인) 랜덤 변수
}

In [None]:
# 엄청 오래걸림
rnd_search_cv = RandomizedSearchCV(keras_reg, param_distribs, n_iter = 10, cv = 3)
rnd_search_cv.fit(X_train, y_train, epochs = 100,
                 validation_data = (X_valid, y_valid),
                 callbacks = [keras.callbacks.EarlyStopping(patience = 10)])

- RandomizedSearchCV는 k-겹 교차검증을 사용하기 때문에 validation set은 조기종료에만 사용됨

In [None]:
rnd_search_cv.best_params_

In [None]:
rnd_search_cv.best_score_

In [None]:
model = rnd_search_cv.best_estimator_.model

- 이외에도 Hyperopt, Sklearn-Deap과 같은 다양한 라이브러리와 서비스가 제공되며, 활발히 연구되는 영역임