## 케라스 모델 생성 방법

- Sequential 모델
- 함수형 API
- Model 서브클래싱(subclassing) 

### 1. Sequential 모델

- 가장 시작하기 쉬운 API
- 기본적으로 하나의 파이썬 리스트
- 단순히 층을 쌓을 수만 있음
- 하나의 입력과 하나의 출력을 가지면 순서대로 층을 쌓은 모델 표현

In [1]:
from tensorflow import keras
from keras import models, layers, Input

In [8]:
model = keras.Sequential([
    Input((28*28,)),
    layers.Dense(64, activation='relu'),
    layers.Dense(10, activation='softmax')
])

In [9]:
model.summary()

#### add() 메서드를 통해 점진적으로 모델 구성

- 파이썬의 append() 메서드와 유사

In [11]:
model = keras.Sequential()
model.add(Input((28*28,)))
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10, activation='softmax'))
model.summary()

#### build() 메서드 호출로 가중치 생성

- Sequential 모델은 어떤 가중치도 가지고 있지 않음. 가중치를 생성하려면 어떤 데이터로 호출하거나 입력 크기를 지정하여 build() 메서드를 호출해야 함

In [12]:
model.weights

[<Variable path=sequential_5/dense_8/kernel, shape=(784, 64), dtype=float32, value=[[ 0.07391676  0.05082028 -0.01957009 ... -0.05071715 -0.06990421
    0.03297244]
  [-0.07642274 -0.07029283  0.06507175 ... -0.04275205  0.04201684
    0.02045122]
  [ 0.07923696  0.01224326  0.02154547 ...  0.04246304  0.07942042
   -0.04746205]
  ...
  [ 0.06566667  0.06872936 -0.05209483 ...  0.00083514  0.01194513
    0.05360187]
  [ 0.07813291 -0.07278317  0.06418682 ... -0.03065402 -0.01543391
   -0.0086848 ]
  [-0.04160973 -0.00183635  0.01431869 ... -0.0642423   0.00294045
    0.04258167]]>,
 <Variable path=sequential_5/dense_8/bias, shape=(64,), dtype=float32, value=[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.
  0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]>,
 <Variable path=sequential_5/dense_9/kernel, shape=(64, 10), dtype=float32, value=[[ 1.25958323e-01 -1.44480363e-01 -2.27192253e-01  3

In [15]:
model = keras.Sequential()
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10, activation='softmax'))
model.summary()

In [16]:
model.build(input_shape=(None, 3))
len(model.weights)

4

In [17]:
model.weights[3]

<Variable path=sequential_7/dense_13/bias, shape=(10,), dtype=float32, value=[0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]>

In [19]:
model.weights[0]

<Variable path=sequential_7/dense_12/kernel, shape=(3, 64), dtype=float32, value=[[-0.06583555 -0.05852687 -0.08204733  0.05595607  0.27517462  0.26676756
  -0.25260964  0.16966617 -0.09202391  0.14901182  0.08360064  0.07375604
   0.26012468 -0.05907004 -0.18900768 -0.19437802  0.11835596 -0.1639168
  -0.09920618 -0.14473048  0.04091397  0.2413637  -0.00501058 -0.1764135
  -0.10102774 -0.06082854 -0.02860361 -0.257052    0.11338776  0.16991791
  -0.18208215  0.14295429  0.10609964  0.26532423 -0.03732541  0.04154724
  -0.14003767  0.22388315 -0.2401172  -0.10892376 -0.25499928  0.16660354
   0.16435522 -0.12623201  0.11068603  0.05609486 -0.25521246 -0.24599616
   0.13567656  0.2864676   0.14158735 -0.04195058  0.261896   -0.14809471
  -0.24061313 -0.01183647 -0.04468447  0.11928877 -0.18341178 -0.26115307
   0.18156973  0.12326154  0.14035568 -0.03161582]
 [ 0.10277596 -0.18895176 -0.24150155  0.00167495 -0.1087805  -0.01465091
  -0.08480091  0.272654   -0.271841   -0.02850735 -0.030

#### 모델 이름 변경과 층 이름 지정

In [20]:
model = keras.Sequential(name='my_ex_model')
model.add(layers.Dense(64, activation='relu', name='my_first_layer'))
model.add(layers.Dense(10, activation='softmax', name='my_last_layer'))
model.build(input_shape=(None, 3))
model.summary()

#### Input() 클래스를 사용하여 Sequential 모델의 가중치 생성

In [None]:
model = models.Sequential()
model.add(layers.Input())
model.add(layers.Dense())
model.summary()

#### 모델에 층 추가

In [23]:
model.add(layers.Dense(10, activation='softmax'))
model.summary()

In [24]:
inp = layers.Input(shape=(3,))
a = layers.Dense(64, activation='relu')
b = layers.Dense(10, activation='softmax')
model = models.Sequential([inp, a, b])
model.summary()

### 2. 함수형 API

- 그래프 같은 모델 구조를 주로 다룸
- 사용성과 유연상 사이의 적절한 중간 지점에 해당
- 가장 널리 사용되는 모델 구축 API
- 다중 입력, 다중 출력 또는 비선형적인 구조를 가진 모델 구성이 가능

In [27]:
inputs = layers.Input(shape=(3,), name='my_input')
hidden = layers.Dense(64, activation='relu')(inputs)
outputs = layers.Dense(10, activation='softmax')(hidden)
models.Model(inputs=inputs, outputs=outputs)

<Functional name=functional_11, built=True>

In [28]:
model.summary()

In [29]:
inputs.dtype

'float32'

In [35]:
vocab_size, num_tags, num_depart = 10000, 100, 4
title = layers.Input(shape=(vocab_size,), name='title')
text_body = layers.Input(shape=(vocab_size,), name='text_body')
tags = layers.Input(shape=(num_tags,), name='tags')


ftrs = layers.Concatenate()([title, text_body, tags])
ftrs = layers.Dense(64, activation='relu')(ftrs)

priority = layers.Dense(1, activation='sigmoid', name='priority')(ftrs)
department = layers.Dense(num_depart, activation='softmax', name='department')(ftrs)

model = models.Model(inputs=[title, text_body,tags], outputs=[priority,department])
model.summary()

- inputs : 심볼릭 텐서(symbolic tensor)
    - 심볼릭 텐서(symbolic tensor) : 실제 데이터를 가지고 있지 않지만 사용할 때 모델이 보게 될 데이터 텐서의 사양이 인코딩되어 있음. 미래의 데이터 센서를 나타냄
        - 크기와 dtype 정보가 업데이트된 새로운 심볼릭 텐서를 반환함
- 모든 케라스 층은 실제 데이터 텐서나 심볼릭 텐서로 호출할 수 있음

#### 다중 입력, 다중 출력 모델

- 예. 고객 이슈 사항에 우선순위를 지정하고 적절한 부서로 전달하는 시스템의 모델
    - 3개의 입력
        - 이슈 사항의 제목 : 텍스트 입력
        - 이슈 사항의 텍스트 본문 : 텍스트 입력
        - 사용자가 추가한 태그 : 범주형 입력(원핫인코딩되었다고 가정)
    - 2개의 출력
        - 이슈 사항의 우선순위 점수로 0과 1사이의 스칼라(시그모이드 출력)
        - 이슈 사항을 처리해야 할 부서(전체 부서 집합에 대한 소프트맥스 출력)

#### 다중 입력, 다중 출력 모델 훈련하기

- 입력과 타깃 배열 리스트를 전달하여 모델 훈련

In [37]:
import numpy as np
num_samples = 1280
title_data = np.random.randint(0, 2, size=(num_samples, vocab_size))
text_body_data = np.random.randint(0, 2, size=(num_samples, vocab_size))
tags_data = np.random.randint(0, 2, size=(num_samples, num_tags))
priority_data = np.random.randint(0, 2, size=(num_samples, 1))
department_data = np.random.randint(0, 2, size=(num_samples, num_depart))

- 입력과 타깃 배열을 딕셔너리로 전달하여 모델 훈련

In [45]:
# 컴파일
model.compile(optimizer='rmsprop',
              loss={'priority' : 'mean_squared_error',
                    'department' :'categorical_crossentropy'},
              metrics={'priority' : ['mean_squared_error'],
                       'department' : ['accuracy']})

# 학습
model.fit({'title' : title_data, 'text_body': text_body_data, 'tags':tags_data},
          {'priority' : priority_data, 'department' : department_data}, epochs=1)

# 평가
model.evaluate({'title' : title_data, 'text_body': text_body_data, 'tags':tags_data},
          {'priority' : priority_data, 'department' : department_data})

# 예측
priority_pred, department_pred = model.predict({'title' : title_data, 'text_body': text_body_data, 'tags':tags_data})


[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 10ms/step - department_accuracy: 0.2609 - department_loss: 130.5051 - loss: 130.9848 - priority_loss: 0.4797 - priority_mean_squared_error: 0.4797
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step - department_accuracy: 0.0625 - department_loss: 160.2056 - loss: 160.6853 - priority_loss: 0.4797 - priority_mean_squared_error: 0.4797
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step


In [46]:
# 컴파일
model.compile(optimizer='rmsprop',
              loss={'priority':'mean_squared_error', 
                    'department':'categorical_crossentropy'},
              metrics={'priority': ['mean_squared_error'],
                      'department': ['accuracy']})

# 학습
model.fit({'title': title_data, 'text_body': text_body_data, 'tags': tags_data},
          {'priority' : priority_data, 'department': department_data}, epochs=1)

# 평가
model.evaluate({'title': title_data, 'text_body': text_body_data, 'tags': tags_data},
           {'priority' : priority_data, 'department': department_data})

# 예측
priority_pred, department_pred = model.predict({'title': title_data, 
                                                'text_body': text_body_data, 
                                                'tags': tags_data})

[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 11ms/step - department_accuracy: 0.2594 - department_loss: 146.2583 - loss: 146.7379 - priority_loss: 0.4797 - priority_mean_squared_error: 0.4797
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step - department_accuracy: 0.5422 - department_loss: 122.8795 - loss: 123.3592 - priority_loss: 0.4797 - priority_mean_squared_error: 0.4797
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step


In [47]:
ftr = model.layers[4].output
difficulty = layers.Dense(3, activation='softmax', name='difficulty')(ftr)
new_model = models.Model(inputs=[title, text_body,tags], outputs=[priority, department, difficulty])
new_model.summary()

#### 함수형 API의 장점 : 층 연결 구조 활용하기

- 함수형 모델은 명시적인 그래프 데이터 구조
- 이전 그래프 노드(층의 출력)를 새 모델의 일부로 재사용 가능
- 모델 시각화와 특성 추출 가능

model.layers 속성
- 모델에 있는 모든 층의 리스트를 가지고 있음
- 각 층의 input과 output을 출력해볼 수 있음
- 특성 추출을 수행하여 다른 모델에서 중간 특성을 재사용하는 모델을 만들 수 있음

#### 중간층의 출력을 재사용하여 새로운 모델 만들기

### 3. Model 서브클래싱

- Model 클래스를 상속받아 밑바닥 부터 모델을 정의하는 저수준 방법
- 모든 상세한 내용을 완전히 제어하고 싶은 경우 적합
- 여러 가지 케라스 내장 기능을 사용하지 못하므로 실수가 발생할 위험이 많음
- Model 서브클래스 정의
    - __init__() 메서드에서 모델이 사용할 층을 정의
    - call() 메서드에서 앞서 만든 층을 사용하여 모델의 정방향 패스를 정의
- 서브클래스의 객체를 만들고 데이터와 함께 호출하여 가중치를 만듬

#### 간단한 서브클래싱 모델 생성

- 서브클래스 모델 정의

In [56]:
class CustomerModel(keras.models.Model):
    def __init__(self, num_depart):
        super().__init__()
        self.concat_layer = layers.Concatenate()
        self.mixing_layer = layers.Dense(64, activation='relu')
        self.priority_layer = layers.Dense(1, activation='sigmoid')
        self.department_layer = layers.Dense(num_depart, activation='softmax')
        
        
    def call(self, inputs):
        title = inputs['title']
        text_body = inputs['text_body']
        tags = inputs['tags']
        ftrs = self.concat_layer([title, text_body, tags])
        ftrs = self.mixing_layer(ftrs)
        priority = self.priority_layer(ftrs)
        department = self.department_layer(ftrs)

        return priority, department

- 서브클래스 모델 객체 생성

In [58]:
model = CustomerModel(num_depart=4)
priority, department = model({'title': title_data, 'text_body': text_body_data, 'tags': tags_data})
model.summary()

- 모델 컴파일, 훈련, 평가

In [64]:
# 컴파일
model.compile(optimizer='rmsprop',
              loss=['mean_squared_error','categorical_crossentropy'],
              metrics=[['mean_squared_error'],['accuracy']])
# 학습
model.fit({'title': title_data, 'text_body':text_body_data, 'tags':tags_data},
          [priority_data, department_data], epochs=1)
# 평가
model.evaluate({'title': title_data, 'text_body':text_body_data, 'tags':tags_data}, 
               [priority_data, department_data])
# 예측
priority_pred, department_pred = model.predict({'title': title_data, 
                                                'text_body':text_body_data,
                                                'tags':tags_data})

[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 11ms/step - accuracy: 0.2016 - categorical_crossentropy_loss: 25.5976 - loss: 26.1138 - mean_squared_error: 0.5162 - mean_squared_error_loss: 0.5162
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 5ms/step - accuracy: 0.1242 - categorical_crossentropy_loss: 15.5402 - loss: 16.0605 - mean_squared_error: 0.5203 - mean_squared_error_loss: 0.5203
[1m40/40[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step


### 4. 여러 가지 방식을 혼합하여 사용하기

#### 서브클래싱한 모델을 포함하는 함수형 모델 정의

In [65]:
class Classifier(keras.models.Model):
    def __init__(self,num_classes):
        super().__init__()
        if num_classes == 2:
            num_units = 1
            activation = 'sigmoid'
        else:
            num_units = num_classes
            activation = 'softmax'
        self.dense = layers.Dense(num_units, activation=activation)

    def call(self, inputs):
        return self.dense(inputs)
        

In [67]:
inputs = layers.Input(shape=(3,))
layers.Dense(64, activation='relu')(inputs)
outputs = Classifier(num_classes=10)(ftrs)
model = models.Model(inputs=inputs, outputs=outputs)




In [68]:
inputs = layers.Input(shape=(3,))
outputs = layers.Dense(1, activation='sigmoid')(inputs)
b_classifier = models.Model(inputs=inputs, outputs=outputs)

class MyModel(models.Model):
    def __init__(self, num_classes=2):
        super().__init__()
        self.dense = layers.Dense(64, activation='relu')
        self.classifier = b_classifier

    def call(self, inputs):
        ftrs = self.dense(inputs)
        return self.classifier(ftrs)

In [70]:
model = MyModel()
model.summary()

#### 함수형 모델을 포함하는 서브클래싱 모델 정의

----