# chapter 2 자연어 처리 개발 준비

*** 1장은 파이썬 설치와 관련된 사항이기때문에 넘어가고 2장부터 시작해보자.***  
  
2번째 part 시작!

# 2. 사이킷런(Scikit-learn)

사이킷런은 파이썬용 머신러닝 라이브러리이다.  
사이킷런은 주로 지도학습, 비지도학습을 위한 모듈, 모델 선택과 평가를 위한 모듈, 데이터 변환 및 데이터를 불러오기 위한 모듈, 계산성능 향상을 위한 모듈로 구성돼있다.   
지도학습을 위한 모듈로는 나이브 베이즈, 의사결정 트리(Decision Trees), 서포트 벡터 머신(SVM)등  
비지도 학습을 위한 모듈에는 군집화(Clustering), 가우시안 혼합모델(Gaussian mixture models) 등이 있다.  
모델 선택과 평가모듈에는 교차검증(Cross Validation), 모델 평가, 모델의 지속성을 위해 모델 저장 및 불러오기 기능 등을 제공한다.  
그리고 데이터 변환 모듈에서는 pipeline, 특징 추출(feature extraction), 데이터 전처리(preprocessing), 차원 축소(dimensionality reduction) 등의 기능을 제공한다.  
또 기본적으로 데이터셋을 제공하고있고 이를 불러와 사용할수 있다.  기본 데이터로는 당뇨병 데이터, 아이리스 데이터, 유방암 데이터가 있다.

![scikit-learn algorithm cheat-sheet](https://scikit-learn.org/stable/_static/ml_map.png)

### 사이킷런 설치

사이킷런은 의존성 라이브러리가 존재한다. numpy 와 scipy이다. 이걸 먼저 설치해줘야 하는데 conda로 설치하면 자동으로 설치해준다. 그럼 conda 명령어로 설치하자.

```shell
conda install scikit-learn
```

설치가 완료되면 import를 해보자
```python3
import sklearn
sklearn.__version__
```


두가지 분류모델을 만들어 볼것이다.  
지도학습 모델인 k 최근접 이웃 분류기 모델이고(k-nearest neighbor classifier)
나머지 하나는 비지도 학습 모델인 k평균 군집화 모델이다.(k-means clustering)
하나의 데이터셋을 사용해서 모델을 적용하여 볼 것이다.

실습 데이터셋은 붗꽃(iris)데이터이다. 라이브러리에 내장된 데이터라 바로 사용할수 있다.
```python3
from sklearn.datasets import load_iris
```
그 다음 변수에 할당하고 데이터가 어떤값으로 구성되어있는지 출력해보자.
```python3
iris_dataset = load_iris()
print(iris_dataset key: {}.format(iris_dataset.keys()))
```


In [None]:
from sklearn.datasets import load_iris


iris_dataset = load_iris()
print(iris_dataset key: {}.format(iris_dataset.keys()))

## 1. Tensorflow

2015년 구글이 발표한 오픈소스 머신러닝 라이브러리  
일반인이 사용하기 쉽게 되어있고 파이썬을 주로 활용해 손쉽게 모델링 및 테스트해 볼수 있는 구조.  
특징을 보자
- 테이터 플로우 그래프를 통한 풍부한 표현력
- 아이디어 테스트에서 서비스단계까지 이용가능
- 계산 구조와 목표 함수만 정의하면 자동으로 미분계산은 처리
- 파이썬 / C++ 지원하고 SWIG를 통해 다양한 언어지원 가능
- 유연성과 확장성  

`텐서(Tensor)`는 N차원 매트릭스를 의미하며, Flow한다는것은 데이터 흐름 그래프를 사용해 수치연산을 하는 과정을 의미한다. 그래프의 `노드(Node)`는 수치연산, 변수, 상수를 나타내고, `에지(Edge)`는 노드사이를 이동하는 다차원 데이터 배열(tensor의 배열)을 나타낸다.  



## tf.keras.layers
딥러닝 모델을 만드는 것은 마치 블록을 하나씩 쌓아서 전체 구조를 만들어 가는 것과 비슷하다. 따라서 쉽게 블록을 바꾸고, 여러블록들의 조합을 쉽게 만들수 있다는 것은 텐서플로의 큰 ***장점***이다.

### 1) tf.keras.layers.Dense
처음 소개한 모듈을 tf.keras.layers.Dense 이다. Dense란 신경망 구조의 가장 기본적인 형태를 의미한다. 즉 아래의 수식을 만족하는 기본적인 신경망 형태의 층을 만든느 함수다.

$$y=f(Wx + b)$$
x-입력벡터  
b=편향벡터  
W=가중치 행렬
f=활성화 함수  

dense layer를 그림으로 나타낸다면 
![Dense Layer](https://www.researchgate.net/profile/Mark_Sandler2/publication/319700841/figure/fig3/AS:538663165857797@1505438714241/An-illustration-of-a-dense-layer-that-has-a-4D-input-and-3D-output.png)

왼쪽은 input, 즉 x가 되는것이고 오른쪽은 output 즉 y가 되어진다. 중간 선들은 ***가중치를 곱하는 과정***을 의미하고 가중치는 W를 의미함. 이를 코드로 나타낸다면 
```python3
W= tf.Variable(tf.random_uniform([5,10],-1.0,1.0))
b= tf.Variable(tf.zeros[10])

y= tf.matmul(W,x)+b
```  
  
이같이 나타낼수있다. 텐서플로우에서는 이를 이미 정의해놓아서 아래 코드 한~두줄이면 가능함. 
```python3
1. 객체생성후 호출
dense = tf.keras.layers.Dense(..........)
output = dense(input)

2. 객체생성과 동시에 입력값 설정
dense = tf.keras.layers.Dense(..........)(input)
```

Dense 객체를 만들때 옵션을 주어 다양한 방법으로 만드는게 가능하다. 그럼 생성자를 살펴보자
```python3
def __init__(
    units,               # 출력값의 크기, integer or Long 값
    activation=None,     # 활성화 함수
    use_bias=True.       # 편향을 사용하지 여부, boolean 값
    kernel_initializer='glorot_uniform', # 가중치 초기화 함수
    bias_initializer='zeros',      # 편향 초기화 함수
    kernel_regularizer=None,       # 가중치 정규화 방법
    bias_regularizer=None,         # 편향 정규화 방법
    acitivity_regularizer=None,    # 출력 값 정규화 방법
    kernel_constraint=None,        # Optimizer에 의해 업데이트 된 이후 가중치에 적용되는 제약함수
    bias_constraint=None,          #                     ''            편향에 적용되는 제약함수
    **kwargs
    ):
```

필요에 따라 쓰자.  
예시를 들자면 
```python3
INPUT_SIZE=(20,1)

inputs=tf.keras.layers.Input(shape=INPUT_SIZE)
hidden=tf.keras.layers.Dense(10, activation=tf.nn.sigmoid)(inputs)
output=tf.keras.layers.Dense(2, activation=tf.nn.sigmoid)(hidden)
```

### 2) tf.keras.layers.Dropout

신경망 모델을 만들때 생기는 여러 문제점 중 대표적인 문제점은 `과적합(Overfitting)`이다.  과적합을 해결하기 위헤 정규화를 사용하는데 그중에 대표적인 방법이 Dropout이다. Dropout를 쉽게 적용할수 있는데 dropout layer를 만들면 된다. 이것도 2가지 방법이 있는데
```
1.
dropout = tf.keras.layers.Dropout( ... )
output = dropout(input)

2.
output = tf.keras.layers.Dropout( ... )(inputs)
```

이것도 마찬가지로 인자를 보자

```python3
def __init__(
    rate,                 # 드롭아웃 확률을 정함. 0~1 사이값.
    noise_shape=None,     # 정수형 1D tensor를 받아 특정값만 드롭아웃 가능. 예를들어 이미지일때 특정 채널만 드롭아웃할수도 있다.
    seed-None,            # 드롭아웃의 seed값. 같은 seed일때는 동일한 드롭아웃의 결과를 만들어냄.
    **kwargs
    ):
```

dense layer와 dropout layer를 가지고 예시를 들자면 
```python3
INPUT_SIZE=(20,1)

inputs=tf.keras.layers.Input(shape=INPUT_SIZE)
dropout=tf.keras.layers.Dropout(rate=0.2)(inputs)   # 20%의 노드를 없앰.
hidden=tf.keras.layers.Dense(10, activation=tf.nn.sigmoid)(dropout)
output=tf.keras.layers.Dense(2, activation=tf.nn.sigmoid)(hidden)
```
tf.keras.layers.Dropout도 있으나 tf.keras.nn.Dropout도 있다.
둘의 차이는 
tf.keras.layers.Dropout(0.2) 는 20%의 노드를 없애는 것이고
tf.keras.nn.Dropout(0.2)는 80%의 노드를 없애는 것이다. 유의해서 사용하자.


### 3) tf.keras.layers.Conv1D

이번절에서는 합성곱 연산중 Conv1D에 대해 알아보자. 합성곱 연산은 2가지 기준으로 구분할수 있다. 합성곱이 진행되는 방향과 합성곱 결과로 나오는 출력값이다. 표로 비교해보자

|   |합성곱의 방향|출력값|
|---|---|---|
|Conv1D|한 방향(가로)|1-D Array(vector)|
|Conv2D|두 방향(가로,세로)|2-D Array(vector)|
|Conv3D|세 방향(가로,세로,높이)|3-D Array(vector)|


실제 합성곱 출력값이 항상 동일하진 않다. 배치크기와 필터의 개수도 고려해야하기 때문에.  
그렇다면 CNN을 적용하는 과정을 이해해보자.  


![CNN 구조](https://t1.daumcdn.net/cfile/tistory/9913A0505ECBD00329)

해당 이미지를 보면 input 이미지에 필터를 통해서 feature를 뽑아 다시 2차원의 행렬을 만드는것을 볼수 있다.
Conv1D나 Conv3D를 썼다면 벡터나 텐서로 나왔을것이다.이렇게 입력값을 필터를 통해서 필터링하고 합성곱을 진행해 결과값을 얻는것이 Conv1d 레이어의 특징이다.

아래와 같이 생성 가능하다.
```
1.
conv1d = tf.keras.layers.Conv1D( ... )
output = conv1d(input)

2.
conv1d = tf.keras.layers.Conv1D( ... )(inputs)
```


이것도 마찬가지로 인자를 보자

```python3
def __init__(
    filters,                 # 총 몇개의 필터를 사용할지 -> 필터마다 출력이있으므로 출력의 차원수를 설정하는 것.
    kernel_size,             # 1차원이기 때문에 필터의 가로 길이만 필요함.
    strides=1,               # 스트라이드 값... 1이외의 수로 지정하면 dilation_rate를 1로 고정해야함.
    padding='valid',         # 패딩 값. 'valid' or 'same' 으로 지정.
    data_format='channels_last',   # 데이터의 표현 방법. channels_last or channels_first 둘중 하나.
                                   # channels_last = (batch, length, channels) // channels_first = (batch, channels, length)
    dilation_rate=1,         # 합성곱 사용시 dilation의 값. 1 이외의 수로 지정하면 strides 값을 1 이외값으로 지정하지 못함.
    activation=None,         # 활성화 함수
    use_bias=True,           # 편향 사용할지 여부.
    kernel_initializer='glorot_uniform',     # 가중치 초기화 함수
    bias_initializer='zeros', # 편향 초기화함수
    kernel_regularizer=None,  # 가중치 정규화 방법
    bias_regularizer=None,    # 편향 정규화방법
    activity_regularizer=None,# 출력값 정규화 방법
    kernel_constraint=None,   # optimizer 에 의해 업데이트된 후 가중치에 적용되는 부가적인 제약함수
    bias_constraint=None,     #                 ''               편향에 적용되는 부가적인 제약함수
    **kwargs
    ):
```


Conv1D와 dropout layer를 가지고 예시를 들자면 
```python3
INPUT_SIZE=(20,1)

inputs=tf.keras.layers.Input(shape=INPUT_SIZE)
dropout=tf.keras.layers.Dropout(rate=0.2)(inputs)   # 20%의 노드를 없앰.
conv=tf.keras.layers.Conv1D(
        filters=10,
        kernel_size=3,
        padding='same',
        activation=tf.nn.relu)(dropout)
```
conv2d와 conv3d의 경우도 몇가지 옵션을 제외하면 대부분 비슷하기 때문에 공식문서를 보고 비교해서 잘 알아두자...


### 4) tf.keras.layers.MaxPool1D

CNN에서 함께 쓰이는 기법중 하나가 풀링이다. 보통 feature map 크기를 줄이거나 주요한 특징을 뽑아내기 위해 합성곱 이후에 적용하는 기법이다. 풀링에는 2가지가 쓰이는데 MaxPooling과 AvreagePooling이다. Max pooling은 feature map에서 최대값만 뽑아내는 방법이고 Average pooling은 전체값들의 평균을 뽑아내는 방식이다. 주로 `Max pooling`을 이용하므로 알아두자  

MaxPooling도 3가지 형태로 구분되어있다. MaxPool1D,MaxPool2D,MaxPool3D가 있다.  
자연어 처리에선 MaxPool1D가 주로 사용되므로 MaxPool1D를 보도록 하자.

사용방법은 앞 클래스들과 동일하다  
```
1.
maxpool1d = tf.keras.layers.MaxPool1D( ... )
output = maxpool1d(input)

2.
maxpool1d = tf.keras.layers.MaxPool1D( ... )(inputs)
```


이것도 마찬가지로 인자를 보자

```python3
def __init__(
    pool_size=2,            # 풀링을 적용할 필터의 크기를 뜻한다. 정수값
    strides=None,           # 적용한 스트라이드의 값.
    padding='valid',        # 패딩방법을 정한다 'valid' or 'same'
    data_format=None        # channels_first or channels_last. Conv1D 와 같음.
    **kwargs
    ):
```


위에서 썻던 방식들과 적용해서 예시를 보자. 입력값이 합성섭과 맥스 풀링을 사용한 후 완전 연결 계층을 통해 최종출력값이 나오는 구조를 만들어 보자. 드롭아웃을 적용하고 맥스풀링 결과값을 완전 연결 계층으로 연결하기위해 *행렬이었던것을 벡터로 만들어야 한다.* 이때는 `tf.keras.layers.Flatten`을 사용한다. flatten은 별다른 인자값설정 없이도 사용할수 있으므로 다음 코드를 보자.  

```python3
INPUT_SIZE=(20,1)

inputs=tf.keras.layers.Input(shape=INPUT_SIZE)
dropout=tf.keras.layers.Dropout(rate=0.2)(inputs)   # 20%의 노드를 없앰.
conv=tf.keras.layers.Conv1D(
        filters=10,
        kernel_size=3,
        padding='same',
        activation=tf.nn.relu)(dropout)
max_pool=tf.keras.layers.MaxPool1D(pool_size=3, padding='same')(conv)
flatten=tf.keras.layers.Flatten()(max_pool)
hidden=tf.keras.layers.Dense(50, activation=tf.nn.sigmoid)(flatten)
output=tf.keras.layers.Dense(10, activation=tf.nn.sigmoid)(hidden)
```



# 2. Tensorflow 2.0  

텐서플로우 2.0으로 버전업 되면서 업데이트 된 부분을 요약하면 다음과 같다.  

- API 정리 (api clean up)
- 이거모드 (eager execution)
- 전역 매터니즘 제거 (No more globals)
- 세션을 대신하는 함수 (functions, not sessions)

### API 정리  

1 버전에서는 같은 기능을 수행하는 다양한 API가 다양한 패키지에 혼재해 있었다면 2버전에서는 다양한 API를 명료하고 사용하기 편하도록 동일한 기능의 다양한 API로 통합하고 사용하지 않는 API는 제거했다.

### 이거 모드(eager execution)   
기존에는 텐서플로우 API를 이용해 그래프를 만든 후에 별도의 세션을 통해 해당 그래프를 실행하는 방법이었다. 하지만 버전업 되면서 파이썬과 동일한 이거모드로 실행되기 때문에 연산을 구성하면서 바로 값을 확인할수 있게 되었다.

## 모델 구축
텐서플로우는 케라스를 이용해 모델을 구축하는것을 권장한다. 고수준(high-level) API로써 간편하고 유연하고 높은 성능을 보여준다.  
케라스로 모델을 구축하는방법은 크게 3가지이다.  
- Sequential API  
- Functional API  
- Function/ Sequential API  
  - \+ Custom API  
- Subclassing(Custom Model)  

이책은 Subclassing을 주로 이용해 모델을 구축할것이다. 일단 하나하나 알아보자.


### 1) Sequential API
tf.keras.Sequentail은 케라스를 활용해 간단하게 모델을 구축할수 있다.
```python3
from tensorflow.keras import layers

model = tf.keras.Sequential()
model.add(layters.Dense(64,activation='relu'))
model.add(layters.Dense(64,activation='relu'))
model.add(layters.Dense(10,activation='softmax'))
```

여러 레이어를 순차적으로 더하면 모델이 완성된다. 매우 간단하지만 복잡한 모델의 경우에는 구현이 불가능하기 때문에 제약이 존재한다.


### 2) Functional API
tf.keras.Sequentail은 아래의 상황에서 사용하기 어려울수 있다.  
- 다중 입력값 모델
- 다중 출력값 모델
- 공유층을 활용하는 모델
- 데이터흐름이 순차적이지 않은 모델  
이러한 모델을 구현할 때는 Functional API를 사용하거나 이후에 볼 Subclassing 방식이 적절할수 있다. 코드로 보자  

```python3
from tensorflow.keras import layers

inputs = tf.keras.Input(shape=(32,))
x = layters.Dense(64,activation='relu')(inputs)
x = layters.Dense(64,activation='relu')(x)
predictions = layters.Dense(10,activation='softmax')(x)
```
Functional API를 사용하기위해서는 입력값을 받는 Input 모듈을 선언해야한다. 입력값의 shape을 정의하면 된다.
이렇게 하면 위의 Sequential API와 동일한 모델을 만들수 있다.

### 3) Custom Layer
말 그대로 사용자 정의 API라고 생각하면 된다. 재사용성을 높이기 위해 하나의 레이어로 묶어 사용할수 있다.

```python3
from tensorflow.keras import layers

class CustomLayer(layers.Layer):
    def __init__(self, hidden_dimension, hidden_dimension2, output_dimension):
        self.hidden_dimension = hidden_dimension
        self.hidden_dimension2 = hidden_dimension2
        self.output_dimension = output_dimension
        super(CustomLayer, self).__init__()
    
    def build(self, input_shape):
        self.dense_layer1 = layers.Dense(self.hidden_dimension, activation='relu')
        self.dense_layer2 = layers.Dense(self.hidden_dimension2, activation='relu')
        self.dense_layer3 = layers.Dense(self.output_dimension, activation='softmax')
    
    def call(self, inputs):
        x=self.dense_layer1(inputs)
        x=self.dense_layer2(x)
        
        return self.dense_layer3(x)
```
사용자 정의 층을 정의할때는 layers 패키지의 Layer 클래스를 상속받고 위와같이 3개의 메서드를 정의하면 된다.  
우선 하이퍼파라미터는 객체를 생성할때 호출되도록 __init__()메서드에서 정의하고 모델의 가중치와 관련된 값은 build()에서 생성한다.  그리고 이렇게 정의한 값들을 이용해 call()에서 해당층의 로직을 정의하면 된다. 이렇게 정의한 사용자 정의층은 Sequential API 나 Functional API를 활용할때 하나의 층으로 사용할 수 있다. 만약 Sequential API모듈을 활용한다면 다음과 같이 사용하면 된다.

```python3
from tensorflow.keras import layers

model = tf.keras.Sequential()
model.add(CustomLayer(64,64,10))
```

In [10]:
# !conda install tensorflow -y
import tensorflow as tf
from tensorflow.keras import layers

class CustomLayer(layers.Layer):
    def __init__(self, hidden_dimension, hidden_dimension2, output_dimension):
        self.hidden_dimension = hidden_dimension
        self.hidden_dimension2 = hidden_dimension2
        self.output_dimension = output_dimension
        super(CustomLayer, self).__init__()
    
    def build(self, input_shape):
        self.dense_layer1 = layers.Dense(self.hidden_dimension, activation='relu')
        self.dense_layer2 = layers.Dense(self.hidden_dimension2, activation='relu')
        self.dense_layer3 = layers.Dense(self.output_dimension, activation='softmax')
    
    def call(self, inputs):
        x=self.dense_layer1(inputs)
        x=self.dense_layer2(x)
        
        return self.dense_layer3(x)
    

model = tf.keras.Sequential()
model.add(CustomLayer(64,64,10))
model.build([20,7])   # summary 볼려면 build 해줘야함. input shape은 임의로 넣어줌
model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
custom_layer (CustomLayer)   (20, 10)                  5322      
Total params: 5,322
Trainable params: 5,322
Non-trainable params: 0
_________________________________________________________________


### 4) Subclassing (Custom Model)
자유도가 가장 높은 Subclassing은 tf.keras.Model을 상속받아 구현함. 코드로 보자

```python3
import tensorflow as tf
from tensorflow.keras import layers

class MyModel(tf.keras.Model):
    def __init__(self, hidden_dimension, hidden_dimension2, output_dimension):
        super(MyModel, self).__init__(name='my model')
        self.dense_layer1 = layers.Dense(hidden_dimension,activation='relu')
        self.dense_layer2 = layers.Dense(hidden_dimension2,activation='relu')
        self.dense_layer3 = layers.Dense(output_dimension,activation='softmax')
    
    def call(self, inputs):
        x=self.dense_layer1(inputs)
        x=self.dense_layer2(x)
        
        return self.dense_layer3(x)
```

Layer가 아닌 Model을 상속함으로 이렇게 구현이 가능해진다. build 을 제거해도 되니 편한것같다.

## 모델학습 (+ 검증, 예측 등등)
학습에 대해 권장하는 2가지 방법이있음.  
1. 케라스 내장 API를 사용하는 방법(model.fit(), model.evaluate(), model.predict())
2. GradientTape 객체를 활용해 직접 구현하는 방법

세부적으로 모델을 다룰수 있는점에서 2번이 낫겟지만 일일이 코딩하려면 어렵다. 내장 API를 사용하는 편이 훨씬 간편할것이다. 이책은 내장 API를 주로 활용한다고 한다. GradientTape 을 쓰는 책은 따로 사서 보든지 하자....

앞에서 정의한 모델들은 케라스 모델을 상속했기때문에 메서드만 사용하면 된다.  
가장 먼저 해야할 일은 학습과정을 정의해야한다. 즉 손실함수(loss function), 옵티마이저(optimizer), 평가에 사용될 지표(metric)등을 정의하면 된다.
```python3
model.compile(optimizer=tf.keras.optimizers.Adam(),
    loss=tf.keras.losses.CategorizalCrossentropy(),
    metrics=[tf.keras.metrics.Accuracy()])
```

이제 정의된 모델 객체를 대상으로 학습, 평가, 예측 메서드를 호출하면 정의한 값들을 활용해 학습이 진행된다.
```python3
model.fit(x_train, y_train, batch_size=32, epochs=3)
```

학습과정마다 검증결과를 보는것도 가능하다. validation_data 만 추가하면 된다.
```python3
model.fit(x_train, y_train, batch_size=32, epochs=3
        validation_data=(x_val,y_val))
```
이렇게 하면 학습과 동시에 검증까지 동시에 가능해진다.


# 실습!!!

전체적인 구조를 보자면 입력된 문장을 단어로 나누고 임베딩된 벡터로 바꾼다. 그리고 이 벡터들을 평균해서 하나의 벡터로 만든다.마지막으로 나온 결과값에 시그모이드 함수를 적용해 0~1 사이값을 구한다.

In [1]:
import tensorflow as tf
from tensorflow.keras import preprocessing
from tensorflow.keras import layers
from tensorflow.keras import backend
import numpy as np

samples = ['너 오늘 이뻐 보인다',
          '나는 오늘 기분이 더러워',
          '끝내주는데, 좋은 일이 있나봐',
          '나 좋은 일이 생겼어',
          '아 오늘 진짜 짜증나',
          '환상적인데, 정말 좋은거 같아']

targets =[[1], [0], [1], [1], [0], [1]]

tokenizer = preprocessing.text.Tokenizer()
tokenizer.fit_on_texts(samples)
sequences = tokenizer.texts_to_sequences(samples)
input_sequences = np.array(sequences)
labels = np.array(targets)

word_index = tokenizer.word_index

# 배치 사이즈, 에폭 수, 하이퍼파라미터 등등 정의
batch_size=2
num_epochs=100
vocab_size=len(word_index) + 1
emb_size=128
hidden_dimension=256
output_dimension=1

### 3가지 모델 구축 방법

In [2]:
# Sequential API
model = tf.keras.Sequential([
    layers.Embedding(vocab_size, emb_size, input_length=4),  # 입력값을 embedding 하는 층 추가
    layers.Lambda(lambda x: tf.reduce_mean(x, axis=1)),      
    # 임베딩 된 각 단어의 평균을 구하기위해 lambda를 추가함.
    # lambda 층은 sequential, functional API에서 사용하는 방법.
    # 평균을 내는 계산은 하나의 층으로 정의되지 않기 때문에 lambda를 사용함.
    layers.Dense(hidden_dimension, activation='relu'),
    layers.Dense(output_dimension, activation='sigmoid')
    # 결과값으로 0~1 값을 얻기 위해서 sigmoid를 사용함.
])


In [12]:
# Functional API
inputs = layers.Input(shape=(4,))
embed_ouput=layers.Embedding(vocab_size, emb_size)(inputs)
pooled_output = tf.reduce_mean(embed_ouput, axis=1)
hidden_layer = layers.Dense(hidden_dimension, activation='relu')(pooled_output)
outputs = layers.Dense(output_dimension, activation='sigmoid')(hidden_layer)
model=tf.keras.Model(inputs=inputs, outputs=outputs)


In [7]:
#Subclassing
class CustomModel(tf.keras.Model):
    def __init__(self, vocab_size, embed_dimension, hidden_dimension, output_dimension):
        super(CustomModel, self).__init__(name='my_model')
        self.embedding = layers.Embedding(vocab_size, embed_dimension)
        self.dense_layer = layers.Dense(hidden_dimension, activation='relu')
        self.output_layer = layers.Dense(output_dimension, activation='sigmoid')
        
    def call(self, inputs):
        x=self.embedding(inputs)
        x = tf.reduce_mean(x, axis=1)
        x=self.dense_layer(x)
        x=self.output_layer(x)
        return x

model = CustomModel(vocab_size=vocab_size,
                    embed_dimension=emb_size,
                    hidden_dimension=hidden_dimension,
                    output_dimension=output_dimension
                   )

In [8]:
model.compile(optimizer=tf.keras.optimizers.Adam(0.001),
    loss=tf.keras.losses.BinaryCrossentropy(),           # 이진 분류 문제이므로 binary crossentropy 손실함수
    metrics=[tf.keras.metrics.Accuracy()])              #  이진 분류문제에서 널리 사용되는 accuracy

model.fit(input_sequences, labels, epochs=num_epochs, batch_size=batch_size)
model.summary()

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78