* 케라스는 유저가 손쉽게 딥 러닝을 구현할 수 있도록 도와주는 상위 레벨의 인터페이스

## 1. 전처리(Preprocessing)
**Tokenizer()** : 토큰화와 정수 인코딩(단어에 대한 인덱싱)을 위해 사용

In [1]:
import warnings
warnings.filterwarnings('ignore')

from tensorflow.keras.preprocessing.text import Tokenizer

t = Tokenizer()
fit_text = "The earth is an awesome place to live"
t.fit_on_texts([fit_text])

test_text = "The earth is an great place to live"
sequences = t.texts_to_sequences([test_text])[0]

print('sequences :', sequences) # great는 단어 집합(vocabulary)에 없으므로 출력되지 않는다.
print("word_index : ",t.word_index) # 단어 집합(vocabulary) 출력

sequences : [1, 2, 3, 4, 6, 7, 8]
word_index :  {'the': 1, 'earth': 2, 'is': 3, 'an': 4, 'awesome': 5, 'place': 6, 'to': 7, 'live': 8}


**pad_sequences()** : 전체 훈련 데이터에서 각 샘플의 길이는 서로 다를 수 있다. 

모델의 입력으로 사용하려면 모든 샘플의 길이를 동일하게 맞춰야 할 때가 있다. => 패딩(padding) 작업

보통 숫자 0을 넣어서 길이가 다른 샘플의 길이를 맞춰준다.

In [2]:
from tensorflow.keras.preprocessing.sequence import pad_sequences

pad_sequences([[1, 2, 3], [3, 4, 5, 6], [7, 8]], maxlen=3, padding='pre')
# 전처리가 끝나서 각 단어에 대한 정수 인코딩이 끝났다고 가정하고, 3개의 데이터를 입력으로 한다.

array([[1, 2, 3],
       [4, 5, 6],
       [0, 7, 8]])

## 2. 워드 임베딩(Word Embedding)
* 워드 임베딩이란 텍스트 내의 단어들을 밀집 벡터(dense vector)로 만드는 것
* 원-핫 벡터의 차원이 주로 20,000 이상을 넘어가는 것과는 달리 임베딩 벡터는 주로 256, 512, 1024 등의 차원을 가진다.
* 임베딩 벡터는 초기에는 랜덤값을 가지지만, 인공 신경망의 가중치가 학습되는 방법과 같은 방식으로 값이 학습되며 변경된다.
* **Embedding()** 
    * 단어를 밀집 벡터로 만드는 역할
    * 인공 신경망 용어로는 임베딩 층(embedding layer)을 만드는 역할
    * 정수 인코딩이 된 단어들을 입력 받아서 임베딩 수행
    * (number of samples, input_length)인 2D 정수 텐서를 입력받는다. 이 때 각 sample은 정수 인코딩이 된 결과로 정수의 시퀀스이다.
    * 워드 임베딩 작업을 수행 후, (number of samples, input_length, embedding word dimensionality)인 3D 텐서 리턴

In [None]:
# 문장 토큰화와 단어 토큰화
text=[['Hope', 'to', 'see', 'you', 'soon'],['Nice', 'to', 'see', 'you', 'again']]

# 각 단어에 대한 정수 인코딩
text=[[0, 1, 2, 3, 4],[5, 1, 2, 3, 6]]

# 위 데이터가 아래의 임베딩 층의 입력이 된다.
Embedding(7, 2, input_length=5)
# 7은 단어의 개수. 즉, 단어 집합(vocabulary)의 크기이다.
# 2는 임베딩한 후의 벡터의 크기이다.
# 5는 각 입력 시퀀스의 길이. 즉, input_length이다.

# 각 정수는 아래의 테이블의 인덱스로 사용되며 Embeddig()은 각 단어에 대해 임베딩 벡터를 리턴한다.
+-----------+-----------+
|   index    | embedding  |
+------------+----------+
|     0      | [1.2, 3.1] |
|     1      | [0.1, 4.2] |
|     2      | [1.0, 3.1] |
|     3      | [0.3, 2.1] |
|     4      | [2.2, 1.4] |
|     5      | [0.7, 1.7] |
|     6      | [4.1, 2.0] |
+-----------+------------+
# 위의 표는 임베딩 벡터가 된 결과를 예로서 정리한 것이고 Embedding()의 출력인 3D 텐서를 보여주는 것이 아님.

## 3. 모델링(Modeling)
**Sequential()** : 인공 신경망에서 입력층, 은닉층, 출력층을 구성하기 위해 사용

Sequential()을 model로 선언한 뒤에 model.add()라는 코드를 통해 층을 단계적으로 추가

```from tensorflow.keras.models import Sequential```

```model = Sequential()```

```model.add()```

```model.add()```

Embedding()을 통해 생성하는 임베딩 층(embedding layer) 또한 인공 신경망의 층의 하나이므로 model.add()로 추가

```from tensorflow.keras.models import Sequential```

```model = Sequential()```

```model.add(Embedding(vocabulary, output_dim, input_length))```

**Dense()** : 전결합층(fully-conntected layer) 추가

```from tensorflow.keras.models import Sequential```

```from tensorflow.keras.layers import Dense```

```model = Sequential()```

```model.add(Dense(1, input_dim=3, activation='relu'))```
* 첫번째 인자 = 출력 뉴런의 수
* input_dim = 입력 뉴런의 수 (입력의 차원)
* activation = 활성화 함수

In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
model = Sequential()
model.add(Dense(8, input_dim=4, activation='relu'))
model.add(Dense(1, activation='sigmoid')) # 출력층

이번에는 Dense()가 두번 사용

첫 번째 사용된 Dense()의 8은 더 이상 출력층의 뉴런이 아니라 은닉층의 뉴런이다.

두 번째 Dense()는 input_dim 인자가 없지만 이전층의 뉴런의 수가 8이라는 것을 알고 있다.

**summary()**: 모델의 정보 요약

```model.summary()``` # 위의 코드 연장선 상에 있는 코드

## 4. 컴파일(Compile)과 훈련(Training)
**compile()** : 모델을 기계가 이해할 수 있도록 컴파일, 오차 함수와 최적화 방법, 메트릭 함수 선택

In [None]:
from tensorflow.keras.layers import SimpleRNN, Embedding, Dense
from tensorflow.keras.models import Sequential
max_features = 10000

model = Sequential()
model.add(Embedding(max_features, 32))
model.add(SimpleRNN(32))
model.add(Dense(1, activation='sigmoid'))
model.compile(optimizer='rmsprop', loss='binary_crossentropy', metrics=['acc'])

* optimizer : 훈련 과정을 설정하는 옵티마이저 설정
* loss : 훈련 과정에서 사용할 손실 함수(loss function) 설정
* metrics : 훈련을 모니터링하기 위한 지표 선택

<대표적으로 사용되는 손실 함수와 활성화 함수의 조합>

문제유형     |                  손실 함수명                   | 활성화함수명

  회귀문제         | mean_squared_error(평균 제곱 오차)             | -

  다중 클래스 분류 | categorical_crossentropy(범주형 교차 엔트로피) | 소프트맥스

다중 클래스 분류 | sparse_categorical_crossentropy                | 소프트맥스

이진 분류        | binary_crossentropy(이항 교차 엔트로피)        | 시그모이드

**fit()** : 모델 학습, 모델이 오차로부터 매개 변수를 업데이트 시키는 과정을 학습, 훈련, 또는 적합(fitting)

In [None]:
# 위의 compile() 코드의 연장 선상에 있는 코드
model.fit(X_train, y_train, epochs=10, batch_size=32)

* 훈련 데이터, 레이블 데이터, 에포크(총 훈련 횟수), 배치 크기(기본값은 32, 미니 매치 경사 하강법을 사용하고 싶지 않을 경우 batch_size=None)

In [None]:
# 좀 더 많은 인자를 사용하는 경우
model.fit(X_train, y_train, epochs=10, batch_size=32, verbose=0, validation_data(X_val, y_val))

* **validation_data(X_val, y_val)** : 
    * 검증 데이터(validation data)를 사용
    * 검증 데이터를 사용하면 각 에포크마다 검증 데이터의 정확도도 함께 출력된다.
    * 실제로 모델이 검증 데이터를 학습하지는 않는다.
    * 검증 데이터의 loss가 낮아지다가 높아지기 시작하면 이는 과적합(overfitting)의 신호이다.

* **validation_split** :
    * validation_data 대신 사용
    * X_train과 y_train에서 일정 비율을 분리하여 이를 검증 데이터로 사용
    * 이 또한 학습하지 않고 훈련 과정을 지켜보는 용도로 사용

* **verbose** : 학습 중 출력되는 문구를 설정
    * 0 : 아무 것도 출력하지 않는다.
    - 1 : 훈련의 진행도를 보여주는 진행 막대를 보여준다.
    - 2 : 미니 배치마다 손실 정보를 출력

In [None]:
# 훈련 데이터의 20%를 검증 데이터로 사용.
model.fit(X_train, y_train, epochs=10, batch_size=32, verbose=0, validation_split=0.2))

In [None]:
# verbose = 1일 경우.
Epoch 88/100
7/7 [==============================] - 0s 143us/step - loss: 0.1029 - acc: 1.0000
        
# verbose = 2일 경우.
Epoch 88/100
 - 0s - loss: 0.1475 - acc: 1.0000

## 5. 평가(Evaluation)와 예측(Prediction)
**evaluate()** : 테스트 데이터를 통해 학습한 모델에 대한 정확도 평가

In [None]:
# 위의 fit() 코드의 연장선상인 코드
model.evaluate(X_test, y_test, batch_size=32)

* 첫번째 인자 = 테스트 데이터
* 두번째 인자 = 레이블 테스트 데이터
* batch_size = 배치 크기


**predict()** : 임의의 입력에 대한 모델의 출력값을 확인

In [None]:
# 위의 fit() 코드의 연장선상인 코드
model.predict(X_input, batch_size=32)

* 첫번째 인자 = 예측하고자 하는 데이터
* batch_size = 배치 크기

## 6. 모델의 저장(Save)과 로드(Load)
*구현한 모델을 저장하고 불러오는 일은 중요하다.*

**save()** : 인공 신경망 모델을 hdf5 파일에 저장

**load_model()** : 저장해둔 모델을 불러오기

In [None]:
model.save("model_name.h5")

from tensorflow.keras.models import load_model
model = load_model("model_name.h5")