## 1. Keras 훑어보기

### 1) 전처리 (Preprocessing)

#### Tokenizer
토큰화, 정수 인코딩에 사용

In [1]:
from tensorflow.keras.preprocessing.text import Tokenizer
t = Tokenizer()
fit_text='The earth is an awesome place live'
t.fit_on_texts([fit_text])

test_text = 'The earth is an great place live'
sequences = t.texts_to_sequences([test_text])[0]

print('sequences: ', sequences) # great는 단어 집합에 없어서 출력 x
print('word_index: ', t.word_index) # 단어집합

sequences:  [1, 2, 3, 4, 6, 7]
word_index:  {'the': 1, 'earth': 2, 'is': 3, 'an': 4, 'awesome': 5, 'place': 6, 'live': 7}


#### pad_sequence()
모든 샘플의 길이를 동일하게 맞춰야 할 때 사용     
정해진 기리보다 길면 자르고 짧으면 빈 값을 0으로 채운다.

In [3]:
from tensorflow.keras.preprocessing.sequence import pad_sequences
pad_sequences([[1,2,3],[3,4,5,6],[7,8]], maxlen=3, padding='pre') # pre: 앞을 채움 / post: 뒤를 채움

array([[1, 2, 3],
       [4, 5, 6],
       [0, 7, 8]])

### 2) 워드 임베딩(Word Embedding)
텍스트 내의 단어들을 밀집 벡터(dense vector)로 만드는 것      
- 밀집 벡터: 대부분의 값이 실수이고 원핫인코딩에 비해 상대적으로 저차원!     
              
              
|-|One-hot Vector|Embedding Vector|
|---|---|---|
|차원|고차원(단어 집합의 크기만큼)|저차원|
|다른 표현|sparse vector의 일종|dense vector의 일종|
|표현 방법|수동|훈련 데이터로부터 학습|
|값의 타입|1 또는 0|실수|           
                 
    - 워드 임베딩 과정을 통해 얻어진다
    - 주로 256, 512, 1024 등의 차원
    - 초기값은 랜덤 -> 인공 신경망같이 학습되면서 변경됨.
                  
- Embedding(): 단어를 밀집 벡터로 만드는 역할.       
정수 인코딩이 된 단어들을 받아서 임베딩을 수행한다.       
(number of samples, input_length)인 2D 정수 텐서를 입력으로 받음 => (number of samples, input_length, embedding word dimensionality)인 3D텐서를 return      
Ex)        
```python
Embedding(7,2,input_length=5)      
```
    - 7: 단어 집합의 크기
    - 2: 임베딩한 후 벡터의 크기
    - 5: 각 입력 시퀀스의 길이

### 3) 모델링(Modeling)

#### Sequential()
입력층, 은닉층, 출력층, 임베딩 층 등의 층을 구성하기 위해 사용.             
Sequential()로 모델 선언 뒤 model.add()로 층을 단계적으로 추가한다.      
```python
from tensorflow.keras.models. import Sequential
model = Sequential()
model.add(추가할 층)
model.add(추가할 층)
model.add(추가할 층)
```

#### Dense()
fully connected layer를 추가. -> model.add()를 이용       
                
Ex1)
```python
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
model = Sequential()
model.add(Dense(1, input_dim=3, activation='relu')
```
![image.png](attachment:image.png)
Dense의 인자들        
- 첫번째 인자: 출력 뉴런의 수
- input_dim: 입력 차원
- activation: 활성화 함수
    - linear: 디폴트값. 활성화함수 없이 가중치 계산 결과 출력
    - sigmoid: 이진분류에 사용
    - softmax: 다중 클래스 분류 문제에서 주로 사용
    - relu: 은닉층에 주로 사용
                      
                      
Ex2) Dense()를 두번 사용: 첫번째 dense 층이 은닉층이 됨. 
```python
model = Sequential()
model.add(Dense(8, input_dim=4, activation='relu'))
model.add(Dense(1, activation='sigmoid'))
```
![image-2.png](attachment:image-2.png)

#### summary()
모델의 정보를 요약

### 4) Compile, Training

#### compile()
모델을 기계가 이해할 수 있도록 컴파일함. 오차 함수, 최적화 방법, 메트릭 함수를 선택할 수 있다          
Ex) RNN 모델 compile
```python
from tensorflow.keras.layers import SimpleRNN, Embedding, Dense
from tensorflow.keras.models import Sequential
max_features = 10000

model = Sequential()
model.add(Embedding(max_features, 32))
model.add(SimpleRNN(32)) 
model.add(Dense(1, activation='sigmoid'))
model.compile(optimizer='rmsprop', loss='binary_crossentropy', metrics=['acc'])
```
- optimizer: 'rmsprop', 'adam', 'sgd' 등
- loss: 손실함수
- metrics: 훈련을 모니터링 하기 위한 지표
                 
대표적인 손실 함수와 활성화 함수 조합           
                   
|문제유형|손실 함수명|출력층의 활성화함수|
|---|---|---|
|회귀문제|mean_squared_error(평균 제곱 오차)|-|
|다중클래스분류|categorical_crossentrop(원핫 인코딩 상태일때))|소프트맥스|
|다중클래스분류|sparse_categorical_crossentropy(정수 인코딩 상태에서 수행가능)|소프트맥스|
|이진분류|binary_crossentropy|시그모이드|

#### fit
모델 학습
```python
model.fit(X_train, y_train, epochs=10, batch_size=32, verbose=0, validation_data(X_val, y_val))
```
- epoch: 총 훈련횟수
- batch_size: 배치 크기. default:32 / 미니배치 경사하강법을 안쓸 때는 None
- validation_split: 별도로 validation set을 사용 안하고, train에서 일정 비율을 분리해서 검증 데이터로 사용함.
- verbose: 학습 중 출력되는 문구. 
    - 0: 아무것도 출력 x
    - 1: 진행 막대로 훈련의 진행도를 볼 수 있음.
    - 2: 미니배치마다 손실 정보를 출력

### 5) 평가와 예측

#### evaluate()
학습한 모델의 정확도를 평가
```python
model.evaluate(X_text, y_text, batch_size=32)
```
             
#### predict()
임의의 입력에 대한 모델의 출력값 확인
```python
model.predict(X_input, batch_size=32)
```

### 6) 모델 저장, 로드

#### save()
인공신경망 모델을 hdf5 파일에 저장
```python
model.save('model_name.h5')
```
            
#### load_model()
저장해둔 모델을 불러옴
```python
from tensorflow.keras.models import load_model
model = load.model("model_name.h5")
```