** 케라스 공식 문서 :  https://keras.io/ 

In [2]:
!pip install -q tensorflow-gpu==2.0.0-rc1 # tensorflow 2.0 사용

[K     |████████████████████████████████| 380.5MB 38kB/s 
[K     |████████████████████████████████| 4.3MB 56.7MB/s 
[K     |████████████████████████████████| 501kB 43.7MB/s 
[?25h

# 전처리(Preprocessing)
---

- Tokenizer() : 토큰화와 정수 인코딩을 위해 사용됨

In [6]:
from tensorflow.keras.preprocessing.text import Tokenizer
t = Tokenizer()
fit_text = "The earth is an awsome place live"
t.fit_on_texts([fit_text])

test_text = "The earth is an great place live"
sequences = t.texts_to_sequences([test_text])[0]

print(sequences) # great는 단어 집합에 속하지 않으므로 제외
print(t.word_index) # 단어 집합 전체

[1, 2, 3, 4, 6, 7]
{'the': 1, 'earth': 2, 'is': 3, 'an': 4, 'awsome': 5, 'place': 6, 'live': 7}


- pad_sequence() : 샘플의 길이를 동일하게 하는 패딩 작업.
  - maxlen : 모든 데이터에 대해서 정규화 할 길이
  - padding : 'pre'는 앞에 0을 채우고, 'post'는 뒤에 0을 채운다.

In [10]:
from tensorflow.keras.preprocessing.sequence import pad_sequences
pad_sequences([[1,2,3],[3,4,5,6],[7,8]], maxlen=3, padding='pre') # 3개 데이터를 입력으로 한다.

array([[1, 2, 3],
       [4, 5, 6],
       [0, 7, 8]], dtype=int32)

# 워드 임베딩(Word Embbeding)
---

- 단어를 밀집 벡터로 만드는 작업
> - 원-핫 벡터	// 임베딩 벡터
    - 차원 : 고차원(단어 집합의 크기) //	저차원
    - 다른 표현 :	희소 벡터의 일종	// 밀집 벡터의 일종
    - 표현 방법 :	수동	훈련 // 데이터로부터 학습함
    - 값의 타입 :	1과 0	// 실수
- Embedding() : 정수 인코딩된 단어들을 입력 받아서 임베딩을 수행


In [0]:
## pseudo code
text=[['Hope', 'to', 'see', 'you', 'soon'],['Nice', 'to', 'see', 'you', 'again']]

# 각 단어에 대한 정수 인코딩
text=[[0, 1, 2, 3, 4],[5, 1, 2, 3, 6]]

# 위 데이터가 아래의 임베딩 층의 입력이 된다.
Embedding(7, 2, input_length=5)
# 7은 단어의 개수. 즉, 단어 집합(vocabulary)의 크기이다.
# 2는 임베딩한 후의 벡터의 크기이다.
# 5는 각 입력 시퀀스의 길이. 즉, input_length이다.

# 모델링(Modeling)
---

- Sequential() : 층을 구성하기 위해 사용

In [0]:
## pseudo code
from tensorflow.keras.model import Sequential
from tensorflow.keras.layers import Embedding
model = Sequential()
model.add(Embedding(voca,output_dim,input_length))

- Dense() : 전결합층(fully-connected layer)를 추가

In [11]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
model = Sequential()
model.add(Dense(1,input_dim=3, activation='relu')) # 첫번째 param은 출력 뉴런의 수

Instructions for updating:
If using Keras pass *_constraint arguments to layers.


In [0]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
model = Sequential()
model.add(Dense(8, input_dim=4, activation='relu'))
model.add(Dense(1, activation='sigmoid'))
# 입력 4 -> 은닉 8 -> 츨력 1

- summary : 모델의 정보를 요약해서 보여준다.

# 컴파일(Compile)과 훈련(Training)
---

- compile() : 모델을 기계가 이해할 수 있도록 컴파일. 오차 함수, 최적화 방법, 메트릭 함수를 지정 가능하다.

In [14]:
from tensorflow.keras.layers import SimpleRNN, Embedding, Dense
from tensorflow.keras.models import Sequential
max_feature = 10000

model = Sequential()
model.add(Embedding(max_feature,32))
model.add(SimpleRNN(32))
model.add(Dense(1,activation='sigmoid'))
model.compile(optimizer='rmsprop',loss='binary_crossentropy',metircs=['acc'])

Instructions for updating:
Call initializer instance with the dtype argument instead of passing it to the constructor
Instructions for updating:
Use tf.where in 2.0, which has the same broadcast rule as np.where


- 대표적 손실 함수와 활성 함수의 조합
  - 회귀 문제
    - 손실 함수 : mse
  - 다중 클래스 분류
    - 손실 함수 
      - categorical_crossentropy
      - sparse_categorical_crossentropy : one-hot encoding아닌 정수 인코딩 상태에서도 사용 가능 
    - 출력층의 활성함수 : softmax
  - 이진 분류
    - 손실 함수 : binary_crossentropy
    - 출력층의 활성함수 : sigmoid


- fit() : 모델을 학습

In [0]:
model.fit(X_train,y_train,epochs=10,batch_size=32,verbose=0,validation_data=(X_val,y_val))
# epoch 1은 전체 데이터를 한번 훑고 지나간 것을 뜻함
# 배치 크기는 기본적으로 32이며, 미니 배치 경사 하강법을 사용하고 싶지 않을 때는 batch_size=None으로 설정
# 검증 데이터를 사용하면 각 epoch마다 검증 데이터의 정확도도 함께 출력된다. 검증데이터의 loss가 낮아지다가 높아지면 과적합의 신호.
# validation split : validation_data 대신 사용. 역시 훈련 자체에 영향을 주지 않고 훈련 과정을 지켜보기 위해 사용된다.

# 평가, 예측, 저장
---

- evaluate()
- predict()
- save()
- load()