# 케라스(Keras) 훑어보기

### 전처리(Preprocessing)

##### Tokenizer() : 토큰화와 정수 인코딩(단어에 대한 인덱싱)을 위해 사용됩니다.

In [None]:
from tensorflow.keras.preprocessingrocessing.text import Tokenizer

In [None]:
t = Tokenizer()
fit_text = "The earth is an awesome place live"
t.fit_on_texts([fit_text])

test_text = "The earth is an great place live"
sequences = t.texts_to_sequences([test_text])[0]

# great는 단어 집합(vocabulary)에 없으므로 출력되지 않는다.
print("sequences : ",sequences)
# 단어 집합(vocabulary) 출력
print("word_index : ",t.word_index)

##### pad_sequence() : 패딩(padding) 작업이라고 하는데, 보통 숫자 0을 넣어서 길이가 다른 샘플들의 길이를 맞춰줍니다.

In [None]:
from tensorflow.keras.preprocessing.sequence import pad_sequences
pad_sequences([[1, 2, 3], [3, 4, 5, 6], [7, 8]], maxlen=3, padding='pre')

첫번째 인자 = 패딩을 진행할 데이터  
maxlen = 모든 데이터에 대해서 정규화 할 길이  
padding = 'pre'를 선택하면 앞에 0을 채우고 'post'를 선택하면 뒤에 0을 채움.

# 케라스의 함수형 API(Keras Functional API)

### sequential API로 만든 모델

In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

In [None]:
model = Sequential()
model.add(Dense(3, input_dim=4, activation='softmax'))

### functional API로 만든 모델

#### 1) 전결합 피드 포워드 신경망(Fully-connected FFNN)

In [None]:
from tensorflow.keras.layers import Input, Dense
from tensorflow.keras.models import Model
# 텐서를 리턴한다.
# 10개의 입력을 받는 입력층
inputs = Input(shape=(10,))
# 전결합층, 활성함수 = relu
hidden1 = Dense(64, activation='relu')(inputs)
hidden2 = Dense(64, activation='relu')(hidden1)
output = Dense(1, activation='sigmoid')(hidden2)
model = Model(inputs=inputs, outputs=output)

 - Input() 함수에 입력의 크기를 정의합니다.

 - 이전층을 다음층 함수의 입력으로 사용하고, 변수에 할당합니다.

 - Model() 함수에 입력과 출력을 정의합니다.

In [None]:
model.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])
model.fit(data, labels)

변수명을 달리해서 FFNN을 만들어보겠습니다.  
이번에는 은닉층과 출력층의 변수를 전부 x로 통일

In [None]:
inputs = Input(shape=(10,))
x = Dense(8, activation="relu")(inputs)
x = Dense(4, activation="relu")(x)
x = Dense(1, activation="linear")(x)
model = Model(inputs, x)

#### 2) 선형 회귀(Linear Regression)

In [4]:
from tensorflow.keras.layers import Input, Dense
from tensorflow.keras.models import Model

inputs = Input(shape=(3,))
output = Dense(1, activation='linear')(inputs)
linear_model = Model(inputs, output)

linear_model.compile(optimizer='sgd', loss='mse')
linear_model.fit(x=dat_test, y=y_cts_test, epochs=50, verbose=0)
linear_model.fit(x=dat_test, y=y_cts_test, epochs=1, verbose=1)

NameError: name 'dat_test' is not defined

#### 3) 로지스틱 회귀(Logistic Regression)

In [None]:
from tensorflow.keras.layers import Input, Dense
from tensorflow.keras.models import Model

inputs = Input(shape=(3,))
output = Dense(1, activation='sigmoid')(inputs)
logistic_model = Model(inputs, output)

logistic_model.compile(optimizer='sgd', loss = 'binary_crossentropy', metrics=['accuracy'])
logistic_model.optimizer.lr = 0.001
logistic_model.fit(x=dat_train, y=y_classifier_train, epochs = 5, validation_data = (dat_test, y_classifier_test))

#### 4) 다중 입력을 받는 모델(model that accepts multiple inputs)

In [None]:
# 최종 완성된 다중 입력, 다중 출력 모델의 예
model=Model(inputs=[a1, a2], outputs=[b1, b2, b3]

In [None]:
from tensorflow.keras.layers import Input, Dense, concatenate
from tensorflow.keras.models import Model

# 두 개의 입력층을 정의
inputA = Input(shape=(64,))
inputB = Input(shape=(128,))

# 첫번째 입력층으로부터 분기되어 진행되는 인공 신경망을 정의
x = Dense(16, activation="relu")(inputA)
x = Dense(8, activation="relu")(x)
x = Model(inputs=inputA, outputs=x)

# 두번째 입력층으로부터 분기되어 진행되는 인공 신경망을 정의
y = Dense(64, activation="relu")(inputB)
y = Dense(32, activation="relu")(y)
y = Dense(8, activation="relu")(y)
y = Model(inputs=inputB, outputs=y)

# 두개의 인공 신경망의 출력을 연결(concatenate)
result = concatenate([x.output, y.output])

# 연결된 값을 입력으로 받는 밀집층을 추가(Dense layer)
z = Dense(2, activation="relu")(result)
# 선형 회귀를 위해 activation=linear를 설정
z = Dense(1, activation="linear")(z)

# 결과적으로 이 모델은 두 개의 입력층으로부터 분기되어 진행된 후 마지막에는 하나의 출력을 예측하는 모델이 됨.
model = Model(inputs=[x.input, y.input], outputs=z)

#### 5) RNN(Recurrence Neural Network) 은닉층 사용하기

In [None]:
from tensorflow.keras.layers import Input, Dense, LSTM
from tensorflow.keras.models import Model
inputs = Input(shape=(50,1))
lstm_layer = LSTM(10)(inputs) # RNN의 일종인 LSTM을 사용
x = Dense(10, activation='relu')(lstm_layer)
output = Dense(1, activation='sigmoid')(x)
model = Model(inputs=inputs, outputs=output)

#### 6) 다르게 보이지만 동일한 표기

In [None]:
encoder = Dense(128)(input)

In [None]:
encoder = Dense(128)
encoder(input)