# Keras

( https://keras.io/ or https://www.tensorflow.org/guide/keras?hl=ko )

### Preprocessing

In [2]:
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences

`Tokenizer()` : 토큰화와 정수 인코딩을 위해 사용함
    
    - 훈련 데이터로부터 단어 집합을 생성하고, 해당 단어 집합으로 임의의 문장을 정수 인코딩함

In [5]:
tokenizer = Tokenizer()
train_text = 'The earth is an awesome place live'

# 단어 집합 생성
tokenizer.fit_on_texts([train_text])

#정수 인코딩
sub_text = 'The earth is an great place live'
sequences = tokenizer.texts_to_sequences([sub_text])[0]

In [6]:
print(f" 정수 인코딩 : {sequences}")
print(f" 단어 집합 : {tokenizer.word_index}")

 정수 인코딩 : [1, 2, 3, 4, 6, 7]
 단어 집합 : {'the': 1, 'earth': 2, 'is': 3, 'an': 4, 'awesome': 5, 'place': 6, 'live': 7}


    ->  'greate'는 단어 집합(vocabulary)에 없어서 출력되지 않음
 

`pad_sequences(패딩을 진행할 데이터, maxlen='정규화할 길이', padding='pre'면 앞에, 'post'면 뒤에 0을 채움)` 

    - 전체 훈련 데이터에서 각 샘플의 데이터가 서로 다를 수 있음
    - 모델의 입력으로 사용하려면 모든 샘플의 길이를 동일하게 만들어야 하는데, 자연어 처리의 패딩(padding) 작업
    - 숫자 0을 넣어서 길이가 다른 샘플들의 길이를 맞춰줌
    - 정해진 길이보다 길이가 길면 일부자르고, 정해준 길이보다 짧으면 0으로 채움
    

In [11]:
pad_sequences([[1,2,3], [3,4,5,6], [7,8]], maxlen=3, padding='pre')

array([[1, 2, 3],
       [4, 5, 6],
       [0, 7, 8]])

## word embedding

    - embedding : 텍스트 내의 단어들을 밀집벡터(dense vector)로 만드는 것
                : 상대적으로 저차원을 가지며 모든 원소의 값이 실수임
    - one-hot vector : 대부분 0의 값, 하나의 1의 값을 가지는 벡터 (차원이 대체적으로 큼)
                     : one-hot vector는 단어 집합의 크기만큼 벡터의 차원을 가지고, 단어 벡터 간의 유의미한 유사도 구할 수 없음
                     
    

`embedding(단어집합의크기[총 단어 개수], 임베딩 벡터의 출력 차원, 입력 시퀀스의 길이)`

    - 단어를 밀집 벡터로 만듦.
    - 임베딩 층(embedding layer)를 만드는 역할을 함
    - 정수 인코딩이 된 단어들을 입력받아서 임베딩을 수행함
    

## 모델링(Modeling)

`Sequential()`

    - 인공신경망의 층 구성

In [12]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

model = Sequential()
model.add(Dense(1, input_dim=3, activation='relu'))

In [13]:
model = Sequential()
model.add(Dense(8, input_dim=4, activation='relu'))
model.add(Dense(1, activation='sigmoid'))

In [14]:
model.summary()

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_1 (Dense)             (None, 8)                 40        
                                                                 
 dense_2 (Dense)             (None, 1)                 9         
                                                                 
Total params: 49
Trainable params: 49
Non-trainable params: 0
_________________________________________________________________


# 컴파일(complie)과 훈련(Training)

In [15]:
from tensorflow.keras.layers import SimpleRNN, Embedding, Dense
from tensorflow.keras.models import Sequential

vocab_size=1000
embedding_dim=32
hidden_units=32

model = Sequential()
model.add(Embedding(vocab_size, embedding_dim))
model.add(SimpleRNN(hidden_units))
model.add(Dense(1, activation='sigmoid'))
model.compile(optimizer='rmsprop', loss='binary_crossentropy', metrics=['acc'])

# Functional API (함수형 API)

`Sequential API`

In [16]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

In [17]:
model = Sequential()
model.add(Dense(3, input_dim=4, activation='softmax'))

`Functional API`


    - 입력 데이터 크기(shape)를 인자로 입력층을 정의해 주어야 함

In [19]:
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Input, Dense

In [21]:
inputs = Input(shape=(10,))
hidden1 = Dense(64, activation='relu')(inputs)
hidden2 = Dense(64, activation='relu')(hidden1)
output = Dense(1, activation='sigmoid')(hidden2)

model = Model(inputs=inputs, outputs=output)

    - input() 함수에 입력의 크기 정의
    - 이전층을 다음층 함수의 입력으로 사용하고, 변수에 할당
    - Model() 함수에 입력과 출력 정의

In [23]:
model.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])

FFNN 

In [24]:
inputs = Input(shape=(10,))
x = Dense(8, activation='relu')(inputs)
x = Dense(4, activation='relu')(x)
x = Dense(1, activation='linear')(x)
model = Model(inputs, x)

# Linear Regression - Functional API

In [25]:
from tensorflow.keras.layers import Input, Dense
from tensorflow.keras.models import Model
from tensorflow.keras import optimizers

In [26]:
X = [1,2,3,4,5,6,7,8,9]
y = [11,22,33,44,54,66,77,87,95]

inputs = Input(shape=(1,))
output = Dense(1, activation='linear')(inputs)
linear_model = Model(inputs, output)

sgd = optimizers.SGD(lr=0.01)

linear_model.compile(optimizer=sgd, loss='mse', metrics=['mse'])
linear_model.fit(X, y, epochs=300)

Epoch 1/300


  super().__init__(name, **kwargs)


Epoch 2/300
Epoch 3/300
Epoch 4/300
Epoch 5/300
Epoch 6/300
Epoch 7/300
Epoch 8/300
Epoch 9/300
Epoch 10/300
Epoch 11/300
Epoch 12/300
Epoch 13/300
Epoch 14/300
Epoch 15/300
Epoch 16/300
Epoch 17/300
Epoch 18/300
Epoch 19/300
Epoch 20/300
Epoch 21/300
Epoch 22/300
Epoch 23/300
Epoch 24/300
Epoch 25/300
Epoch 26/300
Epoch 27/300
Epoch 28/300
Epoch 29/300
Epoch 30/300
Epoch 31/300
Epoch 32/300
Epoch 33/300
Epoch 34/300
Epoch 35/300
Epoch 36/300
Epoch 37/300
Epoch 38/300
Epoch 39/300
Epoch 40/300
Epoch 41/300
Epoch 42/300
Epoch 43/300
Epoch 44/300
Epoch 45/300
Epoch 46/300
Epoch 47/300
Epoch 48/300
Epoch 49/300
Epoch 50/300
Epoch 51/300
Epoch 52/300
Epoch 53/300
Epoch 54/300
Epoch 55/300
Epoch 56/300
Epoch 57/300
Epoch 58/300
Epoch 59/300
Epoch 60/300
Epoch 61/300
Epoch 62/300
Epoch 63/300
Epoch 64/300
Epoch 65/300
Epoch 66/300
Epoch 67/300
Epoch 68/300
Epoch 69/300
Epoch 70/300
Epoch 71/300
Epoch 72/300
Epoch 73/300
Epoch 74/300
Epoch 75/300
Epoch 76/300
Epoch 77/300
Epoch 78/300
Epoch 7

Epoch 90/300
Epoch 91/300
Epoch 92/300
Epoch 93/300
Epoch 94/300
Epoch 95/300
Epoch 96/300
Epoch 97/300
Epoch 98/300
Epoch 99/300
Epoch 100/300
Epoch 101/300
Epoch 102/300
Epoch 103/300
Epoch 104/300
Epoch 105/300
Epoch 106/300
Epoch 107/300
Epoch 108/300
Epoch 109/300
Epoch 110/300
Epoch 111/300
Epoch 112/300
Epoch 113/300
Epoch 114/300
Epoch 115/300
Epoch 116/300
Epoch 117/300
Epoch 118/300
Epoch 119/300
Epoch 120/300
Epoch 121/300
Epoch 122/300
Epoch 123/300
Epoch 124/300
Epoch 125/300
Epoch 126/300
Epoch 127/300
Epoch 128/300
Epoch 129/300
Epoch 130/300
Epoch 131/300
Epoch 132/300
Epoch 133/300
Epoch 134/300
Epoch 135/300
Epoch 136/300
Epoch 137/300
Epoch 138/300
Epoch 139/300
Epoch 140/300
Epoch 141/300
Epoch 142/300
Epoch 143/300
Epoch 144/300
Epoch 145/300
Epoch 146/300
Epoch 147/300
Epoch 148/300
Epoch 149/300
Epoch 150/300
Epoch 151/300
Epoch 152/300
Epoch 153/300
Epoch 154/300
Epoch 155/300
Epoch 156/300
Epoch 157/300
Epoch 158/300
Epoch 159/300
Epoch 160/300
Epoch 161/300
Ep

Epoch 177/300
Epoch 178/300
Epoch 179/300
Epoch 180/300
Epoch 181/300
Epoch 182/300
Epoch 183/300
Epoch 184/300
Epoch 185/300
Epoch 186/300
Epoch 187/300
Epoch 188/300
Epoch 189/300
Epoch 190/300
Epoch 191/300
Epoch 192/300
Epoch 193/300
Epoch 194/300
Epoch 195/300
Epoch 196/300
Epoch 197/300
Epoch 198/300
Epoch 199/300
Epoch 200/300
Epoch 201/300
Epoch 202/300
Epoch 203/300
Epoch 204/300
Epoch 205/300
Epoch 206/300
Epoch 207/300
Epoch 208/300
Epoch 209/300
Epoch 210/300
Epoch 211/300
Epoch 212/300
Epoch 213/300
Epoch 214/300
Epoch 215/300
Epoch 216/300
Epoch 217/300
Epoch 218/300
Epoch 219/300
Epoch 220/300
Epoch 221/300
Epoch 222/300
Epoch 223/300
Epoch 224/300
Epoch 225/300
Epoch 226/300
Epoch 227/300
Epoch 228/300
Epoch 229/300
Epoch 230/300
Epoch 231/300
Epoch 232/300
Epoch 233/300
Epoch 234/300
Epoch 235/300
Epoch 236/300
Epoch 237/300
Epoch 238/300
Epoch 239/300
Epoch 240/300
Epoch 241/300
Epoch 242/300
Epoch 243/300
Epoch 244/300
Epoch 245/300
Epoch 246/300
Epoch 247/300
Epoch 

Epoch 264/300
Epoch 265/300
Epoch 266/300
Epoch 267/300
Epoch 268/300
Epoch 269/300
Epoch 270/300
Epoch 271/300
Epoch 272/300
Epoch 273/300
Epoch 274/300
Epoch 275/300
Epoch 276/300
Epoch 277/300
Epoch 278/300
Epoch 279/300
Epoch 280/300
Epoch 281/300
Epoch 282/300
Epoch 283/300
Epoch 284/300
Epoch 285/300
Epoch 286/300
Epoch 287/300
Epoch 288/300
Epoch 289/300
Epoch 290/300
Epoch 291/300
Epoch 292/300
Epoch 293/300
Epoch 294/300
Epoch 295/300
Epoch 296/300
Epoch 297/300
Epoch 298/300
Epoch 299/300
Epoch 300/300


<keras.callbacks.History at 0x2025ae3a700>


# Logistic Regression

In [27]:
from tensorflow.keras.layers import Input, Dense
from tensorflow.keras.models import Model

In [28]:
inputs = Input(shape=(3,))
output = Dense(1, activation='sigmoid')(inputs)
logistic_model = Model(inputs, output)

# model that accepts multiple inputs

In [31]:
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Input, Dense, concatenate

In [35]:
inputA = Input(shape=(64,))
inputB = Input(shape=(128,))

x = Dense(16, activation='relu')(inputA)
x = Dense(8, activation='relu')(x)
x = Model(inputs= inputA, outputs=x)

y = Dense(64, activation='relu')(inputB)
y = Dense(32, activation='relu')(y)
y = Dense(8, activation='relu')(y)
y = Model(inputs=inputB, outputs=y)

result = concatenate([x.output, y.output])

z = Dense(2, activation='relu')(result)
z = Dense(1, activation='linear')(z)

model = Model(inputs=[x.input, y.input], outputs=z)

# RNN 