# About Keras

keras는 딥러닝 API이다. Tensorflow 기반으로 작동하는. 빠른 실험에 초점을 둔 라이브러리. 

## First contact with Keras

keras의 core data structure는 layers와 models이다. 가장 간단한 형태의 model이 Sequential model(linear stack of layers)이다. 더 복잡한 구조는 Keras functional API를 사용해야한다.

#### Sequential model

In [None]:
from tensorflow.keras.models import Sequential

model = Sequential()

#### Stacking layers is as easy as -> .add()

In [None]:
from tensorflow.keras.layers import Dense

model.add(Dense(units=64, activation='relu'))
model.add(Dense(units=10, activation='softmax'))

#### Once your model looks good, configure its learning process -> .compile()

In [7]:
model.compile(loss='categorical_crossentropy',
              optimizer='sgd',
              metrics=['accuracy'])

# Introduction to Keras for Engineers

1. model을 training하기 전에 데이터를 어떨게 준비해야하는지(데이터를 Numpy 혹은 tf.data.Dataset으로 설정)
2. data preprocessing하기
3. data를 유용한 형태로 바꿔서 model을 만들기(Keras Functional API를 사용해서)
4. model을 훈련시키기. fit() 메소드를 활용해서.
5. 모델 평가하기.
6. speed up하기.
7. model을 정제하기.

#### Data loading & preprocessing

Neural networks는 raw data를 처리하지 않는다. vectorized, standardized 데이터를 이용해야한다.

Text file -> string tensors-split into words-word indexing-turn into integer tensors.
Images -> integer tensors-floating point-normalized to small values(0 to 1)
CSV data -> parsed

### Data loading

keras model들은 3가지 inputs만 받는다.
1. Numpy arrays
2. Tensorflow Dataset objects
3. Python generators

model training을 시키기 전에 당신의 데이터를 3개 중에 하나의 형태로 바꿔야한다. 만약 대용량의 데이터나 GPU를 통해서 training할 경우 2번 방법을 이용하는 것이 좋다. 

2번의 data loading method
-tf.keras.preprocessing.image_dataset_from_directory: image 파일을 class-specific 폴더로 labeling 시킴.
-tf.keras.preprocessing.text_dataset_from_directory: text 파일 로딩
-tf.data.experimental.make_csv_dataset: csv 파일 로딩

##### example-image

suppose image files' path.

In [None]:
main_directory/
...class_a/
......a_image_1.jpg
......a_image_2.jpg
...class_b/
......b_image_1.jpg
......b_image_2.jpg

그러면 image파일을 loadin할때

In [None]:
# Create a dataset.
dataset = keras.preprocessing.image_dataset_from_directory(
  'path/to/main_directory', batch_size=64, image_size=(200, 200))
#batch_size는 몇개의 샘플로 가중치를 갱신할 것인지 설정 = 몇개의 샘플을 테스트할지

# For demonstration, iterate over the batches yielded by the dataset.
for data, labels in dataset:
   print(data.shape)  # (64, 200, 200, 3)
   print(data.dtype)  # float32
   print(labels.shape)  # (64,)
   print(labels.dtype)  # int32

##### example-text

.txt 파일을 가지고 있을 때

In [None]:
dataset = keras.preprocessing.text_dataset_from_directory(
  'path/to/main_directory', batch_size=64)

# For demonstration, iterate over the batches yielded by the dataset.
for data, labels in dataset:
   print(data.shape)  # (64,)
   print(data.dtype)  # string
   print(labels.shape)  # (64,)
   print(labels.dtype)  # int32