ch1. 케라스 시작하기
------

## 1.1 케라스 설치

- **!pip install keras==2.0.5**
- 책은 keras 2.0.5를 기준으로 설명됨
- 학습은 macOS high sierra 환경에서 docker로 jupyter를 실행시켜서 하였음
- 1.3 이전까지 내용 생략

## 1.3 케라스 사용

#### 1.3.1 실습 내용 소개

- 간단한 예측 실습
- 단순 선형 예측 모델

#### 1.3.2 텍스트 모드 실습

In [1]:
import keras
import numpy as np

Using TensorFlow backend.


In [2]:
x = np.array([0, 1, 2, 3, 4])
y = x * 2 + 1

In [3]:
print(x, y)

[0 1 2 3 4] [1 3 5 7 9]


- 구성할 인공신경망은 **가중치 하나**와 **편향값** 하나를 가지는 매우 간단한 모델
- 입력 계층(1개 노드) -> 완전 연결 계층(1개 노드) -> 출력 계층(1개 노드)
  - 완전 연결 계층(fully connected or dense layer)
  - 입력 벡터에 가중치 벡터를 내적하고 편향값을 빼주는 동작을 함

**구현**
- 케라스의 서브패키지인 models와 layers사용
- models
  - 신경망의 각 계층을 연결하여 하나의 모델을 만든 후 컴파일, 학습, 예측을 담당
- layers
  - 신경망의 각 계층을 만드는 클래스들을 제공
  - 여기서는 가장 기본이 되는 Dense 클래스를 사용
- models.Sequential() 을 사용해서 모델을 만듬을 알림

In [4]:
# model이라는 인스턴스 생성
model = keras.models.Sequential()

# 계층 추가
model.add(keras.layers.Dense(1, input_shape=(1,)))

- 추가한 인공지능 계층은 입력 노드 하나와 가중치 하나를 가지는 선형 처리 계층
- 내부적으로 계층은 편향값을 가지고 있으므로 미지수 둘을 포함하는 셈
- 만든 모델을 어떻게 학습할지 파라미터로 지정하고 컴파일

In [10]:
model.compile(optimizer='SGD', loss='mse')

- 컴파일 : 모델 파라미터를 통해 모델 구조를 생성하는 단계를 의미
  - SGD : 확률적 경사 하강법, stochastic gradient descent
  - mse : loss function의 한 종류, 평균제곱오차(mean square error)

In [9]:
# keras.models.Sequential?
# model.add?
model.compile?

[0;31mSignature:[0m
[0mmodel[0m[0;34m.[0m[0mcompile[0m[0;34m([0m[0;34m[0m
[0;34m[0m    [0moptimizer[0m[0;34m,[0m[0;34m[0m
[0;34m[0m    [0mloss[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m[0;34m[0m
[0;34m[0m    [0mmetrics[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m[0;34m[0m
[0;34m[0m    [0mloss_weights[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m[0;34m[0m
[0;34m[0m    [0msample_weight_mode[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m[0;34m[0m
[0;34m[0m    [0mweighted_metrics[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m[0;34m[0m
[0;34m[0m    [0mtarget_tensors[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m[0;34m[0m
[0;34m[0m    [0;34m**[0m[0mkwargs[0m[0;34m,[0m[0;34m[0m
[0;34m[0m[0;34m)[0m[0;34m[0m[0m
[0;31mDocstring:[0m
Configures the model for training.

# Arguments
    optimizer: String (name of optimizer) or optimizer instance.
        See [optimizers](/optimizers).
    loss: String (name of objective function) or objective funct

In [11]:
# training
# epoch - 학습을 진행하는 총 에포크를 의미, 신경망을 학습할 때 학습 데이터 전체가 사용된 한 회 또는 한 세대

model.fit(x[:2], y[:2], epochs=1000, verbose=0)

<keras.callbacks.History at 0x12388f5f8>

In [12]:
model.predict?

[0;31mSignature:[0m [0mmodel[0m[0;34m.[0m[0mpredict[0m[0;34m([0m[0mx[0m[0;34m,[0m [0mbatch_size[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m [0mverbose[0m[0;34m=[0m[0;36m0[0m[0;34m,[0m [0msteps[0m[0;34m=[0m[0;32mNone[0m[0;34m)[0m[0;34m[0m[0m
[0;31mDocstring:[0m
Generates output predictions for the input samples.

Computation is done in batches.

# Arguments
    x: The input data, as a Numpy array
        (or list of Numpy arrays if the model has multiple inputs).
    batch_size: Integer. If unspecified, it will default to 32.
    verbose: Verbosity mode, 0 or 1.
    steps: Total number of steps (batches of samples)
        before declaring the prediction round finished.
        Ignored with the default value of `None`.

# Returns
    Numpy array(s) of predictions.

# Raises
    ValueError: In case of mismatch between the provided
        input data and the model's expectations,
        or in case a stateful model receives a number of samples
        th

In [13]:
# model.predict 하면 예측
# flatten 을 사용하면 1차원으로 펴줌
print('Targets:', y[2:])
print('Predictions:', model.predict(x[2:]).flatten())

Targets: [5 7 9]
Predictions: [4.9811873 6.967574  8.953961 ]


In [14]:
print('Targets:', y[2:])
print('Predictions:', model.predict(x[2:]))

Targets: [5 7 9]
Predictions: [[5.0034213]
 [7.0058966]
 [9.008372 ]]


In [14]:
# 전체 코드

model = keras.models.Sequential()

x = np.array([0, 1, 2, 3, 4])
y = x * 2 + 1

model.add(keras.layers.Dense(1, input_shape=(1,)))
model.compile(optimizer='SGD', loss='mse')

model.fit(x[:2], y[:2], epochs=1000, verbose=0)

result = model.predict(x[2:])
print(result.flatten())

[4.9559054 6.9239984 8.892091 ]
