## 3.1 TensorFlow (tf)

- 파이썬 기반의 머신러닝 플랫폼
- 수치 텐서에 대한 수학적 표현을 적용하는 것이 핵심
  
  - 미분 가능한 어떤 표현식에 대해서도 자동으로 gradient 계산
  - GPU, TPU 적용 가능
  - tensorflow에서 정의한 계산의 머신 분산 용이
  - 다른 runtime 에 맞도록 변환할 수 있어 (TensorFlow Lite) 실전환경에 쉽게 배포 가능

## 3.2 Keras

- tensorflow 위에 구축된 파이썬용 딥러닝 API
- 딥러닝 모델 구축과 훈련에 대한 방법 제공
- 사용자 층이 다양하여 프레임워크 차원에서의 조작할 수 도 있으며, 세부내용에 대해 완전히 제어하는 것도 가능

![keras with tensorflow](https://wikidocs.net/images/page/164735/Fig_05.png)

그림 출처 : [wikidocs.net](https://wikidocs.net/164735)

## 3.3 케라스와 텐서플로의 간략한 역사

- keras는 Theano(th, tf와 같은 텐서조작 라이브러리)를 위한 라이브러리로 개발
- 2015년 multibackend 구조로 refactoring 되어 theano와 tensorflow에서 모두 사용가능하게 됨
- 2017년 CNTK, MXNet에 대해서도 backend 옵션이 추가 (현재 Theano, CNTK 개발 중단)
- 2018년 tensorflow의 공식 고수준 API로 선정

> 고수준 API : 다양한 parameter를 별도 선언할 필요없이 사용할 수 있도록 조성된 api [참고](https://m.blog.naver.com/worb1605/221407983135)

- 2019년 keras가 주축이 된 tf2 가 relase 됨


### `From tensorflow import keras` vs `import keras`

tf 2.0 에서는 다음 사항들을 핵심 특징으로 여기고 있으며 이들은 keras API를 적극적으로 운영하면서 가능해진 사항들임
- Sessions and eager execution
- Automatic differentiation
- Model and layer subclassing
- Better multi-GPU/distributed training support


keras는 딥러닝 구축 및 훈련을 위한 method를 제안하지만 그 연산 자체는 할 수 없어 텐서 연산을 위한 backend (tf, th)를 필요로 함  

tf 1.10.0 에서 keras는 직접 통합되는 방식으로 소속 되었으나 별도의 확장성을 위하여 keras library와의 독립성을 유지.  
tf 2.0 에서부터는 keras는 완전 종속된 상위 API로 정의 되었으며
자체 라이브러리로는 Keras 2.3.0 을 마지막으로 relase 함.

이전 import keras로 사용하였던 코드들을 tf.keras로 변경하는 것을 권장하며 앞으로의 코드에서도 tf.keras를 사용할 것을 공지함.

출처 : [https://pyimagesearch.com/](https://pyimagesearch.com/2019/10/21/keras-vs-tf-keras-whats-the-difference-in-tensorflow-2-0/)

## 3.4 딥러닝 작업 환경 설정하기

책에서는 세 개안을 제안하고 있음
1. GPU 구입
2. Cloud 환경 구독
3. Google Colab

간단하게는 colab에서 구동할 수 있으며,  
cloud는 큰 모델 혹은 오래쓰기엔 너무 요금이 많이 나와 GPU 구입을 권장하는 편.

## 3.5 텐서플로 시작하기

tf API에서는 다음의 기능을 수행
- 텐서 정의 : 변수(신경망 상태 저장하는 텐서) 포함
- 저수준 텐서 연산 : relu, matmul, dot...
- 역전파(with GradientTape)

keras API에서는 고수준의 딥러닝 개념이 구현될 수 있도록 함
- layer : 모델 구성
- loss function : 학습 피드백 신호 정의
- optimizer : 학습 진행 방향 결정
- metrics : 모델 성능 평가
- Training loop : 미니 배치 확률적 경사 하강법 수행

### 3.5.1 상수 텐서와 변수

- 넘파이 배열과 텐서플로 텐서의 차이점 : 텐서는 값 할당이 불가능
- 변수(tf.Variable) : 값 할당을 위한 특별한 텐서, assign 메소드를 이용하여 수정할 수 있음
  > weigth, bias 와 같이 계속적으로 변해야하는 값에 호출


### 3.5.2 텐서 연산 : 텐서플로에서 수학 계산하기

텐서 연산은 eager excuttion mode로 수행되어 바로 결과값이 출력

> **eager excution**  
tf 1.x 에서는 계산 그래프 선언 > session 수행 이라는 과정을 겪어야 텐서들이 계산 되었음
그 과정에서 tf.placeholder에 입력값을 주고 feed_dict에 노드 값을 대입하는 불편함이 있었으나 tf 2.0 이후로는 이 과정 없이 넘파이 연산처럼 즉시 결과 값이 출력 됨  
출처 : https://m.blog.naver.com/beyondlegend/222140607467

3.5.3. GradientTape API 다시 살펴보기

- numpy와의 큰 차별점
- 미분 가능한 표현이라면 어떤 입력이라도 gradient 계산 가능
- 일반적으로 훈련가능한 `변수`의 gradient를 계산
- 불필요한 연산을 막기위하여 변수들 만을 추적하기 때문에 상수는 tape.watch()를 이용하여 별도로 신호를 주어야 추적할 수 있음.
- second-order gradient도 계산 가능


### 3.5.4 엔드-투-엔드 예제 : 텐서플로 선형 분류

**project 순서**
1. 특정한 평균과 공분산 행렬을 가진 랜덤한 분포 좌표들을 가진 2개 클래스를 생성
  > - 평균 : 평면에서의 위치 결정  
  > - 공분산 행렬 : 포인트 클라우드의 형태 결정
2. 변수 W는 랜덤한 값으로, 변수 b는 0으로 초기화 하여 정의
  > 좌표 값을 가지는 2D matrix이므로 W는 x, y에 대한 2개의 스칼라값을 가지는 벡터로 생성
3. 정방향 패스를 위한 함수 정의
4. 손실함수 정의
5. training step 정의 (tf.GradientTape 이용)
6. 훈련 (Epoch = 40)
7. 결과 시각화 (최종 수렴한 함수 포함)


## 3.6 신경망의 구조 : 핵심 Keras API 이해하기

### 3.6.1 층 : 딥러닝의 구성 요소

하나 이상의 텐서를 입력 받고 하나 이상의 텐서를 출력하는 데이터 처리 모듈

일부 layer (Flatten, Dropout 등) 제외하고는 weight라는 상태를 포함하고 있음

weight는 확률적 경사 하강법으로 학습되는 하나 이상의 텐서를 의미

층 마다 텐서 포맷과 처리 방식이 다름
  > rank-2 tensor :  
  Dense layer를 이용하여 처리하는 경우가 많음  
      - 밀집 연결 층, 완전 연결 층으로도 부름

  > rank-3 tensor :  
  LSTM과 같은 recurrent layer, Convolution 1-D layer를 이용하여 처리

  > rank-4 tensor:
  Conv2D로 처리


## keras Layer Class

**keras API의 중심**

Layer는 `상태와 연산(정방향 패스)을 캡슐화 한 객체`로 정의  
- 상태 생성을 위한 전용 메서드인 build() 에서 weight 정의  
  > 해당 메서드는 \_\_call__()을 통하여 자동으로 자동으로 호출
  ```python
  **기본 layer class**
  def __call__(self,inputs):
    if not self.built:
      self.build(inputs.shape)
      self.built = True
    return self.call(inputs)
  ```
- 호출 메서드 call() 에서 연산을 정의함

#### 자동 크기 추론 : 동적으로 층 만들기

층 호환 (layer compatibility)
- 모든 층은 특정 크기의 입력 텐서만 받고, 특정 크기의 출력 텐서만 반환

keras는 동적으로 앞선 층의 크기에 맞춰 layer를 구성함

이로 인해 코드가 간단하고 깔끔하게 표현 가능해짐

```python
model = keras.Sequenctial([
  SimpleDense(32,activation = 'relu'),
  SimpleDense(64,activation = 'relu'),
  SimpleDense(32,activation = 'relu'),
  SimpleDense(10,activation = 'softmax'),
])
```

### 3.6.2 층에서 모델로

딥러닝 모델 == `층으로 구성된 그래프`

keras에서는 Model Class로 구현해 두었음

- Sequential (한 개의 input을 받는다는 제한 존재)
- Functional
- Subclass

모델의 구조는 `가설 공간(hypothesis space)`을 정의

: 가능성 있는 공간에서 입력 데이터를 출력 데이터로 매핑하는 일련의 텐서 연산 -> 최적의 weight를 찾는 것의 목표







### 3.6.3 '컴파일' 단계 : 학습 과정 설정

모델 구조 정의 후 필요한 단계들을 설정하는 단계
- loss function
- optimizer
- metric

keras에서는 간단하게 지정어를 입력하여 손쉽게 정의 할 수 있음  
(e.g. optimizer = 'adam')

인스턴스 객체로 지정로 부르게 되면 좀 더 상세한 제어 및 custom 가능
(e.g. optimizer = keras.optimizers.Adam(learning_rate = 1e-2))

### 3.6.4 손실 함수 선택하기

`To be continued`