**_심층신경망(DNN) 기본기_**


# 2. 텐서플로우와 딥러닝 개발 프로세스

### _Objective_

1. 인공지능의 학습에서 `딥러닝 프레임워크`의 필요성을 이해하고 사용해봅니다.

2. 딥러닝 개발의 `전체 프로세스를 경험`하며 개발 프로세스의 구성 순서를 살펴봅니다.

2. 딥러닝 프레임워크중 하나인 **`텐서플로우(Tensorflow)`**를 가볍게 사용해봅니다.

#### 필요한 패키지 설치 및 환경설정

In [None]:
import numpy as np

import tensorflow as tf 

## [1.딥러닝 프레임워크]

---

pass

`딥러닝(Deep Learning)`

1. (주로) 여러 층을 가진 인공신경망을 사용하여 머신러닝 학습을 수행
2. 데이터로부터 중요한 패턴 및 규칙을 학습한 인공지능으로 추론을 수행

`프레임워크(Framework)`

1. 어떠한 목적을 달성하기 위해 필요한 **문제 해결도구들의 뼈대**
2. 복잡하게 얽혀있는 문제를 해결하기 위한 **표준과 클래스로 구성된 시스템**

#### 패키지와 프레임워크의 차이점
![2_6](./img/2_6.png)

### 딥러닝 프레임워크

---

`딥러닝 구현`이라는 목적을 달성하기 위해 필요한 표준과 클래스로 구성된 시스템

1. "여러 층을 가진 인공신경망을 구축"하는데 필요한 표준과 클래스
2. "데이터로부터 중요한 패턴 및 규칙을 학습" 하는데 필요한 표준과 클래스
3. "학습된 머신과 주어진 입력으로 추론을 수행"하는데 필요한 표준과 클래스

### 딥러닝 프레임워크는 왜 필요할까?

---

#### 1. 인공신경망을 위한 클래스를 구현해 놓았다.

![2_7](./img/2_7.png)

![2_8](./img/2_8.png)

```python
"""
여러분들이 필요한 클래스를 모두 구현이 되어있다. 우리는 가져다 쓰기만 하면 된다.
"""
```

#### 2. 인공지능의 학습에 필요한 미분연산을 지원한다.



![2_9](./img/2_9.png)

```python
"""
**인공지능을 만드는데 미분이 필요하다! 딱 그정도의 메세지만 전달하려고 둔 셀입니다.**
+ 현재 수강생이 알고있는 정보 : 
    1. 인공지능의 목표 : 사람과 같이 (합리적으로) 생각하거나 행동하는 머신
    2. 인공지능의 평가 기준 :"얼마나 사람같은가?", "기대효용이 얼마나 높은가?","얼마나 합리적인가?"
    딱 이정도만 알고 있다는 가정하에서 "미분이 필요하다"를 설명하는 것이 미션
+ 순서 :
    1. 우리는 사람과 같이 생각하거나 행동하는 머신을 만들고 싶다.
    2. 이때, 우리가 만든 머신이 "사람과 다른 정도"를 "비용" 이라고 명명해보자.
    3. 그러면 어떠한 변수(달라질 수 있는 수)에 따라서 머신이 달라질테고, 이에 따라서 비용은 달라질거다.
    4. 마치 함수와 같다. x값에 따라서 y값이 변하는 것처럼, 어떠한 변수 세타에 따라서 비용이 달라질거다.
    5. 이를 그림으로 나타내면 대충 위와 같다고 해보자. 사실 이 비용은 복잡한 그래프를 그리겠지만 일단 위와같이 나온다고 하자.
    6. 그러면, 비용이 최소와 되는 즉, J가 최소인 이 지점의 머신이 사람과 가장 유사하게 생각하거나 행동하는 머신일 것이다.
    7. 고로, 우리의 목표는 저 지점의 변수인 세타값을 찾는것이 목표일 것이다.
    8. 그러면, 어떻게 찾을 수 있을가, 만약, 현재 세타값이 세타_1 이고, 우리 목표점보다 이렇게 상향그래프에 위치해 있다면?
    9. 우리의 목표를 위해서는 세타를 왼쪽, 즉 음수로 이동시켜야 한다.
    10. 근데, 그때 상향그래프기 때문에 기울기가 양수 일 것이다.
    11. 간단하게 생각해서, 세타를 기울기만큼 빼주면 최저점에 가까워 질 것이다.
    12. 여기서, 우리는 기울기를 미분을 통해 구할 수 있다. 
    13. 따라서, 우리는 머신을 더 사람과 같이 생각하거나 행동하도록 만들기 위해서는 미분의 계산이 필요하다.
"""
```

![2_10](./img/2_10.png)

#### 3. 다양한 디바이스 위에서 연산할 수 있다.

딥러닝의 대용량의 연산을 위한 가속화된 하드웨어를 흔히 사용<br>
CPU뿐 아니라 GPU, TPU 등 다양한 디바이스 위에서 동작가능<br>

![2_12](./img/2_12.png)

**CPU / GPU / TPU의 성능비교**

![2_11](./img/2_11.png)

```python
"""
**CPU대비 GPU, TPU의 성능비교입니다.**
1. GM은 기하평균, WM은 가중평균입니다.
2. 파란색은 CPU대비 GPU성능입니다. 1.2라면, GPU의 성능이 CPU보다 1.2배 좋은 것입니다.
3. TPU`은 이 논문에서 제안하는 TPU의 설계입니다. 
4. 전체적으로, CPU보다 GPU가 좋고, TPU가 더 좋은데,
5. 딥러닝 프레임워크는 별다른 설정없이 기본으로 GPU, TPU위에서 연산이 가능하도록 합니다.
"""
```

#### CPU에서 돌아가도록 지정

In [None]:
x = tf.constant([1],tf.float32)
with tf.device('/cpu:0'):
    x = x + 1

#### GPU에서 돌아가도록 지정

In [None]:
# x = tf.constant([1],tf.float32)
# with tf.device('/gpu:0'):
#     x = x + 1

```python
"즉, Tensorflow에는 TPU/GPU/CPU 위에서 별다른 코드 수정없이 연산이 돌아갈 수 있도록 코드를 모두 작성해두었다"
```

### 다양한 딥러닝 프레임워크

---

![2_25](./img/2_25.png)

#### 딥러닝 프레임워크의 사용량 비교

<img src="./img/2_26.png" alter="2_26" width=1600>

#### 딥러닝 프레임워크 비교
![2_27](./img/2_27.png)

## [2. 딥러닝 프레임워크, 텐서플로우]

---

pass

### 텐서플로우(Tensorflow)

---

**`텐서플로우(Tensorflow)`**는
1. 머신러닝을 위한 `엔드 투 엔드 오픈소스 머신러닝 프레임워크`이다.
2. 구글내 연구와 제품개발을 위한 목적으로 `구글 브레인팀이 만들었다.`
3. 파이썬으로 호출하여 구동할 수 있다.

#### 텐서플로우 호출하기

In [None]:
import tensorflow as tf
from tensorflow import keras

In [None]:
# 필요한 클래스 호출

from tensorflow.keras.layers import Input
from tensorflow.keras.models import Model

### 텐서플로우의 특징

---

+ `텐서(Tensor)`와 연산으로 `데이터 플로우`를 먼저 설계 할 수 있음
+ 설계를 기반으로 생성된 모델에 데이터를 입력하여 학습 & 추론
+ 아이디어 테스트에서 서비스 단계까지 이용 가능
+ 계산 구조와 목표 함수만 정의하면 **`자동으로 미분 계산을 처리`**

#### 텐서를 중심으로 연산

텐서플로우에서 다루는 데이터는 `Tensor`을 통해 정의<br>

In [None]:
# 파이썬에서의 자료형, 리스트
lst = [1,2,3]
lst

In [None]:
# 넘파이에서의 자료형, 배열
nd_arr = np.array(lst)
nd_arr

In [None]:
# 텐서플로우에서의 자료형, 텐서(Tensor)
tensor = tf.constant(lst)
tensor

In [None]:
# 텐서에 여러가지 연산 적용

display(tensor)
tensor = tensor + 1
display(tensor)

이 때 중요한 것은 `tensor`의 값은 **변하지 않는다**

#### 데이터 자료형, 텐서와 넘파이배열의 호환

텐서플로우(Tensorflow)의 `tf.Tensor`자료형과<br>
넘파이(Numpy)의 `np.ndarray`자료형

In [None]:
# 텐서를 넘파이배열로 변환
tensor.numpy()

In [None]:
# 넘파이 배열을 텐서로 변환
tf.constant(nd_arr)

#### 텐서와 연산으로 데이터플로우를 먼저 설계 가능

데이터가 입력되었을때 진행될 연산 과정인 데이터플로우를 먼저 설계한 후 이후에 데이터를 입력할 수 있다.

In [None]:
# 데이터를 받는 연산을 먼저 설계
inputs = Input(1,name='x')

In [None]:
# 모델 인스턴스 생성
model = Model(inputs, inputs, name='model')

In [None]:
# 설계를 기반으로 생성한 모델의 데이터 플로우 확인
model.summary()

In [None]:
# 이후에 생성된 모델에 데이터를 입력하여 추론
model.predict([1,2,3])

`※ 모델을 데이터플로우로 미리 설계`
1. 실제 서비스의 서빙에서 실시간으로 유입되는 데이터를 처리하는데 용이하다.
2. 정해진 연산위에서 데이터가 흐름으로써 미분에 필요한 연산의 결과를 캐시에 저장해 둘 수 있다.

#### 자동 미분 지원

$$y = 2x + 3, \; z = log(y) \text{ 일 때,} x=3\text{에서 미분 값}\frac{\partial z}{\partial x} \text{는?}$$

In [None]:
x = tf.Variable(3., dtype=tf.float32)

with tf.GradientTape() as tape:
    y = 2. * x + 3.
    z = tf.math.log(y)

grad = tape.gradient(z, x)

print(f"미분 값 : {grad:.3f}")

### + 딥러닝 개발 도구들의 생태계

"파이썬을 이용하여 텐서플로우의 케라스로 딥러닝을 위한 코드를 구현한 후 넘파이 배열을 입력하여 텐서플로우에서 모델을 학습한다."의 의미는?

#### 딥러닝 개발 프로세스의 생태계

![2_28](./img/2_28.png)

2019년 9월, 텐서플로우2.0이 출시하며 `텐서플로우 코어`는 (거의 모두) `케라스(Keras)인터페이스로 동작`<br>
이로서, `케라스`의 간편하고 배우기 쉬운` 인터페이스로 텐서플로우를 사용`할 수 있음.

![2_29](./img/2_29.png)

## [3. 텐서플로우를 활용한 딥러닝 개발 프로세스]


---


pass

### 텐서플로우를 활용한 딥러닝 개발 프로세스

---

![2_13](./img/2_13.png)

#### 필요한 패키지 호출 및 환경설정

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

import tensorflow as tf
from tensorflow import keras

In [None]:
# 랜덤값 고정
if "set_seed" in dir(tf.random):
    tf.random.set_seed(1)
else:
    tf.random.set_random_seed(1)
    
# plot에서 한글깨짐 방지
plt.rc('font', family='d2coding')

### 문제정의 및 데이터 로드

---

![2_14](./img/2_14.png)

#### 문제 정의 : 데이터로 영화 "옥자" 의 `관객수 예측 하기`

1. 이전까지 개봉했던 영화의 왓챠 "보고싶어요" 수와 실제 관객 수를 바탕으로
2. 2017년에 개봉한 옥자의 왓챠 "보고싶어요"를 통한 관객 수 예측하기

![2_24](./img/2_24.png)

####  데이터 준비


In [None]:
movie_df = pd.DataFrame([
    [8759, 487],
    [10132,612],
    [12078,866],
    [16430,1030]],
    columns=["nums_want_to_see","nums_audience"])
movie_df.index = ["마션","킹스맨","캡틴아메리카","인터스텔라"]

#### 데이터 탐색

In [None]:
# 저장된 데이터 확인

movie_df

In [None]:
# 각 영화별 "보고싶어요"수와 관객수 확인

movie_df.plot()
for idx, (name, value) in enumerate(movie_df.iterrows()):
    plt.annotate(value[0], (idx,value[0]))
    plt.annotate(value[1], (idx,value[1]))

In [None]:
# "보고싶어요"수에 따른 실제 관객수 확인

movie_df.plot(x="nums_want_to_see", y="nums_audience",)
for idx, (name, value) in enumerate(movie_df.iterrows()):
    plt.annotate(f"{name}: {value[1]}", value)

### 머신 개발 : 모델 구성하기

---

![2_15](./img/2_15.png)

![2_16](./img/2_16.png)

#### 각 레이어의 정의 및 레이어 연결

In [None]:
from tensorflow.keras.layers import Input
from tensorflow.keras.layers import Dense

In [None]:
# (1) 입력값의 형태 결정하기
inputs = Input(1,name='x')

# (2) 출력값의 형태 결정하기 
dense_layer = Dense(1, name='output')

# (3) 레이어 연결하기
output = dense_layer(inputs)

![2_23](./img/2_23.png)

### 머신 개발 : 모델 생성하기

---

![2_17](./img/2_17.png)

#### 모델 생성하기

In [None]:
from tensorflow.keras.models import Model

In [None]:
# 모델 인스턴스 생성
model = Model(inputs, output, name='model')

#### 생성된 모델 확인하기

In [None]:
model.summary()

In [None]:
# w1, w0 가중치 확인
dense_layer.get_weights()

#### 모델에 데이터 입력하여 예측값 구하기

In [None]:
# x에 1의 값을 넣었을 때, y값은? w_1 * 1 + w_0
x = np.array([[1.]],np.float32)
display(model.predict(x))

# x에 2의 값을 넣었을 때, y값은? w_1 * 2 + w_0
x = np.array([[2.]],np.float32)
display(model.predict(x))


In [None]:
# x에 옥자의 왓차 "보고싶어요"수 12008의 값을 넣었을 때, y값(예상 관객수)은? w_1 * 12008 + w_0
x = np.array([[12008.]],np.float32)
pred = model.predict(x)

print(f"학습되지 않은 모델이 예측한 옥자의 예상 관객수 : {pred}")

### 머신 개발 : 모델 학습 설정하기

---

![2_18](./img/2_18.png)

#### 모델의 학습 설정하기

![2_19](./img/2_19.png)

#### 손실함수설정

In [None]:
from tensorflow.keras.losses import MeanSquaredError

In [None]:
# "실제값과 다른 정도"인 "비용"의 계산방법으로서 MSE

loss = MeanSquaredError()

#### 모델의 최적화 함수

In [None]:
from tensorflow.keras.optimizers import SGD

In [None]:
# "비용"을 줄이는 방법으로서 SGD

optimizer = SGD(2e-10)

#### 모델 컴파일 하기

In [None]:
model.compile(loss=loss, optimizer=optimizer)

#### 학습 전 모델의 예측과 가중치

In [None]:
# 학습이 전혀 되지 않았을 때의 예측 값
y_pred = model.predict(movie_df['nums_want_to_see'])
movie_df['prediction'] = y_pred
movie_df

In [None]:
# 학습이 전혀 되지 않았을 때의 Weight
model.get_weights()

### 머신 개발 : 모델 학습하기
---
![2_20](./img/2_20.png)

#### 모델 학습

In [None]:
# 학습
history = model.fit(x=movie_df['nums_want_to_see'], 
                    y=movie_df['nums_audience'], 
                    epochs=100, verbose=0)

### 모델 평가하기

---

![2_22](./img/2_22.png)

#### 학습 경과 확인 : 학습에 따른 손실값 감소 확인

In [None]:
import matplotlib.pyplot as plt

In [None]:
plt.plot(history.history['loss'])
plt.show()

#### 결과 시각화하기

In [None]:
pred_inputs = np.arange(7500, 18000)
pred_outputs = model.predict(pred_inputs[:,None])

movie_df.plot(x='nums_want_to_see',y='nums_audience',
              kind='scatter', title="Movie")
plt.plot(pred_inputs, pred_outputs, 'r--')
plt.show()

#### 모델에 데이터 입력하여 예측값 구하기

In [None]:
# x에 옥자의 왓차 "보고싶어요"수 12008의 값을 넣었을 때, y값(예상 관객수)은? w_1 * 12008 + w_0
x = np.array([[12008.]],np.float32)
pred = model.predict(x)

print(f"옥자의 예상관객수는 {pred}")


### 정리 : 딥러닝 개발 프로세스

![2_21](./img/2_21.png)

## `2. 텐서플로우와 딥러닝 개발 프로세스` 마무리


---

![](../../src/logo.png)

---

---

---

# [부록 컨텐츠]

### 딥러닝 프레임워크의 필요성 : 인공신경망에 필요한 클래스

In [None]:
import tensorflow as tf
import tensorflow.keras

In [None]:
for module in dir(tf.keras):
    if module[0] != "_":
        print(module)

In [None]:

for cls in dir(tf.keras.layers):
    if (cls[0] != "_") and (cls[0].isupper()):
        print(f"{cls}()")

### 딥러닝 프레임워크의 필요성 : 미분가능

In [None]:
import matplotlib.pyplot as plt

In [None]:
x = np.linspace(1, 100, 200)

In [None]:
y = (x-50)**2 +100

$$J(\theta)$$

In [None]:
fig = plt.figure(figsize=(15, 10))

plt.plot(x, y ,linewidth=2.0)
ax = fig.gca()
ax.spines["right"].set_visible(False)
ax.spines["top"].set_visible(False)
ax.spines["left"].set_linewidth(2)
ax.spines["bottom"].set_linewidth(2)

plt.xlim((0, 100))
plt.ylim((0, 1500))

ax.set_yticklabels([])
ax.set_xticklabels([])


$$\min_\theta J(\theta)$$


$$\theta_1 = \theta_1 - \lambda\frac{\partial}{\partial\theta_1}J(\theta_1)$$