<a href="https://colab.research.google.com/github/nanriblue/N2H4/blob/master/09_tensorflow_ipynb%EC%9D%98_%EC%82%AC%EB%B3%B8.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 딥러닝과 텐서플로

## 학습목표

- 딥러닝의 개념
- 텐서플로의 사용법  
ㄴ모델은 손델게 없는데 딥러닝은 몇 층을 쌓을거냐 등등 선택요소가 많음

## 뉴런

신경세포

![](https://upload.wikimedia.org/wikipedia/commons/thumb/1/10/Blausen_0657_MultipolarNeuron.png/640px-Blausen_0657_MultipolarNeuron.png)

## 인공신경망

- 생물의 신경망을 흉내낸 기계학습의 한 방식

![](https://icdn6.digitaltrends.com/image/artificial_neural_network_1-720x720.jpg)

## 레이어

- 일반적으로 신경망은 레이어(layer, 층) 단위로 구성
- 레이어에서 레이어로 신호가 전달/처리
- 레이어가 클 수록, 많아질 수록 성능이 향상

## 딥러닝

- 레이어가 아주 많은 신경망
- 80~90년대에 이론적 발전
- 현실적 문제:
  - 데이터 부족
  - 느린 컴퓨터

## 딥러닝의 발전

- '딥러닝'이라는 표현은 2006년경부터 사용
- 2012년부터 학계에서 인기를 얻기 시작
- 빅데이터로 데이터 부족 문제 해결
- 컴퓨터 성능 향상과 GPU의 활용

## 텐서플로

- 구글이 개발한 딥러닝을 위한 라이브러리
- 고성능 계산을 지원
- 2019년 3월 현재 버전 1.13 (곧 2.0 출시 예정)

## 텐서플로 설치

CPU 버전

In [0]:
!pip install tensorflow

[33mYou are using pip version 18.1, however version 19.1 is available.
You should consider upgrading via the 'pip install --upgrade pip' command.[0m


GPU 버전

In [0]:
!pip install tensorflow-gpu

Collecting tensorflow-gpu
[?25l  Downloading https://files.pythonhosted.org/packages/06/3a/5f7cf24af13265eaea2406d88fc3df5ad870aba0b4f4a0851213519f12bd/tensorflow_gpu-1.1.0-cp36-cp36m-macosx_10_11_x86_64.whl (81.2MB)
[K    100% |████████████████████████████████| 81.2MB 697kB/s ta 0:00:011
Installing collected packages: tensorflow-gpu
Successfully installed tensorflow-gpu-1.1.0
[33mYou are using pip version 18.1, however version 19.1 is available.
You should consider upgrading via the 'pip install --upgrade pip' command.[0m


## 텐서플로 로지스틱 회귀 모형

In [0]:
#데이터 준비
import requests
url = 'http://archive.ics.uci.edu/ml/machine-learning-databases/00331/sentiment%20labelled%20sentences.zip'
res = requests.get(url)
with open('sentiment.zip', 'wb') as f:
    f.write(res.content)

from zipfile import ZipFile
import pandas as pd

z = ZipFile('sentiment.zip')
f = z.open('sentiment labelled sentences/imdb_labelled.txt')
movie = pd.read_csv(f, sep='\t', header=None)

movie.columns = ['review', 'sentiment']

from sklearn.feature_extraction.text import CountVectorizer

cv = CountVectorizer(max_features=1000)

x = cv.fit_transform(movie['review'])

y = movie['sentiment']

In [0]:
from sklearn.model_selection import train_test_split

In [0]:
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=.2, random_state=1234)

In [0]:
from tensorflow.keras.layers import Dense #텐서플로 내장된 케라스, 케라스와는 다른 케라스임
from tensorflow.keras import Sequential

### 레이어 만들기

In [0]:
layer = Dense(1, activation='sigmoid', input_shape=(1000,)) 

- `Dense(1,`: 모든 입력과 출력이 연결된 레이어. 1개의 값을 출력.
- `activation='sigmoid'`: 0~1 범위의 값을 출력
- `input_shape=(1000,)`: 1000개의 단어가 입력

### 모형 만들기

In [0]:
model = Sequential([layer])

### 모형 요약

In [0]:
model.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 1)                 1001      
Total params: 1,001
Trainable params: 1,001
Non-trainable params: 0
_________________________________________________________________


## 학습 설정

In [0]:
from tensorflow.keras.optimizers import Adam

In [0]:
model.compile(loss='binary_crossentropy', metrics=['accuracy'], optimizer=Adam())

- `binary_crossentropy`: 0 또는 1 형태의 예측에 사용
- `optimizer=Adam`: 학습 알고리즘(`Adam`을 사용하면 됨)

### 학습

In [0]:
model.fit(x_train, y_train, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x1fb5eb89048>

### 성능 평가

In [0]:
from sklearn.metrics import accuracy_score

In [0]:
y_pred = model.predict_classes(x_test)

In [0]:
accuracy_score(y_test, y_pred)

0.5466666666666666

## 다층 신경망

In [0]:
multi = Sequential([
    Dense(16, activation='relu', input_shape=(1000,)),
    Dense(1, activation='sigmoid')
])

In [0]:
multi.compile(loss='binary_crossentropy', metrics=['accuracy'], optimizer=Adam())

In [0]:
multi.fit(x_train, y_train, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x1fb5f7b3d30>

### 성능 평가

In [0]:
y_pred = multi.predict_classes(x_test)

In [0]:
accuracy_score(y_test, y_pred)

0.7066666666666667