# 딥러닝과 텐서플로

## 학습목표

- 딥러닝의 개념
- 텐서플로의 사용법

## 뉴런

신경세포

![](https://upload.wikimedia.org/wikipedia/commons/thumb/1/10/Blausen_0657_MultipolarNeuron.png/640px-Blausen_0657_MultipolarNeuron.png)

## 인공신경망

- 생물의 신경망을 흉내낸 기계학습의 한 방식

![](https://icdn6.digitaltrends.com/image/artificial_neural_network_1-720x720.jpg)

## 레이어

- 일반적으로 신경망은 레이어(layer, 층) 단위로 구성
- 레이어에서 레이어로 신호가 전달/처리
- 레이어가 클 수록, 많아질 수록 성능이 향상

## 딥러닝

- 레이어가 아주 많은 신경망
- 80~90년대에 이론적 발전
- 현실적 문제:
  - 데이터 부족
  - 느린 컴퓨터

## 딥러닝의 발전

- '딥러닝'이라는 표현은 2006년경부터 사용
- 2012년부터 학계에서 인기를 얻기 시작
- 빅데이터로 데이터 부족 문제 해결
- 컴퓨터 성능 향상과 GPU의 활용

## 텐서플로

- 구글이 개발한 딥러닝을 위한 라이브러리
- 고성능 계산을 지원
- 2019년 3월 현재 버전 1.13 (곧 2.0 출시 예정)

## 텐서플로 설치

CPU 버전

In [1]:
!pip install tensorflow

Collecting tensorflow
  Downloading https://files.pythonhosted.org/packages/7b/14/e4538c2bc3ae9f4ce6f6ce7ef1180da05abc4a617afba798268232b01d0d/tensorflow-1.13.1-cp37-cp37m-win_amd64.whl (63.1MB)
Collecting termcolor>=1.1.0 (from tensorflow)
  Using cached https://files.pythonhosted.org/packages/8a/48/a76be51647d0eb9f10e2a4511bf3ffb8cc1e6b14e9e4fab46173aa79f981/termcolor-1.1.0.tar.gz
Collecting astor>=0.6.0 (from tensorflow)
  Using cached https://files.pythonhosted.org/packages/35/6b/11530768cac581a12952a2aad00e1526b89d242d0b9f59534ef6e6a1752f/astor-0.7.1-py2.py3-none-any.whl
Collecting keras-applications>=1.0.6 (from tensorflow)
  Downloading https://files.pythonhosted.org/packages/90/85/64c82949765cfb246bbdaf5aca2d55f400f792655927a017710a78445def/Keras_Applications-1.0.7-py2.py3-none-any.whl (51kB)
Collecting grpcio>=1.8.6 (from tensorflow)
  Downloading https://files.pythonhosted.org/packages/2a/22/bd327063dd0bdf9d8d640b3185b760707842160e69df909db3fcaab5b758/grpcio-1.20.1-cp37-cp37m

Command ""c:\program files\python37\python.exe" -u -c "import setuptools, tokenize;__file__='C:\\Users\\inyoung\\AppData\\Local\\Temp\\pip-install-bykp_ubt\\termcolor\\setup.py';f=getattr(tokenize, 'open', open)(__file__);code=f.read().replace('\r\n', '\n');f.close();exec(compile(code, __file__, 'exec'))" install --record C:\Users\inyoung\AppData\Local\Temp\pip-record-xl1lwna3\install-record.txt --single-version-externally-managed --compile" failed with error code 1 in C:\Users\inyoung\AppData\Local\Temp\pip-install-bykp_ubt\termcolor\
You are using pip version 10.0.1, however version 19.1 is available.
You should consider upgrading via the 'python -m pip install --upgrade pip' command.


In [14]:
import tensorflow

In [15]:
tensorflow__.version

NameError: name 'tensorflow__' is not defined

GPU 버전

In [None]:
!pip install tensorflow-gpu

## 텐서플로 로지스틱 회귀 모형

In [2]:
import requests
url = 'http://archive.ics.uci.edu/ml/machine-learning-databases/00331/sentiment%20labelled%20sentences.zip'
res = requests.get(url)
with open('sentiment.zip', 'wb') as f:
    f.write(res.content)

from zipfile import ZipFile
import pandas as pd

z = ZipFile('sentiment.zip')
f = z.open('sentiment labelled sentences/imdb_labelled.txt')
movie = pd.read_csv(f, sep='\t', header=None)

movie.columns = ['review', 'sentiment']

from sklearn.feature_extraction.text import CountVectorizer

cv = CountVectorizer(max_features=1000)

x = cv.fit_transform(movie['review'])

y = movie['sentiment']

In [9]:
from sklearn.model_selection import train_test_split

In [4]:
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=.2, random_state=1234)

In [10]:
from tensorflow.keras.layers import Dense
from tensorflow.keras import Sequential

### 레이어 만들기

In [11]:
layer = Dense(1, activation='sigmoid', input_shape=(1000,))

- `Dense(1,`: 모든 입력과 출력이 연결된 레이어. 1개의 값을 출력.
- `activation='sigmoid'`: 0~1 범위의 값을 출력
- `input_shape=(1000,)`: 1000개의 단어가 입력

### 모형 만들기

In [12]:
model = Sequential([layer])

### 모형 요약

In [13]:
model.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_1 (Dense)              (None, 1)                 1001      
Total params: 1,001
Trainable params: 1,001
Non-trainable params: 0
_________________________________________________________________


## 학습 설정

In [15]:
from tensorflow.keras.optimizers import Adam

In [17]:
model.compile(loss='binary_crossentropy', metrics=['accuracy'], optimizer=Adam())

- `binary_crossentropy`: 0 또는 1 형태의 예측에 사용
- `optimizer=Adam`: 학습 알고리즘(`Adam`을 사용하면 됨)

### 학습

In [18]:
model.fit(x_train, y_train, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x1fb5eb89048>

### 성능 평가

In [20]:
from sklearn.metrics import accuracy_score

In [23]:
y_pred = model.predict_classes(x_test)

In [24]:
accuracy_score(y_test, y_pred)

0.5466666666666666

## 다층 신경망

In [25]:
multi = Sequential([
    Dense(16, activation='relu', input_shape=(1000,)),
    Dense(1, activation='sigmoid')
])

In [26]:
multi.compile(loss='binary_crossentropy', metrics=['accuracy'], optimizer=Adam())

In [27]:
multi.fit(x_train, y_train, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x1fb5f7b3d30>

### 성능 평가

In [28]:
y_pred = multi.predict_classes(x_test)

In [29]:
accuracy_score(y_test, y_pred)

0.7066666666666667