### 딥러닝 개발환경
#### 파이썬 3.5 이상 또는 아나콘다 4.4
+ pycharm 이용, 파이썬 venv 환경에서 실행
+ 머신러닝, 딥러닝 패키지 설치
+ numpy scipy matplotlib pandas scikit-learn
+ spyder(과학계산) seaborn(시각화) h5py(hdf5) pillow(이미지)
+ tensorflow (tensorflow-gpu) keras

### 텐서플로 GPU 지원사이트

+ 시스템에 nvidia GPU가 없다 => CPU만 사용하는 텐서플로 패키지 사용

+ 시스템에 nvidia GPU가 있다 => GPU를 지원하는 텐서플로 패키지 사용

+ 이럴경우 nvidia에서 제공하는 딥러닝 관련 S/W를 설치해야 함

#### 자신의 GPU가 텐서플로를 지원하는지 확인

+ developer.nvidia.com/cuda-gpus
+ GTX 1060 -  CUDA 6.1
+ GTX 1050 -  CUDA 6.1

#### 텐서플로/CUDA 설치 방법
+ tensorflow.org/install/install_windows

In [1]:
# 텐서플로 간단 예제 #1
import tensorflow as tf

In [2]:
hello = tf.constant('Hello, TensorFlow!!!')
# 텐서플로 상수 선언

In [3]:
sess = tf.Session() # 코드를 실행하기 위해 세션 생성
print(sess.run(hello))  # 코드를 실행 후 결과 출력


b'Hello, TensorFlow!!!'


2021-12-02 11:00:38.215554: I tensorflow/core/platform/cpu_feature_guard.cc:142] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA


In [4]:
# 텐서플로 간단 예제 #2
# 텐서플로 간단 예제 #2
from tensorflow.keras.datasets import mnist
from tensorflow.keras import models
from tensorflow.keras import layers

In [5]:
# 케라스의 MNIST 데이터 셋 다운로드하기
# 이미지는 numpy 배열형으로 저장
# 0 ~ 9 까지 숫자이미지 저장
(Xtrain, ytrain), (Xtest, ytest) = mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz


In [6]:
# 훈련/검증 데이터 크기, 갯수 확인
print(Xtrain.shape, len(Xtrain))
print(ytrain.shape, len(ytrain))

print(Xtest.shape, len(Xtest))
print(ytest.shape, len(ytest))

(60000, 28, 28) 60000
(60000,) 60000
(10000, 28, 28) 10000
(10000,) 10000


In [7]:
# 신경망 생성
# 층layer : 데이터 처리 필터
# 데이터들이 입력되면 다음 단계에서 처리하기 용이하도록
# 유용한 형태로 변환
# 주어진 입력데이터들에서 더 의미있는 표현을 추출해 냄
# 데이터 정재 필터가 여러 개 있는 여과기와 같음
network = models.Sequential()
network.add(layers.Dense(512, activation='relu',
            input_shape=(28*28,)))  # 입력층 (784->512)
network.add(layers.Dense(10, activation='softmax'))
                                    # 출력층 (512->10)

Instructions for updating:
If using Keras pass *_constraint arguments to layers.


In [8]:
# 신경망 분석시 중요 요소 3가지
# 손실함수      : 신경망의 성능을 측정하는 지표
# 옵티마이저    : 손실함수를 기반으로 신경망 개선
# 측정지표      : 훈련과 검증 과정을 통해 정확도 측정
network.compile(loss='categorical_crossentropy',
                optimizer='rmsprop',
                metrics=['accuracy'])

In [9]:
# 전처리 #1 :  단일색상으로 변환
# 이미지 정보 : 28 X 28 X 1 (단색)
Xtrain = Xtrain.reshape((60000, 28*28))
Xtrain = Xtrain.astype('float32') / 255

Xtest = Xtest.reshape((10000, 28*28))
Xtest = Xtest.astype('float32') / 255

In [11]:
# 전처리 #2 :  범주형으로 변환 - 웟핫인코딩
from tensorflow.keras.utils import to_categorical

ytrain = to_categorical(ytrain)
ytest = to_categorical(ytest)

In [12]:
# 신경망에 입력데이터 훈련
network.fit(Xtrain, ytrain, epochs=5, batch_size=128)

# 검증 데이터로 테스트
test_loss, test_acc = network.evaluate(Xtest, ytest)

Train on 60000 samples
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


In [13]:
# 정확도, 손실 확인
print('정확도', test_acc)
print('손실(오차)정도', test_loss)

정확도 0.9788
손실(오차)정도 0.07039414207688532


#### epochs : 데이터 전체를 이용해서 훈련시킬 횟수
#### batch_size : 한번에 처리하는 데이터 수

#### ex) 전체데이터 100, 배치사이즈 10, 총 반복횟수 10 (epoch 횟수)
#### 5 epoch -> 50 반복횟수

In [15]:
(60000 / 128 ) * 5 # 반복횟수 2343.75

2343.75

#### ex) 전체 2000 개의 데이터가 있고, epochs = 20, batch_size = 500
#### 반복횟수 80

### 텐서플로 간단 예제 #3
#### 피마 인디언 당뇨병 예측

In [19]:
import numpy as np
import pandas as pd

In [18]:
# 동일한 결과출력을 위해 난수 설정
seed = 211202
np.random.seed(seed)
tf.set_random_seed(seed)




In [21]:
data = pd.read_csv('data/pima-indian.csv')

In [22]:
data.head()

Unnamed: 0,pregnant,glucose,blood,thickness,insulin,bmi,pedigree,age,diabete
0,6,148,72,35,0,33.6,0.627,50,1
1,1,85,66,29,0,26.6,0.351,31,0
2,8,183,64,0,0,23.3,0.672,32,1
3,1,89,66,23,94,28.1,0.167,21,0
4,0,137,40,35,168,43.1,2.288,33,1


In [23]:
x = data.iloc[:, 0:8]
y = data.iloc[:, 8]

In [24]:
print(x.head(), y.head())

   pregnant  glucose  blood  thickness  insulin   bmi  pedigree  age
0         6      148     72         35        0  33.6     0.627   50
1         1       85     66         29        0  26.6     0.351   31
2         8      183     64          0        0  23.3     0.672   32
3         1       89     66         23       94  28.1     0.167   21
4         0      137     40         35      168  43.1     2.288   33 0    1
1    0
2    1
3    0
4    1
Name: diabete, dtype: int64


In [25]:
x.head()  # 8개의 컬럼 구성
y.head()  # 1개의 컬럼 

0    1
1    0
2    1
3    0
4    1
Name: diabete, dtype: int64

#### 신경망 구성
+ 입력변수 : 8
+ 출력변수 : 1

In [27]:
model = models.Sequential()
model.add(layers.Dense(20, input_dim=8, activation='relu'))

In [28]:
model.add(layers.Dense(12, activation='relu'))  

In [29]:
model.add(layers.Dense(1, activation='sigmoid'))  # 시그모이드는 0 1 결과값

#### 손실함수, 매개변수 최적화 정의

In [30]:
model.compile(loss='binary_crossentropy',  # 이항 값 : binary
              optimizer='adam', metrics=['accuracy'])

Instructions for updating:
Use tf.where in 2.0, which has the same broadcast rule as np.where


In [31]:
# 훈련
model.fit(x, y, epochs=1000) # verbose=False : 훈련과정 생략

Train on 768 samples
Epoch 1/1000
Epoch 2/1000
Epoch 3/1000
Epoch 4/1000
Epoch 5/1000
Epoch 6/1000
Epoch 7/1000
Epoch 8/1000
Epoch 9/1000
Epoch 10/1000
Epoch 11/1000
Epoch 12/1000
Epoch 13/1000
Epoch 14/1000
Epoch 15/1000
Epoch 16/1000
Epoch 17/1000
Epoch 18/1000
Epoch 19/1000
Epoch 20/1000
Epoch 21/1000
Epoch 22/1000
Epoch 23/1000
Epoch 24/1000
Epoch 25/1000
Epoch 26/1000
Epoch 27/1000
Epoch 28/1000
Epoch 29/1000
Epoch 30/1000
Epoch 31/1000
Epoch 32/1000
Epoch 33/1000
Epoch 34/1000
Epoch 35/1000
Epoch 36/1000
Epoch 37/1000
Epoch 38/1000
Epoch 39/1000
Epoch 40/1000
Epoch 41/1000
Epoch 42/1000
Epoch 43/1000
Epoch 44/1000
Epoch 45/1000
Epoch 46/1000
Epoch 47/1000
Epoch 48/1000
Epoch 49/1000
Epoch 50/1000
Epoch 51/1000
Epoch 52/1000
Epoch 53/1000
Epoch 54/1000
Epoch 55/1000
Epoch 56/1000
Epoch 57/1000
Epoch 58/1000
Epoch 59/1000
Epoch 60/1000
Epoch 61/1000
Epoch 62/1000
Epoch 63/1000
Epoch 64/1000
Epoch 65/1000
Epoch 66/1000
Epoch 67/1000
Epoch 68/1000
Epoch 69/1000
Epoch 70/1000
Epoch 71

<tensorflow.python.keras.callbacks.History at 0x7fa8882b9e50>

In [32]:
print(model.evaluate(x,y)[1])

0.82942706


#### 예측하기
#### 3,173,82,48,465,38.4,2.137,25, 1

In [33]:
new_one = np.array([[3,173,82,48,465,38.4,2.137,25]])
y_predict = model.predict(new_one)
print(y_predict)     # [[0.952982]]

[[0.89821184]]


In [None]:
# 0,135,94,46,145,40.6,0.284,26, 0

In [38]:
new_one = np.array([[0,135,94,46,145,40.6,0.284,26]])
y_predict = model.predict(new_one)
print(y_predict) 

[[0.1829637]]
