DeepLearning

Deep Learning Study Project

TensorFlow

TensorFlow는 기계 학습과 딥러닝을 위해 Google에서 만든 E2E Opensource Platform이다.
Tools, Library, Community Resource로 구성되어 첨단 기술을 구현할 수 있고, 개발자들은 ML이 접목된 application을 손쉽게 빌드 및 배포할 수 있다.

Installation

다른 프로그램에 영향을 미치지 않도록 Anaconda 환경에서 설치한다.
- 설치파일=Anaconda3-5.2.0-Windows-x86_64.exe (파이썬 3.6)
- numpy 버전=1.15.4
- tensorflow 버전=1.12.0
- keras 버전=2.2.4

$conda update -n base conda # conda 자체를 업데이트
$conda update --all # 설치된 파이썬 패키지를 모두 최신 버전으로 업데이트

tensorflow 이름을 갖는 conda 환경한다.

$ conda create -n tensorflow python=3.7

환경을 활성화시키고 그 안에서 pip를 이용하여 텐서플로우를 설치

$ source activate tensorflow # Linux 환경
$ virtualenv tensorflow # Windows 환경

(tensorflow)$ pip install tensorflow # tensorflow 설치
(tensorflow)$ jupyter notebook --port=8888

(tensorflow)$ source deactivate # Linux 환경
(tensorflow)$ virtualenv deactivate # Windows 환경

Getting started with Voilà

Installation

$ conda install -c conda-forge voila
$ pip install voila

The example notebook also requires bqplot and ipyvuetify:

pip install bqplot
pip install ipyvuetify
pip install voila-vuetify
voila --template vuetify-default bqplot_vuetify_example.ipynb

http://localhost:8866/

Keras

tf.keras는 딥러닝 엔진인 TensorFlow2.0의 딥러닝 모델 설계와 훈련을 위한 고수준(high-level) API로 정의
몇 가지 model-building APIs(Sequential, Functional, and Subclassing)을 제공하여 프로젝트에 적합한 추상화 수준을 선택할 수 있다

Model은 Network(네트워크)-Objective Function(목표함수)-Optimizer(최적화기)로 구성되어 있다. model=sequential()
Compile은 네트워크가 학습할 준비가 되었을 때, 이 구성요소들을 묶어 주는 역할을 한다. model.compile
Application은 사전 교육된 가중치와 함께 사용할 수 있는 심층 학습 모델로 예측, 형상 추출 및 미세 조정에 사용할 수 있다. 모델을 인스턴스화할 때 가중치가 자동으로 다운로드된다. (저장 위치 ~/.keras/models/.)
- Xception (88MB, 126 Layers)
- VGG16 (528MB, 23)
- VGG19(549MB, 26)
- ResNet50(99MB, 168)
- InceptionV3(92MB, 159)
- InceptionResNetV2(215MB, 572)
- MobileNet(17MB, 88)
- DenseNet121(33MB, 121)
- DenseNet169(57MB, 169)
- DenseNet201(80MB, 201)
- NASNet...
Objective Function(목표함수)에는 mean_squared_error, categorical_crossentropy, binary_crossentropy 등이 있다.
- loss function (or objective function, or optimization score function)은 모델을 컴파일 하기 위해 요구되는 2개의 파라미터 중 하나이다. model.compile(loss='mean_squared_error', optimizer='sgd')
Optimizer는 모델을 컴파일 하기 위해 요구되는 또 하나의 파라미터로 Network을 Update할 수 있다.
Network을 얼마간의 오차로 Update 하도록 알려 주는 역할은 Objective Function가 수행한다.

from keras import optimizers

model = Sequential()
model.add(Dense(64, kernel_initializer='uniform', input_shape=(10,)))
model.add(Activation('softmax'))

sgd = optimizers.SGD(lr=0.01, decay=1e-6, momentum=0.9, nesterov=True)
model.compile(loss='mean_squared_error', optimizer=sgd)

AutoKeras는 자동 시스템 학습(AutoML)을 위한 오픈 소스 소프트웨어 라이브러리이다.
AutoKeras는 아키텍처 및 심층 학습 모델의 하이퍼 프레임을 자동으로 검색하는 기능을 제공한다.
AutoKeras1.0이 곧 출시 예정이다. (현재 AutoKeras는 Python3.6과만 호환)

패션 MNIST

10개의 범주(category)와 70,000개의 흑백 이미지로 구성된 패션 MNIST 데이터셋을 사용
네트워크를 훈련하는데 60,000개의 이미지를 사용하여, 네트워크가 얼마나 정확하게 이미지를 분류하는지 10,000개의 이미지로 평가

[Data Set 준비]

필요한 훈련set, 검증set, Test Set을 준비 : MNIST은 28×28 크기의 0~9사이의 숫자 이미지와 이에 해당하는 레이블(Label)로 구성된 데이터베이스

fashion_mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

load_data() 함수를 호출하면 네 개의 넘파이(NumPy) 배열이 반환
- train_images와 train_labels 배열은 모델 학습에 사용되는 훈련 세트
- test_images와 test_labels 배열은 모델 테스트에 사용되는 테스트 세트
나중에 이미지를 출력할 때 사용하기 위해 별도의 변수를 만들어 저장

class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

[Data 탐색]

train_images.shape // 훈련 세트에 60,000개의 이미지가 있으며, 각 이미지는 28x28 픽셀로 표현
len(train_labels) // 훈련 세트에는 60,000개의 레이블
train_labels // 각 레이블은 0과 9사이의 정수
test_images.shape // 테스트 세트에는 10,000개의 이미지가 있으며 28x28 픽셀로 표현
len(test_labels) // 테스트 세트는 10,000개의 이미지에 대한 레이블을 가지고 있음

[데이터 전처리]

네트워크를 훈련하기 전에 데이터를 전처리해야 하며, 훈련 세트에 있는 첫 번째 이미지를 보면 픽셀 값의 범위가 0~255 사이라는 것을 알 수 있다.

plt.figure()
plt.imshow(train_images[0])
plt.colorbar()
plt.grid(False)
plt.show()

신경망 모델에 주입하기 전에 이 값의 범위를 0~1 사이로 조정하기 위해 255로 나누어야 힌다. 훈련 세트와 테스트 세트를 동일한 방식으로 전처리하는 것이 중요하다.

train_images = train_images / 255.0
test_images = test_images / 255.0

훈련 세트에서 처음 25개 이미지와 그 아래 클래스 이름을 출력. 데이터 포맷이 올바른지 확인하고 네트워크 구성과 훈련할 준비

plt.figure(figsize=(10,10))
for i in range(25):
    plt.subplot(5,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(train_images[i], cmap=plt.cm.binary)
    plt.xlabel(class_names[train_labels[i]])
plt.show()

[모델 구성]

신경망 모델을 만들려면 모델의 층을 구성한 다음 모델을 컴파일 해야 한다.
신경망의 기본 구성 요소는 층(layer)으로 주입된 데이터에서 표현을 추출한다. tf.keras.layers.Dense와 같은 층들의 가중치(parameter)는 훈련하는 동안 학습된다.

model = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.Dense(10, activation='softmax')
])

[모델 컴파일]

모델을 훈련하기 전에 필요한 몇 가지 설정이 모델 컴파일 단계에서 추가된다.
- 손실 함수(Loss function) : 훈련 하는 동안 모델의 오차를 측정. 모델의 학습이 올바른 방향으로 향하도록 이 함수를 최소화해야 한다.
- Optimizer : 데이터와 손실 함수를 바탕으로 모델의 업데이트 방법을 결정
- 지표(Metrics) : 훈련 단계와 테스트 단계를 모니터링하기 위해 사용. 다음 예에서는 올바르게 분류된 이미지의 비율인 정확도를 사용

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

[모델 훈련]

신경망 모델 훈련은 다음과 같은 단계로 진행된다.
- 훈련 데이터를 모델에 주입
- 모델이 이미지와 레이블을 매핑하는 방법을 학습
- 테스트 세트에 대한 모델의 예측을 만든다. [test_images 배열]
- 훈련을 시작하기 위해 model.fit 메서드를 호출하면 모델이 훈련 데이터를 학습한다.

model.fit(train_images, train_labels, epochs=5)

[정확도 평가]

테스트 세트에서 모델의 성능을 비교한다.
테스트 세트의 정확도가 훈련 세트의 정확도보다 조금 낮다.
훈련 세트의 정확도와 테스트 세트의 정확도 사이의 차이는 과대적합(overfitting) 때문이다. 이는 머신러닝 모델이 훈련 데이터보다 새로운 데이터에서 성능이 낮아지는 현상을 말한다.

test_loss, test_acc = model.evaluate(test_images,  test_labels, verbose=2)
print('\n테스트 정확도:', test_acc)

[예측 만들기]

훈련된 모델을 사용하여 이미지에 대한 예측을 만들 수 있다.

predictions = model.predict(test_images)
predictions[0] //첫 번째 예측을 확인
np.argmax(predictions[0])  // 가장 높은 신뢰도를 가진 레이블
test_labels[0] // 값이 맞는지 테스트 레이블을 확인

// 10개 클래스에 대한 예측을 모두 그래프로 표현
def plot_image(i, predictions_array, true_label, img):
  predictions_array, true_label, img = predictions_array[i], true_label[i], img[i]
  plt.grid(False)
  plt.xticks([])
  plt.yticks([])

  plt.imshow(img, cmap=plt.cm.binary)

  predicted_label = np.argmax(predictions_array)
  if predicted_label == true_label:
    color = 'blue'
  else:
    color = 'red'

  plt.xlabel("{} {:2.0f}% ({})".format(class_names[predicted_label],
                                100*np.max(predictions_array),
                                class_names[true_label]),
                                color=color)

def plot_value_array(i, predictions_array, true_label):
  predictions_array, true_label = predictions_array[i], true_label[i]
  plt.grid(False)
  plt.xticks([])
  plt.yticks([])
  thisplot = plt.bar(range(10), predictions_array, color="#777777")
  plt.ylim([0, 1])
  predicted_label = np.argmax(predictions_array)

  thisplot[predicted_label].set_color('red')
  thisplot[true_label].set_color('blue')

// 0번째 원소의 이미지, 예측, 신뢰도 점수 배열을 확인
i = 0
plt.figure(figsize=(6,3))
plt.subplot(1,2,1)
plot_image(i, predictions, test_labels, test_images)
plt.subplot(1,2,2)
plot_value_array(i, predictions,  test_labels)
plt.show()

i = 12
plt.figure(figsize=(6,3))
plt.subplot(1,2,1)
plot_image(i, predictions, test_labels, test_images)
plt.subplot(1,2,2)
plot_value_array(i, predictions,  test_labels)
plt.show()

// 처음 X 개의 테스트 이미지와 예측 레이블, 진짜 레이블을 출력
// 올바른 예측은 파랑색으로 잘못된 예측은 빨강색으로 표시
num_rows = 5
num_cols = 3
num_images = num_rows*num_cols
plt.figure(figsize=(2*2*num_cols, 2*num_rows))
for i in range(num_images):
  plt.subplot(num_rows, 2*num_cols, 2*i+1)
  plot_image(i, predictions, test_labels, test_images)
  plt.subplot(num_rows, 2*num_cols, 2*i+2)
  plot_value_array(i, predictions, test_labels)
plt.show()

마지막으로 훈련된 모델을 사용하여 한 이미지에 대한 예측을 만든다.

// 테스트 세트에서 이미지 하나를 선택
img = test_images[0]
print(img.shape)

tf.keras 모델은 한 번에 샘플의 묶음 또는 배치(batch)로 예측을 만드는데 최적화되어 있어 하나의 이미지를 사용할 때에도 2차원 배열로 만들어야 한다.

// 이미지 하나만 사용할 때도 배치에 추가
img = (np.expand_dims(img,0))
print(img.shape)

// 이 이미지의 예측을 생성
predictions_single = model.predict(img)
print(predictions_single)

// model.predict는 2차원 넘파이 배열을 반환하므로 첫 번째 이미지의 예측을 선택
np.argmax(predictions_single[0])

케라스와 텐서플로 허브를 사용한 영화 리뷰 텍스트 분류하기

영화 리뷰(review) 텍스트를 긍정(positive) 또는 부정(negative)으로 분류한다. 이 예제는 이진(binary)-또는 클래스(class)가 두 개인- 분류 문제
Internet Movie Database에서 수집한 50,000개의 영화 리뷰 텍스트를 담은 IMDB 데이터셋을 사용
25,000개 리뷰는 훈련용, 25,000개는 테스트용
Tensorflow에서 Model을 만들고 훈련하기 위한 고수준 Python API인 tf.keras와 전이 학습 Library이자 Platform인 Tensorflow Hub를 사용
Tensorflow Hub는 재사용 가능한 머신러닝 모델의 재사용 가능한 부분을 게시, 검색, 소비하기 위한 라이브러리
모듈은 해당 가중치 및 자산이 포함되어 있으며 전이 학습이라는 프로세스에서 여러 작업 간에 재사용할 수 있는 TensorFlow 그래프의 자체 포함된 조각. 전이 학습을 통해 다음과 같은 작업이 가능
- 소규모 데이터세트를 사용한 모델 학습
- 일반화 개선
- 학습 속도 개선

// TensorFlow 2.0.0 및 TensorFlow Hub 설치
$ conda install tensorflow
$ pip install "numpy<1.17"
$ pip install "tensorflow_hub==0.7.0"
$ pip install "tf-nightly"
$ pip install --upgrade tensorflow-hub
$ pip install tensorflow-datasets

[colab text_classification_with_hub.ipynb] https://colab.research.google.com/github/tensorflow/docs/blob/master/site/ko/tutorials/keras/text_classification_with_hub.ipynb?hl=ko

Batch Size
Epoch

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
.ipynb_checkpoints		.ipynb_checkpoints
images		images
tensorflow		tensorflow
Fashion_MNIST.ipynb		Fashion_MNIST.ipynb
IMDB.ipynb		IMDB.ipynb
LICENSE		LICENSE
README.md		README.md
bqplot_vuetify_example.ipynb		bqplot_vuetify_example.ipynb

License

mincloud1501/DeepLearning

Folders and files

Latest commit

History

Repository files navigation

DeepLearning

TensorFlow

Installation

Getting started with Voilà

Keras

패션 MNIST

[Data Set 준비]

[Data 탐색]

[데이터 전처리]

[모델 구성]

[모델 컴파일]

[모델 훈련]

[정확도 평가]

[예측 만들기]

케라스와 텐서플로 허브를 사용한 영화 리뷰 텍스트 분류하기

Pytorch

fast.ai

About

Resources

License

Stars

Watchers

Forks

Languages