# **합성곱 신경망 CNN Convolutional Neural Network**

*   **일반 신경망의 은닉층 Hidden Layer 부분**이, **CNN**에서는 **1개 이상의 콘볼루션층 Convolutional Layer**과 **완전연결층 Flatten Layer**로 바뀜

*  **CNN 동작과정**
  1. 입력 데이터에 대해서,
  2. 피드 포워드 Feed Forward를 수행해서 출력층에서의 출력 값을 계산하고,
  3. 그 값을 정답과 비교하여 크로스 엔트로피 등의 손실 함수 값을 구한 후에,
  4. 이러한 손실 함수 값이 최소가 될 때까지 오차역전파를 이용해서 가중치 F2, F3, W4 / 바이어스 b2, b3, b4를 최적화 하는 구조
  5. 다만, 피드포워드를 수행할 때, CNN은 콘볼루션(conv) 연산과 풀링(pooling) 연산을 한 다음, 완전연결층으로 전달하는 구조라는 것이 일반 신경망과의 차이점

* 예를 들어, 콘볼루션층1의 **입력 데이터**를 **A1**, **적용되는 필터**를 **F2**, 그리고 **바이어스**를 **b2** 라고 하면, 연산 결과는 **A1 * F2 + b2 = C2** 이며, 이때 계산된 **C2** 는 **입력 데이터 A1** 의 **특징 Feature** 을 가지고 있는 데이터

* **콘볼루션 연산**
  1. **스트라이드 Stride** 라고 부르는 일정한 간격으로 **필터(필터의 크기 : 윈도우 Window)** 를 이동
  2. 입력 데이터와 각각 대응되는 필터의 원소끼리 곱한 후에,
  3. 그 곱한 값들을 모두 더하는 과정

* **스트라이드 Stride** : 윈도우에 콘볼루션 연산을 적용한 후에, 다음 윈도우로 이동하는 간격

* **풀링 pooling** : 입력 데이터를 압축하여, 연산량을 줄이는 역할
  
  참고 : 풀링 윈도우의 크기와 스트라이드는 같은 값으로 설정하는 것이 일반적

* **Conv : A1 * F2 + b2 = C2** -----> **Z2 = relu(C2)** ------> **pooling(Z2) = A2**

* **패딩 padding** : 콘볼루션 연산을 수행하기 전에, 입력 데이터 주변을 특정 값(예를 들면 0)으로 채우는 것, 콘볼루션 연산에서 자주 이용, 데이터 크기가 지속적으로 줄어드는 것을 방지

* **완전연결층** : 콘볼루션층의 텐서 값을 행렬에서 하나의 열 Column 로 나타나는 1차원 벡터로 평탄화 시키는 작업을 수행하여, 일반 신경망 연결처럼 출력층의 모든 노드와 완전연결 시키는 역할

* **출력층** : 입력으로 받은 값을, **0과 1 사이의 값으로 모두 정규화** 시키는 **소프트맥스 Softmax** 기능을 하며, **출력 값들의 총합**은 항상 **1** 이 되도록 함.



---


* **H, W** : 입력 데이터 크기
* **FH, FW** : 필터 크기
* **P** : 패딩 폭
* **OH, OW** : 출력 데이터 크기
* **H** : Height / **W** : Width
* **OH** = ( H + 2P - FH ) / S + 1
* **OW** = ( W + 2P - FW ) / S + 1



---

1. **tf.nn.conv2d(input, filter, stride, padding)**

* **input** : 콘볼루션 연산을 위한 입력 데이터, **[batch, in_height, in_width, in_channels]**
* **filter** : 콘볼루션 연산에 적용할 필터, **[filter_height, filter_width, in_channels, out_channels]**
  - **channel** : 데이터가 출입하는 통로
* **strides**: 콘볼루션 연산을 위해 필터를 이동시키는 간격
* **padding** : **'SAME'** 또는 **'VALID'** 값을 가지는 파라미터. **padding='VALID'** 라고 초기화 할 시, 패딩을 적용하지 않는다는 의미로써, 출력 데이터의 크기는 작아짐, **padding='SAME'** 으로 지정하면, 출력 데이터의 크기가 입력 데이터의 크기와 같도록 입력 데이터 주변을 0 값으로 채우는 **제로 패딩 Zero padding** 을 수행


2. **tf.nn.max_pool(value, ksize, strides, padding)**

* **value** : **[batch, height, width, channels]**, 콘볼루션층의 relu를 통과한 출력 결과

* **ksize** : CNN 아키텍처에서 일반적인 ksize는, **[1, height, width, 1]**
* **strides** : 최대값 풀링 Max pooling 을 위해 윈도우를 이동시키는 간격
* **padding** : 최대값 풀링 Max pooling 에서의 padding 값은 최대값 풀링을 수행하기엔, 데이터가 부족한 경우에 준변을 0 값 등으로 채워 주는 역할










# 가상환경 만들기

In [1]:
%env PYTHONPATH = # /env/python

env: PYTHONPATH=# /env/python


In [2]:
!wget https://repo.anaconda.com/miniconda/Miniconda3-py38_4.12.0-Linux-x86_64.sh
!chmod +x Miniconda3-py38_4.12.0-Linux-x86_64.sh
!./Miniconda3-py38_4.12.0-Linux-x86_64.sh -b -f -p /usr/local
!conda update conda

--2024-04-03 14:47:06--  https://repo.anaconda.com/miniconda/Miniconda3-py38_4.12.0-Linux-x86_64.sh
Resolving repo.anaconda.com (repo.anaconda.com)... 104.16.131.3, 104.16.130.3, 2606:4700::6810:8303, ...
Connecting to repo.anaconda.com (repo.anaconda.com)|104.16.131.3|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 76120962 (73M) [application/x-sh]
Saving to: ‘Miniconda3-py38_4.12.0-Linux-x86_64.sh’


2024-04-03 14:47:06 (258 MB/s) - ‘Miniconda3-py38_4.12.0-Linux-x86_64.sh’ saved [76120962/76120962]

PREFIX=/usr/local
Unpacking payload ...
Collecting package metadata (current_repodata.json): - \ done
Solving environment: / - \ | done

## Package Plan ##

  environment location: /usr/local

  added / updated specs:
    - _libgcc_mutex==0.1=main
    - _openmp_mutex==4.5=1_gnu
    - brotlipy==0.7.0=py38h27cfd23_1003
    - ca-certificates==2022.3.29=h06a4308_1
    - certifi==2021.10.8=py38h06a4308_2
    - cffi==1.15.0=py38hd667e15_1
    - charset-norm

In [3]:
import sys
sys.path.append('/usr/local/lib/python3.8/site-packages')

In [4]:
!conda create -n myenv python=3.6

Collecting package metadata (current_repodata.json): - \ | / done
Solving environment: \ failed with repodata from current_repodata.json, will retry with next repodata source.
Collecting package metadata (repodata.json): / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ done
Solving environment: / - \ | / - \ done


  current version: 4.12.0
  latest version: 24.3.0

Please update conda by running

    $ conda update -n base -c defaults conda



## Package Plan ##

  environment location: /usr/local/envs/myenv

  added / updated specs:
    - python=3.6


The following packages will be downloaded:

    package                    |            build
    ---------------------------|-----------------
    certifi-2021.5.30          |   py

In [5]:
%%shell
eval "$(conda shell.bash hook)"
conda activate myenv
pip install tensorflow==1.15

Collecting tensorflow==1.15
  Downloading tensorflow-1.15.0-cp36-cp36m-manylinux2010_x86_64.whl (412.3 MB)
[K     |████████████████████████████████| 412.3 MB 33 kB/s 
[?25hCollecting keras-applications>=1.0.8
  Downloading Keras_Applications-1.0.8-py3-none-any.whl (50 kB)
[K     |████████████████████████████████| 50 kB 8.6 MB/s 
[?25hCollecting numpy<2.0,>=1.16.0
  Downloading numpy-1.19.5-cp36-cp36m-manylinux2010_x86_64.whl (14.8 MB)
[K     |████████████████████████████████| 14.8 MB 56.8 MB/s 
[?25hCollecting opt-einsum>=2.3.2
  Downloading opt_einsum-3.3.0-py3-none-any.whl (65 kB)
[K     |████████████████████████████████| 65 kB 5.5 MB/s 
[?25hCollecting protobuf>=3.6.1
  Downloading protobuf-3.19.6-cp36-cp36m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (1.1 MB)
[K     |████████████████████████████████| 1.1 MB 46.6 MB/s 
[?25hCollecting termcolor>=1.1.0
  Downloading termcolor-1.1.0.tar.gz (3.9 kB)
Collecting grpcio>=1.8.6
  Downloading grpcio-1.48.2-cp36-cp36m-manylinux_



# 해당 코드 .py 파일 실행

In [11]:
%%shell
eval "$(conda shell.bash hook)"
conda activate myenv
python3 /content/cnn.py   # /content 경로에 임의의 .py 파일 생성(파일 더블클릭 후 실행된 파일 화면창에 코드 기록)

Instructions for updating:
non-resource variables are not supported in the long term
Instructions for updating:
Please use alternatives such as official/mnist/dataset.py from tensorflow/models.
Instructions for updating:
Please write your own downloading logic.
Instructions for updating:
Please use tf.data to implement this functionality.
Extracting MNIST_data/train-images-idx3-ubyte.gz
Instructions for updating:
Please use tf.data to implement this functionality.
Extracting MNIST_data/train-labels-idx1-ubyte.gz
Instructions for updating:
Please use tf.one_hot on tensors.
Extracting MNIST_data/t10k-images-idx3-ubyte.gz
Extracting MNIST_data/t10k-labels-idx1-ubyte.gz
Instructions for updating:
Please use alternatives such as official/mnist/dataset.py from tensorflow/models.

 55000 10000 5000

train image shape =  (55000, 784)
train label shape =  (55000, 10)
test image shape =  (10000, 784)
test label shape =  (10000, 10)
2024-04-03 15:12:57.108351: I tensorflow/stream_executor/platfor



# cnn.py 파일에 작성된 코드 내용

In [None]:
import tensorflow.compat.v1 as tf
tf.disable_v2_behavior()

from tensorflow.examples.tutorials.mnist import input_data

import numpy as np

from datetime import datetime


#1. 입력, 정답 데이터 분리

mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

print("\n", mnist.train.num_examples, mnist.test.num_examples, mnist.validation.num_examples)

print("\ntrain image shape = ", np.shape(mnist.train.images))
print("train label shape = ", np.shape(mnist.train.labels))
print("test image shape = ", np.shape(mnist.test.images))
print("test label shape = ", np.shape(mnist.test.labels))


#2. 신경망 구조 및 텐서플로 노드 정의

## CNN 하이퍼 파라미터 설정
learning_rate = 0.001
epochs = 30
batch_size = 100

## 입력과 정답을 위한 플레이스홀더 정의
X = tf.placeholder(tf.float32, [None, 784])
T = tf.placeholder(tf.float32, [None, 10])

## 입력층의 출력 값, 콘볼루션 연산을 위해 reshape 수행
A1 = X_img = tf.reshape(X, [-1, 28, 28, 1])


#3. 콘볼루션1층에서의 연산 정의

## 1번째 콘볼루션층 3X3 크기를 가지는 32개의 필터를 적용
F2 = tf.Variable(tf.random_normal([3, 3, 1, 32], stddev=0.01))
b2 = tf.Variable(tf.constant(0.1, shape=[32]))

## 1번째 콘볼루션 연산을 통해 28 X 28 X 1 => 28 X 28 X 32
C2 = tf.nn.conv2d(A1, F2, strides=[1, 1, 1, 1], padding='SAME')

## relu 출력
Z2 = tf.nn.relu(C2+b2)

## 1번째 max pooling을 통해 28 X 28 X 32 => 14 X 14 X 32
A2 = tf.nn.max_pool(Z2, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')


#4. 콘볼루션층2에서의 연산 정의

# 2번째 콘볼루션층 3X3 크기를 가지는 64개의 필터를 적용
F3 = tf.Variable(tf.random_normal([3, 3, 32, 64], stddev=0.01))
b3 = tf.Variable(tf.constant(0.1, shape=[64]))

# 2번째 콘보루션 연산을 통해 14 X 14 X 32 => 64 X 32 X 14 X 14
C3 = tf.nn.conv2d(A2, F3, strides=[1, 1, 1, 1], padding='SAME')

# relu 출력
Z3 = tf.nn.relu(C3+b3)

# 2qjsWo max pooling을 통해 64 X 32 X 14 X 14 => 64 X 32 X 7 X 7
A3 = tf.nn.max_pool(Z3, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')


#5. 콘볼루션층3에서의 연산 정의

# 3번째 콘볼루션층 3X3 크기를 가지는 128개의 필터를 적용
F4 = tf.Variable(tf.random_normal([3, 3, 64, 128], stddev=0.01))
b4 = tf.Variable(tf.constant(0.1, shape=[128]))

# 3번째 콘보루션 연산을 통해 64 X 32 X 7 X 7 => 128 X 64 X 32 X 7 x 7
C4 = tf.nn.conv2d(A3, F4, strides=[1, 1, 1, 1], padding='SAME')

# relu 출력
Z4 = tf.nn.relu(C4+b4)

# 2qjsWo max pooling을 통해 128 X 64 X 32 X 14 X 14 => 128 X 64 X 32 X 4 X 4
A4 = tf.nn.max_pool(Z4, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')


#6. 완전연결층에서의 연산 정의

## 한 번에 입력되는 4X4 크기를 가진 128개의 activation map을 flatten 시킴
A4_flat = p4_flat = tf.reshape(A4, [-1, 128*4*4])


#7. 출력층에서의 연산 정의

## 출력층

W5 = tf.Variable(tf.random_normal([128*4*4, 10], stddev=0.01))
b5 = tf.Variable(tf.random_normal([10]))

## 출력층 선형 회귀 값 Z5, 즉 softmax에 들어가는 입력 값
Z5 = logits = tf.matmul(A4_flat, W5) + b5

y = A5 = tf.nn.softmax(Z5)


#8. 손실 함수 계산 및 가중치, 바이어스 업데이트

loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits=Z5, labels=T))

optimizer = tf.train.AdamOptimizer(learning_rate)

train = optimizer.minimize(loss)


#9. 정확도 검증 노드 accuracy

predicted_val = tf.equal(tf.argmax(A5, 1), tf.argmax(T, 1))

accuracy = tf.reduce_mean(tf.cast(predicted_val, dtype=tf.float32))


#10. MNIST 인식 정확도 검증

with tf.Session() as sess :

  sess.run(tf.global_variables_initializer())

  start_time = datetime.now()

  for i in range(epochs) :

    total_batch = int(mnist.train.num_examples / batch_size)

    for step in range(total_batch) :

      batch_x, batch_t = mnist.train.next_batch(batch_size)

      loss_val, _ = sess.run([loss, train], feed_dict={X : batch_x, T : batch_t})

      if step % 100 == 0 :
        print("epochs = ", i,", step, ", step, ", loss_val = ", loss_val)

  end_time = datetime.now()

  print("\nelapsed time = ", end_time - start_time)

  test_x_data = mnist.test.images
  test_t_data = mnist.test.labels

  accuracy_val = sess.run(accuracy, feed_dict={X : test_x_data, T : test_t_data})

  print("\nAccuracy = ", accuracy_val)

