# CNN Convolutional Nerual Network

- 합성 곱 프로세스 / 합성 곱 신경망
- 이미지 / 영상 데이터의 픽셀 (RGB) 값을 컴퓨터가 처리할 수 있는 형태로 변환하여, 학습을 수행
- 각각 계산된 RGB값을 Filter(Layer)를 사용하여 간단한 차원의 숫자로 변환
  - Image (225x225) -> 불량 / 정상
  - 큰 크기의 차원을 각각의 필터를 걸어 축소
  - 각 필터에는 데이터의 특징(edge)을 뽑아 낼 수 있는 연산 구조가 존재

- 이미지를 컴퓨터가 알수 있도록 tensor로 변경
- Convolution Layer : 합성곱 / 이미지 데이터의 특징점을 찾아 학습하는 신경망 구조

- Pooling Layer : 데이터의 차원을 줄여주는 신경망 구조

- Fully Connected Layer : 활성함수에 앞서 처리된 데이터를 넣어 판별/예측을 하는 신경망 구조

In [1]:
# 이미지를 Tensor로 변환하는 직업

from PIL import Image # 이미지 처리 라이브러리
import pandas as pd
import numpy as np
import os

In [12]:
# 이미지 파일이 있는 경로를 호출
image_path = 'C:/Users/UserK/Desktop/Ranee/data/ML/27_wind_shield_vision_data/left_images/'

In [16]:
# 해당 이미지 경로(이미지가 있는 폴더 내) 이미지 파일을 호출
file_name_list = os.listdir(image_path) # listdir() : 특정 폴더 내 파일 명을 확인
file_name_list
image1 = Image.open(image_path+file_name_list[0]) # 이미지 파일 포덜 내 0 번째 이미지 파일을 호출

In [15]:
# 이미지를 처리할 수 있는 숫자 형테로 변환
import tensorflow as tf
from keras.preprocessing import image

In [19]:
# 앞서 호출한 이미지 파일(image1)을 RGB 값으로 변환
image_array = image.img_to_array(image1)
image_array.shape # 이미지 사이즈 (높이 x 너비 x 각 RGB값)

(256, 320, 3)

In [20]:
# 해당 이미지의 Pixcel 값을 정규화 (0~1 사이의 값으로 변환)
# Pixcel 값 : 0 ~ 225
image_array2 = tf.image.resize( image_array, (320,256)) # 높이 x 너비 이미지 구조를 '너비 x 높이'로 변환 & Tensor 형태의 자료구조로 변환
image_scale = image_array2 / 225 # 이미지 값을 0~1 사이 값으로 변환

In [21]:
# 각 이미지를 구분할 수 있는 차원을 부여 (여러 장의 이미지를 가져왔을 때, 각각의 이미지를 구분할 수 있게끔 차원을 생성)
result_image = tf.expand_dims(image_scale, axis=0) #  단순히 신경망 알고리즘에 사용하기 위해 차원값을 부여  shape : (1, 320, 256, 3)

- 폴더 내 모든 이미지를 Tensor로 변환하는 함수를 구성

In [23]:
def load_image_tf(image_path) :
    # 모든 이미지를 가져와 Pixel을 tensor로 변환한 뒤, 해당 데이터를 담을 리스트
    processed_image = []
    for i in os.listdir(image_path) : # image_path 내 모든 파일을 가져와 i 인자로 반복 수행
        # i로 선언된 이미지 파일을 하나 호출
        img = Image.open(image_path+i)
        # i로 선언된 이미지를 Array로 변환
        img_array = image.img_to_array(img)
        # 변환된 Array의 높이와 너비를 바꾸고 tensor형태로 변환
        image_array2 = tf.image.resize( image_array, (320,256))
        # 스케일링
        image_scale = image_array2 / 225
        # 이미지를 구분하는 차원도 추가
        result_image = tf.expand_dims(image_scale, axis=0)
        # 처리된 이미지를 Tensor 형태로 특정 리스트에 추가
        processed_image.append(result_image)
    return processed_image

In [31]:
left_image = load_image_tf('C:/Users/UserK/Desktop/Ranee/data/ML/27_wind_shield_vision_data/left_images/')
right_image = load_image_tf('C:/Users/UserK/Desktop/Ranee/data/ML/27_wind_shield_vision_data/right_images/')

In [32]:
# Y 데이터를 호출
df_label_train = pd.read_csv(r'C:\Users\UserK\Desktop\Ranee\data\ML\27_wind_shield_vision_data\left_label.csv', header=None)

In [33]:
df_label_train.describe() # 양품/불량품의 기준 , 정상 : 0.8mm ~ 1.5mm

Unnamed: 0,0
count,414.0
mean,1.205242
std,0.381965
min,0.68
25%,0.93
50%,1.08
75%,1.3675
max,2.16


In [34]:
cond1 = (df_label_train[0]>=0.8) & (df_label_train[0]<=1.5)
df_label_train.loc[cond1,'Target'] = 0 # 0.8~1.5 사이의 데이터를 정상(0)으로 분류
df_label_train.loc[~cond1,'Target'] = 1
df_label_train['Target'].value_counts()

Target
0.0    293
1.0    121
Name: count, dtype: int64

In [35]:
# 앞서 처리한 이미지 리스트를 하나의 거대한 Tensor로 변환
X_train = tf.concat(left_image, axis=0) # Tensor로 변환된 left이미지를 X_train으로 선언
X_test = tf.concat(right_image, axis=0)  # Tensor로 변환된 right이미지를 X_test으로 선언

In [36]:
# 앞서 가져온 Label(불량여부) 데이터를 이미지 데이터의 순서에 맞게 매칭
Y_train = tf.convert_to_tensor(df_label_train['Target'].values)
# 불량 여부 Series 데이터를 하나의 리스트로 변환

In [38]:
# 합성곱 신경망 구현을 위한 라이브러리를 호출
from keras.models import Sequential
from keras.layers import Conv2D, MaxPool2D # Convolution + Pooling Layer 
from keras.layers import Dense # Fully Connected Layer 
from keras.layers import Flatten # Convolution + Pooling Layer -> Fully Connected Layer 

In [39]:
model = Sequential() # 전결합 신경망 Layer 구성

# Convolution Layer : 32개의 Node에 3x3 필터를 적용하여 처리
model.add( Conv2D(32, (3,3), input_shape=(320,256,3),activation='relu') )

# Pooling layer : 앞서 처리된 2x2 최대값을 찾는 필터를 적용하여 처리
model.add( MaxPool2D(pool_size=(2,2)) )

# 앞서 Convolution + Pooling 한번 더 반복해서 수행
model.add ( Conv2D(32, (3,3), activation='relu'))
model.add( MaxPool2D(pool_size=(2,2)) )

# 처리된 이미지를 한줄의 Vector 형태로 변환
model.add( Flatten() )  # 1차원으로 평탄화 [0,22,11,22, ...]
model.add( Dense(128, activation='relu') ) # 128개의 Node를 통과

model.add( Dense(1,activation='sigmoid') ) # 0~1 사이의 sigmoid 함수형태로 출력되게 끔 계산
model.compile( optimizer='rmsprop' , loss='binary_crossentropy', metrics=['accuracy'])
model.fit(X_train, Y_train, epochs=10, validation_split=0.3)

Epoch 1/10


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m10/10[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 361ms/step - accuracy: 0.5743 - loss: 11.0289 - val_accuracy: 0.8400 - val_loss: 0.4572
Epoch 2/10
[1m10/10[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 335ms/step - accuracy: 0.6618 - loss: 0.6853 - val_accuracy: 0.8400 - val_loss: 0.4408
Epoch 3/10
[1m10/10[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 344ms/step - accuracy: 0.6164 - loss: 0.7242 - val_accuracy: 0.8400 - val_loss: 0.4618
Epoch 4/10
[1m10/10[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 343ms/step - accuracy: 0.5944 - loss: 0.8200 - val_accuracy: 0.8400 - val_loss: 0.4414
Epoch 5/10
[1m10/10[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 346ms/step - accuracy: 0.6779 - loss: 0.6397 - val_accuracy: 0.8400 - val_loss: 0.4662
Epoch 6/10
[1m10/10[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 351ms/step - accuracy: 0.6969 - loss: 0.6554 - val_accuracy: 0.1600 - val_loss: 1.0793
Epoch 7/10
[1m10/10[0m [32m━━━━━━━━

<keras.src.callbacks.history.History at 0x2023fdfc350>

In [40]:
def func1(result) : # 신경망 알고리즘의 출력결과가 0~1 확률값이므로, 확률값을 1 또는 0 분류 값으로 변환
    if result >= 0.5 : # 0.5 , 50% 기준으로 이상이면 불량 / 미만이면 정상
        return 1
    else : return 0

In [44]:
model.predict(X_train)

[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 76ms/step


array([[0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.33

In [45]:
model.predict(X_train).flatten()

[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 76ms/step


array([0.330905, 0.330905, 0.330905, 0.330905, 0.330905, 0.330905,
       0.330905, 0.330905, 0.330905, 0.330905, 0.330905, 0.330905,
       0.330905, 0.330905, 0.330905, 0.330905, 0.330905, 0.330905,
       0.330905, 0.330905, 0.330905, 0.330905, 0.330905, 0.330905,
       0.330905, 0.330905, 0.330905, 0.330905, 0.330905, 0.330905,
       0.330905, 0.330905, 0.330905, 0.330905, 0.330905, 0.330905,
       0.330905, 0.330905, 0.330905, 0.330905, 0.330905, 0.330905,
       0.330905, 0.330905, 0.330905, 0.330905, 0.330905, 0.330905,
       0.330905, 0.330905, 0.330905, 0.330905, 0.330905, 0.330905,
       0.330905, 0.330905, 0.330905, 0.330905, 0.330905, 0.330905,
       0.330905, 0.330905, 0.330905, 0.330905, 0.330905, 0.330905,
       0.330905, 0.330905, 0.330905, 0.330905, 0.330905, 0.330905,
       0.330905, 0.330905, 0.330905, 0.330905, 0.330905, 0.330905,
       0.330905, 0.330905, 0.330905, 0.330905, 0.330905, 0.330905,
       0.330905, 0.330905, 0.330905, 0.330905, 0.330905, 0.330

In [46]:
pd.Series(model.predict(X_train).flatten())

[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 75ms/step


0      0.330905
1      0.330905
2      0.330905
3      0.330905
4      0.330905
         ...   
409    0.330905
410    0.330905
411    0.330905
412    0.330905
413    0.330905
Length: 414, dtype: float32

In [48]:
Y_train_pred = pd.Series(model.predict(X_train).flatten()).apply(func1)
Y_train_pred 

[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 74ms/step


0      0
1      0
2      0
3      0
4      0
      ..
409    0
410    0
411    0
412    0
413    0
Length: 414, dtype: int64

In [49]:
from sklearn.metrics import classification_report

In [50]:
print(classification_report(Y_train,Y_train_pred))

              precision    recall  f1-score   support

         0.0       0.71      1.00      0.83       293
         1.0       0.00      0.00      0.00       121

    accuracy                           0.71       414
   macro avg       0.35      0.50      0.41       414
weighted avg       0.50      0.71      0.59       414



  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))


In [51]:
df_label_test = pd.read_csv(r'C:\Users\UserK\Desktop\Ranee\data\ML\27_wind_shield_vision_data\right_label.csv', header=None)

In [53]:
cond1 = (df_label_test[0] >= 0.8) & (df_label_test[0] <= 1.5)
df_label_test.loc[cond1, 'Target'] = 0
df_label_test.loc[~cond1, 'Target'] = 1
Y_test = tf.convert_to_tensor(df_label_test['Target'].values)

In [54]:
Y_test_pred = pd.Series(model.predict(X_test).flatten()).apply(func1)

[1m14/14[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 74ms/step


In [55]:
print(classification_report(Y_test,Y_test_pred))

              precision    recall  f1-score   support

         0.0       0.79      1.00      0.88       333
         1.0       0.00      0.00      0.00        90

    accuracy                           0.79       423
   macro avg       0.39      0.50      0.44       423
weighted avg       0.62      0.79      0.69       423



  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))
  _warn_prf(average, modifier, msg_start, len(result))


- 신경망 Layer를 (Node도 더욱 많이 넣어) 더욱 깊이 쌓아 학습을 수행한다면 승능이 자연히 올라감
- 그러나, 여러 Layer를 통과할 때, 경사 소실 (Gradient Vansing) 또는 폭0주 (Exploding)현상이 발생하여, 과적합(Overfitting) 또는 Underfitting 현상이 발생
- **해결방안**
  - 가중치 초기화 (Weight Initializtion) : Layer나 Node가 많을 때, 중간의 임의의 Weight 가중치를 초기화 하여, 기울기 소실/폭주 현상을 방지
    - RBM / Xavier / He 
  - 배치의 정규화 (Batch Normaliztion) : 각 Layer에서 활성함수를 통과하기 전/후에 Input값을 정규화 하여, Scale를 원점(최초로 입력된 Input)에 맞춤
  - 고속 옵티마이저 : Weight를 Update하는 방식을 바꾸어 빠르게 학습을 수행
    - Compile 단계에서 Loss Function과 함께 결정 / Weight를 어떻게 Update 해야할지에 대한 전략
    - 기존과 다르게 더 빠른 속도로 Weigth를 참게 끔 연산 항을 추가
    - Gradient Descent : 오차 (Loss Function에 의해 계산된)가 최소가 되는 방향으로 가중치 변경
    - SGD(확률적 경사하강법) : 확률적으로 일부의 데이터를 선택하여 가중치 변경
    - Momentum Optimizer : 처음에는 천천히 가중치를 업데이트하다가(GD), 모멘텀 벡터(Moumentum Vector)라고 부르는 항을 추가하여 빠르게 가중치를 Update(Gradient 가속)
    - Nesterov Acceleated Gradient : 현재의 Gradient 값과 이전 Step의 Moumetum Vector를 조합하여 더 빠른 속도로 Update( Moumetum Vector에 가중항을 추가)
  - RMSprop (Root Mean Squre Propagation) : Gradient 값을 계산할 때, 학습율을 지수함수 형태로 계산하여 학습 속도를 더욱 빠르게 개선 (수업에서 계속 사용했던거)
  - Adam (Adaptive Moment Estimation) : RMSProp과 Momentum Opimizer 기법을 결합하여, 학습율을 조절하며 각 함수의 이동평균 (Moving Average)함수를 이용해 최적 Weight 찾는 기법 => 최근에 가장 많이 사용하는 최적화 기법 (속도/성능면에서 가장 우수)

In [56]:
# 학습한 모델을 파일로 저장
model.save('model.h5') # 모델저장



**전이 학습 (Transfer Learning)**
- 매우 큰 규모의 신경망 구조를 학습하는 경우, 매우 많은 시간과 자원이 소요
- 현재 학습하고자 하는 데이터와 유사한 기존의 신경망 구조가 있다면, 해당 구조(모델)을 가져와 그 모델의 하위계층 또는 전체 계층을 재사용하여 학습 (자원의 효과적 사용)
- 학습이 된 Weight가 해당 모델에 저장되어 있어, 학습을 이어서 수행

In [57]:
import keras.models as models

In [58]:
# 사전에 학습한 모델 호출
model_nn1 = models.load_model('model.h5')



In [61]:
len(model_nn1.layers) # 해당 모델의 Layer 층 개수를 확인

7

In [62]:
model_nn1.layers

[<Conv2D name=conv2d, built=True>,
 <MaxPooling2D name=max_pooling2d, built=True>,
 <Conv2D name=conv2d_1, built=True>,
 <MaxPooling2D name=max_pooling2d_1, built=True>,
 <Flatten name=flatten, built=True>,
 <Dense name=dense, built=True>,
 <Dense name=dense_1, built=True>]

In [65]:
# 새로 불러온 모델을 복제하여 사용 (모델의 구조만 그대로 가져와 사용)
model_nn1_clone = models.clone_model(model_nn1)

In [66]:
# 불러온 모델 내 특성 Layer에 있는 가중치
model_nn1_clone.layers[0].get_weights()

[array([[[[ 1.18350551e-01, -8.43971595e-02,  2.65509933e-02,
            1.83938593e-02,  1.00664183e-01, -7.72971734e-02,
            9.50977951e-02,  8.14708918e-02, -5.50175682e-02,
           -6.51379302e-02, -4.89765927e-02,  7.92654753e-02,
           -9.86876190e-02,  2.07769722e-02, -2.60441899e-02,
            1.48562342e-02, -8.81530866e-02,  4.74429578e-02,
            1.01734698e-02, -1.25730574e-01, -4.12350595e-02,
           -2.21991166e-02,  1.14998087e-01,  1.22055903e-01,
           -1.25941753e-01, -8.45611840e-02,  5.19542843e-02,
            7.94642866e-02,  3.98914814e-02,  2.06142664e-03,
            3.33507508e-02, -6.09324202e-02],
          [-1.34903505e-01,  7.51530528e-02, -1.21720284e-01,
            1.44392252e-04, -4.62192968e-02, -1.07384175e-02,
           -3.64616513e-04,  3.39360684e-02,  5.24284840e-02,
           -3.25093046e-02, -7.73267895e-02,  3.13026458e-02,
           -9.41658616e-02,  2.20429599e-02, -1.33627608e-01,
           -6.55920506e-

In [67]:
# model_nn1내 Layer에 있는 가중치를 그대로 model_nn1_clone 구조에 가중치로 전이(trasfer)
model_nn1_clone.set_weights(model_nn1.get_weights())

In [68]:
model_nn1_clone.predict(X_train) # 불러온 신경망 알고리즘으로 예측

[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 82ms/step


array([[0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.330905],
       [0.33

In [70]:
model_nn1_clone.summary() # 신경망 모델의 세부 사항 확인

In [72]:
# 불러온 모델에 데이터를 이어서 학습
model_nn1_clone.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model_nn1_clone.fit(X_train, Y_train, epochs=10)

Epoch 1/10
[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 355ms/step - accuracy: 0.6376 - loss: 0.6531
Epoch 2/10
[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 353ms/step - accuracy: 0.7080 - loss: 0.6062
Epoch 3/10
[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 353ms/step - accuracy: 0.7008 - loss: 0.6138
Epoch 4/10
[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 353ms/step - accuracy: 0.7356 - loss: 0.5808
Epoch 5/10
[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 357ms/step - accuracy: 0.7236 - loss: 0.6165
Epoch 6/10
[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 358ms/step - accuracy: 0.7369 - loss: 0.5757
Epoch 7/10
[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 353ms/step - accuracy: 0.7381 - loss: 0.5916
Epoch 8/10
[1m13/13[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 354ms/step - accuracy: 0.7324 - loss: 0.5835
Epoch 9/10
[1m13/13[0m [32m━━━━━━━━━━

<keras.src.callbacks.history.History at 0x202c8cb3890>