In [1]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
import tensorflow as tf
from tensorflow.keras import layers, models
import matplotlib.pyplot as plt
from tensorflow.keras.models import Sequential
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.layers import Dense, Flatten, Conv2D, MaxPooling2D
import cv2
import tensorflow as tf
from skimage.metrics import structural_similarity as ssim


In [2]:
def visualize_images(img, num_images=5):
    total_images = len(img)
    num_rows = int(np.ceil(total_images / num_images))  # 필요한 행의 수 계산
    
    # 서브플롯 생성 (num_rows 행과 num_images 열)
    fig, axes = plt.subplots(num_rows, num_images, figsize=(num_images * 3, num_rows * 3))
    
    # 만약 num_rows가 1이라면, axes를 1차원 배열로 처리하도록 설정
    if num_rows == 1:
        axes = np.expand_dims(axes, axis=0)
    
    # 이미지 그리기
    for i in range(total_images):
        row = i // num_images  # 현재 행
        col = i % num_images  # 현재 열
        axes[row, col].imshow(img[i].squeeze(), cmap='gray')  # 이미지 표시
        axes[row, col].set_title(f"Image {i+1}")  # 이미지 제목 설정
        axes[row, col].axis('off')  # 축 숨기기
    
    # 남은 빈 서브플롯 숨기기
    for i in range(total_images, num_rows * num_images):
        row = i // num_images
        col = i % num_images
        axes[row, col].axis('off')  # 빈 칸은 숨기기
    
    plt.tight_layout()
    plt.show()

FDC 데이터 불러오기

In [3]:
df_final = pd.read_csv('./data/fdc_data.csv')

정규화

In [4]:
scaler = StandardScaler()

sensor_data = df_final.iloc[:,5:]
sensor_data_scaled = scaler.fit_transform(sensor_data)
df_sensor_scaled = pd.DataFrame(sensor_data_scaled, columns=sensor_data.columns)
df_fdc_scaled = pd.concat([df_final.iloc[:,:5].reset_index(drop=True), df_sensor_scaled.reset_index(drop=True)], axis=1)

라벨 추출

In [5]:
labels = df_fdc_scaled['PASS(1)/FAIL(0)'].values
labels = np.array(labels)

이미지 데이터 불러오기

In [29]:
image_data = np.load('./data/image_data.npy')

In [None]:
image_data.shape

모델

1. FDC data → Image 예측

2. Image → Scratch 분류

Train / Validation / Test

In [7]:
SEED = 42

In [8]:
fdc_train, fdc_temp, img_train, img_temp, labels_train, labels_temp = train_test_split(
    df_sensor_scaled, image_data, labels, test_size=0.2, random_state=SEED
)

fdc_val, fdc_test, img_val, img_test, labels_val, labels_test = train_test_split(
    fdc_temp, img_temp, labels_temp, test_size=0.25, random_state=SEED  # 0.25 of the remaining 20% = 5% of total
)

In [None]:
fdc_train.shape, fdc_val.shape, fdc_test.shape, img_train.shape, img_val.shape, img_test.shape

2. FDC data → Image 예측 모델 학습 (20241027 Model)

In [None]:
# import tensorflow as tf
# from tensorflow.keras import layers, models

# # FDC 데이터를 이미지 잠재 표현으로 변환하는 인코더
# def build_fdc_encoder(input_dim, latent_dim):
#     inputs = layers.Input(shape=(input_dim,))
#     x = layers.Dense(512, activation='relu')(inputs)
#     x = layers.Dense(1024, activation='relu')(x)
#     x = layers.Dense(latent_dim, activation='relu')(x)
#     x = layers.Reshape((16, 16, 128))(x)  # 잠재 공간 형태로 변환
#     return models.Model(inputs, x, name="fdc_encoder")

# # 디코더 모델 정의
# def build_decoder(latent_shape):
#     encoded_input = layers.Input(shape=latent_shape)  # 잠재 공간 입력

#     # 업샘플링 단계
#     x = layers.Conv2DTranspose(64, (3, 3), strides=2, activation='relu', padding='same')(encoded_input)
#     x = layers.Conv2DTranspose(32, (3, 3), strides=2, activation='relu', padding='same')(x)
#     x = layers.Conv2DTranspose(32, (3, 3), strides=2, activation='relu', padding='same')(x)
#     decoded = layers.Conv2D(1, (3, 3), activation='sigmoid', padding='same')(x)

#     return models.Model(encoded_input, decoded, name="decoder")

# # 전체 모델 구성
# input_dim = 216  # FDC 데이터 차원
# latent_dim = 16 * 16 * 128  # 잠재 공간 크기

# fdc_encoder = build_fdc_encoder(input_dim, latent_dim)
# decoder = build_decoder((16, 16, 128))

# fdc_inputs = layers.Input(shape=(input_dim,))
# encoded_fdc = fdc_encoder(fdc_inputs)
# decoded_image = decoder(encoded_fdc)

# # 최종 모델 생성
# autoencoder = models.Model(fdc_inputs, decoded_image)
# autoencoder.compile(optimizer='adam', loss='mse')

# # 모델 학습
# autoencoder.fit(fdc_train, img_train, epochs=1000, batch_size=32, validation_data=(fdc_val, img_val))

# autoencoder.save('./data/model/autoencoder_model.keras')

In [None]:
# autoencoder = tf.keras.models.load_model(f'./data/model/autoencoder_model.keras')
# predicted_images = autoencoder.predict(fdc_test)

# visualize_images(img_test)
# visualize_images(predicted_images)

1. FDC data → Image 예측 모델 학습 (20241020 Model)

In [None]:
# # Encoder 모델: 입력 이미지를 잠재 공간으로 압축
# def build_encoder(input_dim):
#     model = tf.keras.Sequential()
#     model.add(layers.Dense(256, input_dim=input_dim))
#     model.add(layers.LeakyReLU(alpha=0.2))
#     model.add(layers.BatchNormalization(momentum=0.8))
    
#     model.add(layers.Dense(512))
#     model.add(layers.LeakyReLU(alpha=0.2))
#     model.add(layers.BatchNormalization(momentum=0.8))
    
#     model.add(layers.Dense(1024))
#     model.add(layers.LeakyReLU(alpha=0.2))
#     model.add(layers.BatchNormalization(momentum=0.8))
    
#     model.add(layers.Dense(2048))
#     model.add(layers.LeakyReLU(alpha=0.2))
#     model.add(layers.BatchNormalization(momentum=0.8))

    
#     # 잠재 공간 (저차원 공간) 출력
#     model.add(layers.Dense(64))  # 잠재 공간의 크기를 64로 설정
    
#     return model

# # Decoder 모델: 잠재 공간에서 128x128 이미지를 복원
# def build_decoder(latent_dim):
#     model = tf.keras.Sequential()

#     model.add(layers.Dense(2048))
#     model.add(layers.LeakyReLU(alpha=0.2))
#     model.add(layers.BatchNormalization(momentum=0.8))
    
#     model.add(layers.Dense(1024, input_dim=latent_dim))
#     model.add(layers.LeakyReLU(alpha=0.2))
#     model.add(layers.BatchNormalization(momentum=0.8))
    
#     model.add(layers.Dense(512))
#     model.add(layers.LeakyReLU(alpha=0.2))
    
#     model.add(layers.Dense(256))
#     model.add(layers.LeakyReLU(alpha=0.2))
    
#     # 128x128 이미지로 복원
#     model.add(layers.Dense(128 * 128, activation='sigmoid'))  # 이미지 픽셀 값이 0-1 범위이므로 sigmoid 사용
#     model.add(layers.Reshape((128, 128, 1)))
    
#     return model

# # Autoencoder 모델: Encoder와 Decoder를 연결
# def build_autoencoder(input_dim, latent_dim):
#     encoder = build_encoder(input_dim)
#     decoder = build_decoder(latent_dim)
    
#     inputs = layers.Input(shape=(input_dim,))
#     encoded = encoder(inputs)
#     decoded = decoder(encoded)
    
#     autoencoder = tf.keras.Model(inputs, decoded)
#     autoencoder.compile(optimizer='adam', loss='mse')  # Autoencoder에서는 MSE(평균 제곱 오차)를 사용
#     return autoencoder

# # 하이퍼파라미터
# tf.random.set_seed(SEED)
# input_dim = fdc_train.shape[1]  # FDC 데이터의 차원
# latent_dim = 64  # 잠재 공간의 크기
# epochs = 1000
# batch_size = 32

# # 모델 빌드
# autoencoder = build_autoencoder(input_dim, latent_dim)

# # 학습 함수
# def train_autoencoder(epochs, batch_size):
#     autoencoder.fit(fdc_train, img_train, epochs=epochs, batch_size=batch_size, shuffle=True)

# # Autoencoder 학습 시작
# train_autoencoder(epochs, batch_size)

# # 모델 저장
# autoencoder.save(f'./data/model/autoencoder_model_{epochs}.keras')

In [None]:
epochs = 1000

autoencoder = tf.keras.models.load_model(f'./data/model/autoencoder_model_{epochs}.keras')
predicted_images = autoencoder.predict(fdc_test)

visualize_images(img_test)
visualize_images(predicted_images)

In [None]:
# predicted_images에서 마지막 차원(채널) 제거
predicted_images_squeezed = np.squeeze(predicted_images)  # (53, 128, 128, 1) -> (53, 128, 128)

# 두 이미지 간의 SSIM 계산 (data_range 설정)
ssim_value = ssim(img_test, predicted_images_squeezed, multichannel=True, data_range=1)
print(f"SSIM: {ssim_value}")

2. Image 분류 모델

In [None]:
# 외곽 부분을 마스킹하는 함수 정의 (원형 마스크 사용)
def create_edge_mask(image, radius):
    h, w = image.shape[:2]
    center = (int(w / 2), int(h / 2))
    max_radius = min(center) - 2  # 이미지 경계 안에 들어가도록 반지름 설정
    mask = np.zeros((h, w), dtype=np.uint8)  # 마스크를 8비트 정수로 생성
    
    # 원형 마스크 생성 (두께는 외곽 영역의 범위를 조절)
    cv2.circle(mask, center, max_radius, 1, thickness=radius)  # 마스크 값 1로 설정
    return mask

# 이미지 데이터 (img_train을 불러온 상태라 가정)
image = img_train[0]  # 첫 번째 훈련 이미지 사용

# 다양한 radius 값으로 마스크를 생성하고 시각적으로 확인
radius_values = [1,5, 10, 15, 20, 50, 100]  # 다양한 반경 값을 설정
fig, axes = plt.subplots(1, len(radius_values), figsize=(15, 5))

for i, radius in enumerate(radius_values):
    # 마스크 생성
    mask = create_edge_mask(image, radius=radius)
    
    # 마스크를 이미지에 적용하여 시각적으로 비교
    masked_image = cv2.bitwise_and(image.squeeze().astype(np.uint8), image.squeeze().astype(np.uint8), mask=mask)
    
    # 이미지 출력
    axes[i].imshow(masked_image, cmap='gray')
    axes[i].set_title(f"Radius: {radius}")
    axes[i].axis('off')

plt.show()

In [13]:
# 외곽 부분을 마스킹하는 함수 정의 (원형 마스크 사용)
def create_edge_mask(image, radius=50):
    h, w = image.shape[:2]
    center = (int(w / 2), int(h / 2))
    max_radius = min(center) - 2  # 이미지 경계 안에 들어가도록 반지름 설정
    mask = np.zeros((h, w), dtype=np.uint8)  # 마스크를 uint8 형식으로 생성

    # 원형 마스크 생성 (두께는 외곽 영역의 범위를 조절)
    cv2.circle(mask, center, max_radius, 1, thickness=radius)  # 1로 채운 원형 마스크
    return mask

# 모든 이미지에 마스크 적용
def apply_mask_to_images(images, mask_radius=50):
    masked_images = []
    for image in images:
        mask = create_edge_mask(image.squeeze(), radius=mask_radius)
        
        # 이미지가 0~1로 스케일링된 경우 0~255 범위로 변환
        image_uint8 = (image.squeeze() * 255).astype(np.uint8)
        
        # 마스크 적용
        masked_image = cv2.bitwise_and(image_uint8, image_uint8, mask=mask)
        masked_images.append(masked_image)
    return np.array(masked_images)

# 훈련, 검증, 테스트 데이터 각각에 마스크 적용
masked_train = apply_mask_to_images(img_train)
masked_val = apply_mask_to_images(img_val)
masked_test = apply_mask_to_images(img_test)

CNN 분류 모델 학습

In [None]:
# CNN 모델 생성
def build_edge_classification_model(input_shape):
    model = models.Sequential()
    
    # Convolutional layer로 특징 추출
    model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=input_shape))
    model.add(layers.MaxPooling2D((2, 2)))
    model.add(layers.Conv2D(64, (3, 3), activation='relu'))
    model.add(layers.MaxPooling2D((2, 2)))
    model.add(layers.Conv2D(128, (3, 3), activation='relu'))
    model.add(layers.MaxPooling2D((2, 2)))
    
    # Flatten하여 Dense Layer에 연결
    model.add(layers.Flatten())
    model.add(layers.Dense(128, activation='relu'))
    
    # 이진 분류를 위한 출력층
    model.add(layers.Dense(1, activation='sigmoid'))  # 이진 분류
    
    # 모델 컴파일
    model.compile(optimizer='adam',
                  loss='binary_crossentropy',
                  metrics=['accuracy'])
    
    return model

# 입력 이미지의 크기 (128x128 크기의 흑백 이미지)
input_shape = (128, 128, 1)
cnn = build_edge_classification_model(input_shape)

epochs = 1000

# 훈련 데이터를 이용해 모델 학습
cnn.fit(masked_train, labels_train, 
          epochs=epochs, 
          batch_size=32, 
          validation_data=(masked_val, labels_val))

# 모델 저장
cnn.save(f'./data/model/cnn_model_{epochs}.keras')

In [15]:
epochs = 1000

cnn = tf.keras.models.load_model(f'./data/model/cnn_model_{epochs}.keras')

In [None]:
# 테스트 데이터로 모델 성능 평가
test_loss, test_acc = cnn.evaluate(masked_test, labels_test)
print(f"테스트 정확도: {test_acc}")

In [None]:
masked_predicted_images = apply_mask_to_images(predicted_images)
predicted_loss, predicted_acc = cnn.evaluate(masked_predicted_images, labels_test)
print(f"테스트 정확도: {predicted_acc}")

In [None]:
# 원본 이미지와 비교하여 시각적으로 평가
def compare_original_and_predicted(original_images, predicted_images, masked_images):
    fig, axes = plt.subplots(3, len(original_images), figsize=(15, 10))
    
    for i in range(len(original_images)):
        # 원본 이미지 출력
        axes[0, i].imshow(original_images[i].squeeze(), cmap='gray')
        axes[0, i].set_title(f"Original Image {i+1}")
        axes[0, i].axis('off')
        
        # 예측된 이미지 출력
        axes[1, i].imshow(predicted_images[i].squeeze(), cmap='gray')
        axes[1, i].set_title(f"Predicted Image {i+1}")
        axes[1, i].axis('off')
        
        # 마스크된 예측 이미지 출력
        axes[2, i].imshow(masked_images[i].squeeze(), cmap='gray')
        axes[2, i].set_title(f"Masked Predicted {i+1}")
        axes[2, i].axis('off')

    plt.show()

# 원본 이미지와 예측된 이미지를 비교
compare_original_and_predicted(img_test[5:10], predicted_images[5:10], masked_predicted_images[5:10])