In [1]:
import tensorflow as tf

gpus = tf.config.experimental.list_physical_devices('GPU')
if gpus:
    try:
        for gpu in gpus:
            tf.config.experimental.set_memory_growth(gpu, True)
    except RuntimeError as e:
        print(e)

In [2]:
def decode_predictions(predictions, colors):
    # 원-핫 인코딩된 예측 결과를 원래의 라벨로 변환
    labels = np.argmax(predictions, axis=-1)

    # 각 라벨에 색상 부여
    colored_labels = np.zeros((labels.shape[0], labels.shape[1], labels.shape[2], 3))
    for i, color in enumerate(colors):
        colored_labels[labels == i] = color

    return colored_labels

In [4]:
import os
import cv2
import numpy as np
from tensorflow.keras.models import load_model


os.environ["CUDA_VISIBLE_DEVICES"] = "0"

# U-Net 모델 불러오기
model = load_model('unet_model_truss2.h5')

# 웹캠 입력 받기

cap = cv2.VideoCapture('http://192.168.0.17:4747/video/')  # 'ip_address:port'는 DroidCam에서 제공하는 IP 주소와 포트 번호

while True:
    # 웹캠으로부터 이미지 받아오기
    ret, frame = cap.read()

    # 원본 이미지의 높이와 너비
    original_height, original_width = frame.shape[:2]

    # 잘라낼 영역의 비율
    target_ratio = 9 / 16

    # 잘라낼 영역의 너비 계산
    new_width = int(original_height * target_ratio)

    # 잘라낼 영역의 시작점과 끝점 계산
    start = int((original_width - new_width) / 2)
    end = start + new_width

    # 이미지 잘라내기
    cropped_image = frame[:, start:end]

    # 이미지 전처리
    input_image = cv2.resize(cropped_image, (272, 480))  # U-Net에 맞게 이미지 크기 조절
    input_image = input_image / 255.0  # 정규화
    input_image = input_image[np.newaxis, ...]  # 배치 차원 추가
    
    # U-Net을 이용한 이미지 세그멘테이션
    prediction = model.predict(input_image)
    segmented_image = np.argmax(prediction, axis=-1)  # 가장 높은 확률을 가진 클래스 선택
    segmented_image = segmented_image.astype(np.uint8) 

    # 디코딩 함수를 사용하여 세그멘테이션 맵 생성
    colors =  np.array([[0, 0, 0],   # 라벨 0: 검은색
                    [255, 0, 0], # 라벨 1: 빨간색
                    [0, 255, 0], # 라벨 2: 녹색
                    [0, 0, 255]], # 라벨 3: 파란색
                   dtype='uint8')  # 각 라벨에 부여할 색상 정의
    segmented_image = decode_predictions(prediction, colors)

    # 이미지를 8비트 3채널 이미지로 변환
    segmented_image_color = segmented_image.astype('uint8')

    labels = np.argmax(prediction, axis=-1).astype(int)
    # 첫 번째 이미지만 선택
    segmented_image_color = segmented_image_color[0]

    # 차원을 확인하고, 필요하다면 3차원으로 변경
    if len(segmented_image_color.shape) == 2:
        segmented_image_color = cv2.cvtColor(segmented_image_color, cv2.COLOR_GRAY2BGR)

    # 원본 화면에 표시
    cv2.imshow('Original', frame)

    # 결과 화면에 표시
    cv2.imshow('Real-Time Segmentation', segmented_image_color)
    
    # 리사이징 된 이미지 화면에 표시
    cv2.imshow('Resized Image', input_image[0])

    # 결과 화면에 표시
    #cv2.imshow('Real-Time Segmentation', segmented_image[0])

    # 'q' 키를 누르면 종료
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()

