In [2]:
import os
import json
import cv2
import numpy as np

In [3]:
# OpenCV는 한글경로 못일기 때문에 다음과 같이 처리해줌
# with open(image_path, 'rb') as f:
#     file_data = np.asarray(bytearray(()), dtype=np.uint8)
#     image = cv2.imdecode(file_data, cv2.IMREAD_COLOR)

In [4]:
# 데이터가 저장된 최상위 폴더 경로
base_dir = "E:/Data/028.한국인 피부상태 측정 데이터/3.개방데이터/1.데이터/Training/01.원천데이터/TS/1. 디지털카메라"

# 결과를 저장할 딕셔너리
image_data = {}  # {폴더명: {이미지파일명: OpenCV 이미지 객체}}

# 폴더 순회
for folder_name in os.listdir(base_dir):
    folder_path = os.path.join(base_dir, folder_name)

    # 폴더인지 확인
    if os.path.isdir(folder_path):
        print(f"Processing folder: {folder_name}")
        
        # 폴더별 이미지 저장
        folder_images = {}
        
        # 폴더 내 파일 탐색
        for file_name in os.listdir(folder_path):
            file_path = os.path.join(folder_path, file_name)
            
            # 이미지 파일 처리 (.jpg 확장자)
            if file_name.endswith(".jpg"):
                try:
                    # 한글 경로 처리: 바이너리 읽기 후 OpenCV로 디코딩
                    with open(file_path, 'rb') as f:
                        file_data = np.asarray(bytearray(f.read()), dtype=np.uint8)
                        image = cv2.imdecode(file_data, cv2.IMREAD_COLOR)
                    
                    # 이미지 로드 및 저장
                    if image is not None:
                        folder_images[file_name] = image
                    else:
                        print(f"Failed to load image: {file_path}")
                except Exception as e:
                    print(f"Error loading image {file_path}: {e}")
        
        # 폴더의 이미지 데이터를 최종 딕셔너리에 추가
        image_data[folder_name] = folder_images

print("Image loading complete!")


Processing folder: 0002
Processing folder: 0003
Processing folder: 0006
Processing folder: 0007
Processing folder: 0008
Processing folder: 0009
Processing folder: 0010
Processing folder: 0011
Processing folder: 0012
Processing folder: 0014
Image loading complete!


In [5]:
#데이터 확인
print(image_data.keys())
print(image_data['0002'].keys())
print()
print(image_data['0002']['0002_01_F.jpg'].shape)

dict_keys(['0002', '0003', '0006', '0007', '0008', '0009', '0010', '0011', '0012', '0014'])
dict_keys(['0002_01_F.jpg', '0002_01_Fb.jpg', '0002_01_Ft.jpg', '0002_01_L15.jpg', '0002_01_L30.jpg', '0002_01_R15.jpg', '0002_01_R30.jpg'])

(3216, 2136, 3)


In [6]:
#경로지정
base_dir = r"E:\Data\028.한국인 피부상태 측정 데이터\3.개방데이터\1.데이터\Training\02.라벨링데이터\TL\1. 디지털카메라"

In [7]:
#제이슨파일 저장할 딕셔너리 생성
filtered_json_data = {}

In [8]:
# 지정한 경로에 있는 파일들을 가져옴
for forder_name in os.listdir(base_dir):
    #기본경로에 위에가져온 파일이름을 붙여서 새로운 경로 작성
    forder_path = os.path.join(base_dir, forder_name)
    #폴더인지 확인하는 과정
    if os.path.isdir(forder_path):
        print(f"processing folder : {forder_name}")

        #폴더내 라벨링 데이터 저장할 공간 생성
        forder_jsons = {}

        for file_name in os.listdir(forder_path):
            file_path = os.path.join(forder_path, file_name)
            if file_name.endswith("01.json"):
                try:
                    with open(file_path, "r", encoding= "utf-8") as f:
                        json_data = json.load(f)

                    forder_jsons[file_name] = json_data
                except Exception as e:
                    print(f"Error {file_path} : {e}")

        if forder_jsons:
            filtered_json_data[forder_name] = forder_jsons

processing folder : 0002
processing folder : 0003
processing folder : 0006
processing folder : 0007
processing folder : 0008
processing folder : 0009
processing folder : 0010
processing folder : 0011
processing folder : 0012
processing folder : 0014


In [9]:
#데이터 확인
print(filtered_json_data.keys())
print(filtered_json_data["0002"])
print()
print(filtered_json_data['0002']['0002_01_Fb_01.json']['images']['bbox'])

dict_keys(['0002', '0003', '0006', '0007', '0008', '0009', '0010', '0011', '0012', '0014'])
{'0002_01_Fb_01.json': {'info': {'filename': '0002_01_Fb.jpg', 'id': '0002', 'gender': 'F', 'age': 50, 'date': '2023-07-27', 'skin_type': 0, 'sensitive': 0}, 'images': {'device': 0, 'width': 2136, 'height': 3216, 'angle': 2, 'facepart': 1, 'bbox': [584, 993, 1768, 1604]}, 'annotations': {'forehead_pigmentation': 1, 'forehead_wrinkle': 1}, 'equipment': {'forehead_moisture': 75.0, 'forehead_elasticity_R0': 0.287, 'forehead_elasticity_R1': 0.097, 'forehead_elasticity_R2': 0.662, 'forehead_elasticity_R3': 0.329, 'forehead_elasticity_R4': 0.135, 'forehead_elasticity_R5': 0.552, 'forehead_elasticity_R6': 0.649, 'forehead_elasticity_R7': 0.335, 'forehead_elasticity_R8': 0.19, 'forehead_elasticity_R9': 0.042, 'forehead_elasticity_Q0': 57.4, 'forehead_elasticity_Q1': 0.579, 'forehead_elasticity_Q2': 0.438, 'forehead_elasticity_Q3': 0.142}}, '0002_01_Ft_01.json': {'info': {'filename': '0002_01_Ft.jpg', 'i

In [10]:
#데이터 확인
print(image_data.keys())
print(image_data['0002'].keys())
print()
print(image_data['0002']['0002_01_F.jpg'].shape)

dict_keys(['0002', '0003', '0006', '0007', '0008', '0009', '0010', '0011', '0012', '0014'])
dict_keys(['0002_01_F.jpg', '0002_01_Fb.jpg', '0002_01_Ft.jpg', '0002_01_L15.jpg', '0002_01_L30.jpg', '0002_01_R15.jpg', '0002_01_R30.jpg'])

(3216, 2136, 3)


In [None]:


cropped_image_dict = {} # 저장받을 딕셔너리 생성

for human_id in filtered_json_data.keys(): # 사람번호 조회 0002, 0004 등

    for file_name in filtered_json_data[human_id].keys(): # 파일이름 조회 (제이슨파일)
        
        bbox = filtered_json_data[human_id][file_name]['images']['bbox'] #조회된 파일의 비박스정보 가져오기
        x1, y1, x2, y2 = bbox #비박스 데이터 나누기
        image_file_name = filtered_json_data[human_id][file_name]["info"]["filename"] #해당 제이슨 파일의 이미지파일 정보조회
        image = image_data[human_id][image_file_name] #이미지 불러오기
        cropped_image = image[y1:y2, x1:x2] #불러온 이미지 위에 저장한 비박스로 자르기
        cropped_image_dict[image_file_name] = cropped_image #자른이미지 딕셔너리에 이름과 3차원데이터로 저장하기

In [26]:
# 이미지 및 바운딩 박스 정보 딕셔너리 구성 확인
print(cropped_image_dict.keys())
print(len(cropped_image_dict.keys()))
print(cropped_image_dict['0002_01_Fb.jpg'].shape)

dict_keys(['0002_01_Fb.jpg', '0002_01_Ft.jpg', '0002_01_F.jpg', '0002_01_L15.jpg', '0002_01_L30.jpg', '0002_01_R15.jpg', '0002_01_R30.jpg', '0003_01_Fb.jpg', '0003_01_Ft.jpg', '0003_01_F.jpg', '0003_01_L15.jpg', '0003_01_L30.jpg', '0003_01_R15.jpg', '0003_01_R30.jpg', '0006_01_Fb.jpg', '0006_01_Ft.jpg', '0006_01_F.jpg', '0006_01_L15.jpg', '0006_01_L30.jpg', '0006_01_R15.jpg', '0006_01_R30.jpg', '0007_01_Fb.jpg', '0007_01_Ft.jpg', '0007_01_F.jpg', '0007_01_L15.jpg', '0007_01_L30.jpg', '0007_01_R15.jpg', '0007_01_R30.jpg', '0008_01_Fb.jpg', '0008_01_Ft.jpg', '0008_01_F.jpg', '0008_01_L15.jpg', '0008_01_L30.jpg', '0008_01_R15.jpg', '0008_01_R30.jpg', '0009_01_Fb.jpg', '0009_01_Ft.jpg', '0009_01_F.jpg', '0009_01_L15.jpg', '0009_01_L30.jpg', '0009_01_R15.jpg', '0009_01_R30.jpg', '0010_01_Fb.jpg', '0010_01_Ft.jpg', '0010_01_F.jpg', '0010_01_L15.jpg', '0010_01_L30.jpg', '0010_01_R15.jpg', '0010_01_R30.jpg', '0011_01_Fb.jpg', '0011_01_Ft.jpg', '0011_01_F.jpg', '0011_01_L15.jpg', '0011_01_L30.j