In [2]:
pwd

'/home/ec2-user/SageMaker/yujin'

In [3]:
!pip install pillow torchvision boto3 pandas



In [10]:
import pandas as pd
import boto3
import os

In [11]:
# SageMaker 노트북에 저장된 CSV 파일 경로
csv_path = '/home/ec2-user/SageMaker/NG_class.CSV'
bucket_name = "smwu-cv-data"  # S3 버킷 이름
input_folder = '/home/ec2-user/data/NG/'   # SageMaker 노트북 내 원본 이미지 폴더
output_folder = '/home/ec2-user/yujin/labeled_images_NG/'  # 라벨링된 결과 저장 폴더

# 폴더가 없으면 생성
os.makedirs(output_folder, exist_ok=True)

ng_data = pd.read_csv(csv_path)
ng_data.columns = ['image_name', 'class_index']  # CSV 파일에서 열 이름 설정
label_mapping = {
    0: 'damage',       # 두부 전반적인 위치의 표면 손상
    1: 'edge',         # 가장자리 손상
    2: 'contaminant',  # 작은 검은 반점
    3: 'bubble'        # 기포
}
ng_data['class_label'] = ng_data['class_index'].map(label_mapping)
print("CSV 데이터 확인:\n", ng_data.head())

CSV 데이터 확인:
    image_name  class_index class_label
0        1058            1        edge
1        1083            1        edge
2        1122            1        edge
3         115            3      bubble
4        1195            1        edge


In [12]:
# 라벨링 결과를 로컬 디렉토리에 저장
labeled_data = []
for index, row in ng_data.iterrows():
    image_name = row['image_name']
    class_label = row['class_label']
    
    # 원본 이미지 경로
    input_image_path = os.path.join(input_folder, f"{image_name}.jpg")  # 확장자에 맞게 변경
    
    # 저장 경로 및 라벨링된 이름 추가
    output_image_path = os.path.join(output_folder, f"{image_name}_{class_label}.jpg")
    
    if os.path.exists(input_image_path):
        os.rename(input_image_path, output_image_path)  # 원본 파일 이동 후 라벨 추가된 이름으로 저장
        labeled_data.append({'image_name': image_name, 'class_label': class_label})
    else:
        print(f"파일 없음: {input_image_path}")

파일 없음: /home/ec2-user/data/NG/1058.jpg
파일 없음: /home/ec2-user/data/NG/1083.jpg
파일 없음: /home/ec2-user/data/NG/1122.jpg
파일 없음: /home/ec2-user/data/NG/115.jpg
파일 없음: /home/ec2-user/data/NG/1195.jpg
파일 없음: /home/ec2-user/data/NG/1196.jpg
파일 없음: /home/ec2-user/data/NG/1243.jpg
파일 없음: /home/ec2-user/data/NG/1268.jpg
파일 없음: /home/ec2-user/data/NG/1299.jpg
파일 없음: /home/ec2-user/data/NG/1403.jpg
파일 없음: /home/ec2-user/data/NG/1483.jpg
파일 없음: /home/ec2-user/data/NG/1578.jpg
파일 없음: /home/ec2-user/data/NG/1579.jpg
파일 없음: /home/ec2-user/data/NG/1707.jpg
파일 없음: /home/ec2-user/data/NG/1755.jpg
파일 없음: /home/ec2-user/data/NG/1804.jpg
파일 없음: /home/ec2-user/data/NG/1811.jpg
파일 없음: /home/ec2-user/data/NG/1859.jpg
파일 없음: /home/ec2-user/data/NG/1866.jpg
파일 없음: /home/ec2-user/data/NG/1867.jpg
파일 없음: /home/ec2-user/data/NG/1923.jpg
파일 없음: /home/ec2-user/data/NG/1932.jpg
파일 없음: /home/ec2-user/data/NG/1940.jpg
파일 없음: /home/ec2-user/data/NG/2027.jpg
파일 없음: /home/ec2-user/data/NG/2122.jpg
파일 없음: /home/ec2-user/data

In [13]:
# 라벨링 결과를 CSV로 저장
output_csv_path = '/home/ec2-user/yujin/NG_labeled_images.csv'
labeled_df = pd.DataFrame(labeled_data)
labeled_df.to_csv(output_csv_path, index=False)

In [14]:
print(f"라벨링 완료! 라벨링된 이미지와 결과 CSV가 SageMaker 디렉토리에 저장되었습니다.")
print(f"이미지 경로: {output_folder}")
print(f"CSV 경로: {output_csv_path}")

라벨링 완료! 라벨링된 이미지와 결과 CSV가 SageMaker 디렉토리에 저장되었습니다.
이미지 경로: /home/ec2-user/yujin/labeled_images_NG/
CSV 경로: /home/ec2-user/yujin/NG_labeled_images.csv
