In [16]:
import os
import shutil
import sys
import pandas as pd
from pathlib import Path

def find_common_files_excluding_extension(folder1, folder2):
    # 확장자를 제외한 파일 이름 목록 생성
    files1 = {os.path.splitext(file)[0]: file for file in os.listdir(folder1) if os.path.isfile(os.path.join(folder1, file))}
    files2 = {os.path.splitext(file)[0]: file for file in os.listdir(folder2) if os.path.isfile(os.path.join(folder2, file))}
    
    # 공통 파일 이름 찾기
    common_names = set(files1.keys()).intersection(files2.keys())
    
    # 공통 파일 원본 이름 리스트 생성
    common_files = [(files1[name], files2[name]) for name in common_names]
    return common_files

def copy_common_files_excluding_extension(folder1, folder2, destination_folder):
    # 공통 파일 목록 찾기
    common_files = find_common_files_excluding_extension(folder1, folder2)
    
    if not os.path.exists(destination_folder):
        os.makedirs(destination_folder)
    
    for file1, file2 in common_files:
        # 파일 경로 설정
        file_path1 = os.path.join(folder1, file1)
        file_path2 = os.path.join(folder2, file2)
        
        # 파일 복사 (중복 방지: 이미 존재하는 경우 덮어쓰지 않음)
        destination_path1 = os.path.join(destination_folder, file1)
        destination_path2 = os.path.join(destination_folder, file2)
        
        if not os.path.exists(destination_path1):
            shutil.copy(file_path1, destination_path1)
        if not os.path.exists(destination_path2):
            shutil.copy(file_path2, destination_path2)
    
    print(f"공통 파일 {len(common_files)}개를 {destination_folder} 폴더로 복사했습니다.")

In [17]:
def modify_first_label(file_path):
    """
    주어진 파일을 한 줄씩 읽어서 각 줄의 첫 번째 라벨을 새 라벨로 변경하여 파일을 덮어쓰는 함수.
    
    :param file_path: 원본 파일 경로 (수정된 파일을 동일한 경로에 저장)
    :param new_label: 새로 변경할 라벨 값
    """
    temp_file_path = file_path + '.tmp'

    with open(file_path, 'r') as infile, open(temp_file_path, 'w') as outfile:
        for line in infile:
            parts = line.strip().split()
            if len(parts) > 0:
                parts[0] = "2"  # 첫 번째 라벨 변경
                new_line = ' '.join(parts) + '\n'
                outfile.write(new_line)

    # 원본 파일을 백업하고 임시 파일을 원본 파일로 이동
    os.replace(temp_file_path, file_path)

In [18]:
def delete_jpg_files(folder):
    # 폴더 내의 파일 목록을 가져옴
    files = os.listdir(folder)
    print(f"삭제중")
    
    # .jpg 파일 삭제
    for file in files:
        if file.lower().endswith('.jpg'):
            file_path = os.path.join(folder, file)
            if os.path.isfile(file_path):
                os.remove(file_path)

In [19]:
def modify_label01(file_path):
    """
    주어진 파일을 한 줄씩 읽어서 각 줄의 첫 번째 라벨을 새 라벨로 변경하여 파일을 덮어쓰는 함수.
    
    :param file_path: 원본 파일 경로 (수정된 파일을 동일한 경로에 저장)
    :param new_label: 새로 변경할 라벨 값
    """
    temp_file_path = file_path + '.tmp'

    with open(file_path, 'r') as infile, open(temp_file_path, 'w') as outfile:
        for line in infile:
            parts = line.strip().split()
            if len(parts) > 0:
                if (parts[0] == "1" or parts[0] == 1):
                    parts[0] = "0"                    
                if (parts[0] == "2" or parts[0] == 2):
                    parts[0] = "1"
                    
                new_line = ' '.join(parts) + '\n'
                outfile.write(new_line)

    # 원본 파일을 백업하고 임시 파일을 원본 파일로 이동
    os.replace(temp_file_path, file_path)

--------

In [20]:
train_label = 'C:/Users/USER/Documents/vision-AI/project/7899/CigaretteButtDetector.v5i.yolov8-01_new/train/labels'  # 첫 번째 폴더 경로
train_image = 'C:/Users/USER/Documents/vision-AI/project/7899/CigaretteButtDetector.v5i.yolov8-01_new/train/images'  # 두 번째 폴더 경로
train_burn = 'C:/Users/USER/Documents/vision-AI/project/7899/CigaretteButtDetector.v5i.yolov8-01_new/train/burned'  # 두 번째 폴더 경로

test_label = 'C:/Users/USER/Documents/vision-AI/project/7899/CigaretteButtDetector.v5i.yolov8-01_new/test/labels'  # 첫 번째 폴더 경로
test_image = 'C:/Users/USER/Documents/vision-AI/project/7899/CigaretteButtDetector.v5i.yolov8-01_new/test/images'  # 두 번째 폴더 경로로
test_burn = 'C:/Users/USER/Documents/vision-AI/project/7899/CigaretteButtDetector.v5i.yolov8-01_new/test/burned'  # 두 번째 폴더 경로로

valid_label = 'C:/Users/USER/Documents/vision-AI/project/7899/CigaretteButtDetector.v5i.yolov8-1by1_new/valid/labels'  # 첫 번째 폴더 경로
valid_image = 'C:/Users/USER/Documents/vision-AI/project/7899/CigaretteButtDetector.v5i.yolov8-1by1_new/valid/images'  # 두 번째 폴더 경로
valid_burn = 'C:/Users/USER/Documents/vision-AI/project/7899/CigaretteButtDetector.v5i.yolov8-01_new/valid/burned'  # 두 번째 폴더 경로

label_lst = [train_label, test_label, valid_label]
image_lst = [train_image, test_image, valid_image]
burn_lst = [train_burn, test_burn, valid_burn]

In [None]:
for i in range(3):
    copy_common_files_excluding_extension(label_lst[i], burn_lst[i], burn_lst[i])
    
    for file_name in os.listdir(burn_lst[i]):    
        file_path = os.path.join(burn_lst[i], file_name)
        
        # 파일 확장자가 .txt인 경우에만 처리
        if (file_path.endswith('.txt')):     
            print(file_path)
            modify_first_label(file_path)
    
    delete_jpg_files(burn_lst[i])

In [14]:
for label_folder in label_lst:
    print(label_folder)
    
    for file_name in os.listdir(label_folder):    
        file_path = os.path.join(label_folder, file_name)
        
        # 파일 확장자가 .txt인 경우에만 처리
        if (file_path.endswith('.txt')):     
            modify_label01(file_path)

C:/Users/USER/Documents/vision-AI/project/7899/CigaretteButtDetector.v5i.yolov8-01_new/train/labels
C:/Users/USER/Documents/vision-AI/project/7899/CigaretteButtDetector.v5i.yolov8-01_new/test/labels
C:/Users/USER/Documents/vision-AI/project/7899/CigaretteButtDetector.v5i.yolov8-01_new/valid/labels


In [15]:
def count_first_words_in_files(directory_path):
    first_words = []

    # 디렉터리를 순회하며 텍스트 파일을 찾음
    for filename in os.listdir(directory_path):
        if filename.endswith(".txt"):
            file_path = os.path.join(directory_path, filename)
            with open(file_path, 'r') as file:
                first_line = file.readline().strip()
                if first_line:  # 첫 번째 줄이 비어 있지 않은 경우
                    first_word = first_line.split()[0]
                    first_words.append(first_word)

    # 첫 단어의 리스트와 개수를 반환
    return first_words

first_words = count_first_words_in_files("C:/Users/USER/Documents/vision-AI/project/7899/CigaretteButtDetector.v5i.yolov8-01_new/train/labels")
print(first_words)

['0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0',