# 선언

In [4]:
import os
from pydub import AudioSegment
import numpy as np

In [6]:
def get_loudest_section(audio, duration_ms=5000):
    """
    가장 큰 소음이 나는 구간을 찾는 함수.
    audio: AudioSegment 객체
    duration_ms: 찾고자 하는 구간의 길이 (밀리초 단위)
    """
    # 밀리초 단위로 오디오를 나눔
    samples = np.array(audio.get_array_of_samples())
    max_amplitude = 0
    max_start = 0

    # 오디오 전체 길이
    total_length = len(samples)

    # 지정한 구간 길이
    segment_length = int(audio.frame_rate * (duration_ms / 1000.0))

    # sliding window를 사용하여 가장 큰 소음 구간 찾기
    for start in range(0, total_length - segment_length + 1, audio.frame_rate // 10):  # 0.1초 간격으로 이동
        segment = samples[start:start + segment_length]
        amplitude = np.sum(np.abs(segment))  # 절대값 합계를 사용하여 소음 크기 평가
        if amplitude > max_amplitude:
            max_amplitude = amplitude
            max_start = start

    # 시작 지점과 종료 지점 (밀리초 단위로 변환)
    start_time = max_start / audio.frame_rate * 1000
    return audio[start_time:start_time + duration_ms]

def process_audio_files(input_folder, output_folder):
    """
    폴더 내의 모든 음성 파일을 처리하여 가장 큰 소음이 나는 5초 구간으로 잘라서 저장하는 함수.
    input_folder: 입력 폴더 경로
    output_folder: 출력 폴더 경로
    """
    # 출력 폴더가 없으면 생성
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)

    # 입력 폴더의 모든 파일 처리
    for filename in os.listdir(input_folder):
        if filename.endswith(".wav"):
            file_path = os.path.join(input_folder, filename)
            audio = AudioSegment.from_wav(file_path)
            loudest_section = get_loudest_section(audio)

            # 출력 파일 경로 설정
            output_path = os.path.join(output_folder, filename)
            loudest_section.export(output_path, format="wav")
            print(f"{filename} 처리 완료 및 저장됨: {output_path}")

# 사용 예시
input_folder = "/Users/junggwonhee/Desktop/programing/오아시스_해커톤/project/data/극한_소리_데이터/Validation/sound"  # 실제 입력 폴더 경로로 변경
output_folder = "/Users/junggwonhee/Desktop/programing/오아시스_해커톤/project/data/극한_소리_데이터/Preclean_Data/Validation"  # 실제 출력 폴더 경로로 변경
process_audio_files(input_folder, output_folder)


02_03_814_220831_0205_SN.wav 처리 완료 및 저장됨: /Users/junggwonhee/Desktop/programing/오아시스_해커톤/project/data/극한_소리_데이터/Preclean_Data/Validation/02_03_814_220831_0205_SN.wav
02_03_707_220915_0081_NS.wav 처리 완료 및 저장됨: /Users/junggwonhee/Desktop/programing/오아시스_해커톤/project/data/극한_소리_데이터/Preclean_Data/Validation/02_03_707_220915_0081_NS.wav
02_03_850_221004_0072_SN.wav 처리 완료 및 저장됨: /Users/junggwonhee/Desktop/programing/오아시스_해커톤/project/data/극한_소리_데이터/Preclean_Data/Validation/02_03_850_221004_0072_SN.wav
02_03_856_221007_0009_NS.wav 처리 완료 및 저장됨: /Users/junggwonhee/Desktop/programing/오아시스_해커톤/project/data/극한_소리_데이터/Preclean_Data/Validation/02_03_856_221007_0009_NS.wav
02_03_844_220929_0069_NS.wav 처리 완료 및 저장됨: /Users/junggwonhee/Desktop/programing/오아시스_해커톤/project/data/극한_소리_데이터/Preclean_Data/Validation/02_03_844_220929_0069_NS.wav
02_03_905_220727_0136_SN.wav 처리 완료 및 저장됨: /Users/junggwonhee/Desktop/programing/오아시스_해커톤/project/data/극한_소리_데이터/Preclean_Data/Validation/02_03_905_220727_0136_SN.wav
02_0

In [7]:
import os

def delete_files_with_sn(folder_path):
    """
    폴더 내 파일 이름에 'SN'이 포함된 모든 파일을 삭제하는 함수.
    
    folder_path: 파일을 삭제할 폴더 경로
    """
    # 폴더 내 모든 파일을 확인
    for filename in os.listdir(folder_path):
        # 파일 이름에 'SN'이 포함되어 있는지 확인
        if 'SN' in filename:
            file_path = os.path.join(folder_path, filename)
            try:
                os.remove(file_path)  # 파일 삭제
                print(f"파일 삭제됨: {file_path}")
            except Exception as e:
                print(f"파일을 삭제하는 중 오류 발생: {file_path}, 오류: {e}")

# 사용 예시
folder_path = "/Users/junggwonhee/Desktop/programing/오아시스_해커톤/project/data/극한_소리_데이터/Preclean_Data/Validation"  # 실제 폴더 경로로 변경
delete_files_with_sn(folder_path)


파일 삭제됨: /Users/junggwonhee/Desktop/programing/오아시스_해커톤/project/data/극한_소리_데이터/Preclean_Data/Validation/02_03_814_220831_0205_SN.wav
파일 삭제됨: /Users/junggwonhee/Desktop/programing/오아시스_해커톤/project/data/극한_소리_데이터/Preclean_Data/Validation/02_03_850_221004_0072_SN.wav
파일 삭제됨: /Users/junggwonhee/Desktop/programing/오아시스_해커톤/project/data/극한_소리_데이터/Preclean_Data/Validation/02_03_905_220727_0136_SN.wav
파일 삭제됨: /Users/junggwonhee/Desktop/programing/오아시스_해커톤/project/data/극한_소리_데이터/Preclean_Data/Validation/02_03_905_220727_0036_SN.wav
파일 삭제됨: /Users/junggwonhee/Desktop/programing/오아시스_해커톤/project/data/극한_소리_데이터/Preclean_Data/Validation/02_03_842_221005_0023_SN.wav
파일 삭제됨: /Users/junggwonhee/Desktop/programing/오아시스_해커톤/project/data/극한_소리_데이터/Preclean_Data/Validation/02_03_893_221101_0038_SN.wav
파일 삭제됨: /Users/junggwonhee/Desktop/programing/오아시스_해커톤/project/data/극한_소리_데이터/Preclean_Data/Validation/02_03_894_221101_0048_SN.wav
파일 삭제됨: /Users/junggwonhee/Desktop/programing/오아시스_해커톤/project/data/극한_소리_데이