# PCM 16-bit, 16kHz, mono 채널 형식으로 변환 후 덮어쓰기

In [1]:
import os
import subprocess

def convert_audio_for_azure(file_path):
    """
    FFmpeg를 사용하여 오디오 파일을 Azure Speech STT 학습용 포맷(PCM 16-bit, 16kHz, Mono)으로 변환
    - 원본 파일명 그대로 유지하고 덮어쓰기
    """
    temp_file = file_path + "_temp.wav"  # 임시 파일 생성

    cmd = [
        "ffmpeg",
        "-i", file_path,                # 입력 파일
        "-ac", "1",                      # Mono 채널 변환
        "-ar", "16000",                  # 샘플링 레이트 변환 (16kHz)
        "-acodec", "pcm_s16le",          # PCM 16-bit 변환
        temp_file
    ]

    subprocess.run(cmd, stdout=subprocess.PIPE, stderr=subprocess.PIPE)

    # 변환이 완료되면 원본 파일을 덮어쓰기
    if os.path.exists(temp_file):
        os.replace(temp_file, file_path)  # 임시 파일을 원본 파일로 덮어쓰기
        print(f"✅ 변환 완료 및 덮어쓰기: {file_path}")
    else:
        print(f"❌ 변환 실패: {file_path}")

def process_folder(folder_path):
    """
    폴더 내 모든 WAV 파일을 변환 및 덮어쓰기
    """
    if not os.path.exists(folder_path):
        print(f"❌ 폴더가 존재하지 않습니다: {folder_path}")
        return

    files = [f for f in os.listdir(folder_path) if f.lower().endswith(".wav")]

    if not files:
        print("🔹 변환할 WAV 파일이 없습니다.")
        return

    for file in files:
        file_path = os.path.join(folder_path, file)
        convert_audio_for_azure(file_path)

    print(f"🔹 모든 WAV 파일 변환 및 덮어쓰기 완료! 폴더: {folder_path}")

# 실행 예시
folder_path = r"C:\AI-team3\Read-API\Data\train_audio\KMLE"
process_folder(folder_path)


✅ 변환 완료 및 덮어쓰기: C:\AI-team3\Read-API\Data\train_audio\KMLE\KMLE_01.wav
✅ 변환 완료 및 덮어쓰기: C:\AI-team3\Read-API\Data\train_audio\KMLE\KMLE_02.wav
✅ 변환 완료 및 덮어쓰기: C:\AI-team3\Read-API\Data\train_audio\KMLE\KMLE_03.wav
✅ 변환 완료 및 덮어쓰기: C:\AI-team3\Read-API\Data\train_audio\KMLE\KMLE_04.wav
✅ 변환 완료 및 덮어쓰기: C:\AI-team3\Read-API\Data\train_audio\KMLE\KMLE_05.wav
🔹 모든 WAV 파일 변환 및 덮어쓰기 완료! 폴더: C:\AI-team3\Read-API\Data\train_audio\KMLE
