In [15]:
import librosa
import soundfile as sf
import numpy as np
from pathlib import Path

def split_audio(input_path, chunk_duration=30, overlap=0):
    """
    ตัดไฟล์เสียงเป็นช่วงเท่าๆ กัน
    
    Args:
        input_path: path ของไฟล์เสียง
        chunk_duration: ความยาวแต่ละช่วง (วินาที)
        overlap: ความซ้อนทับระหว่างช่วง (วินาที)
    
    Returns:
        list ของ path ไฟล์เสียงที่ตัดแล้ว
    """
    # โหลดไฟล์เสียง
    audio, sr = librosa.load(input_path, sr=None)
    
    # คำนวณจำนวน sample ต่อช่วง
    chunk_samples = int(chunk_duration * sr)
    overlap_samples = int(overlap * sr)
    step_samples = chunk_samples - overlap_samples

    # สร้างโฟลเดอร์สำหรับเก็บไฟล์ที่ตัด
    file_name = input_path.split('/')[-1].split('.')[0]
    if overlap >0:
        file_name = 'overlap_'+file_name
    output_dir = Path(input_path).parent / f"chunks_{file_name}"
    output_dir.mkdir(exist_ok=True)

    chunk_files = []
    chunk_num = 0

    # ตัดเสียงเป็นช่วงๆ
    for start in range(0, len(audio) - chunk_samples + 1, step_samples):
        end = start + chunk_samples
        chunk = audio[start:end]
        
        # บันทึกไฟล์
        output_path = output_dir / f"chunk_{chunk_num:03d}.wav"
        sf.write(output_path, chunk, sr)
        chunk_files.append(str(output_path))
        chunk_num += 1
    
    # ตัดช่วงสุดท้าย (ถ้าเหลือ)
    if len(audio) % step_samples != 0:
        remaining = audio[-(len(audio) % step_samples):]
        if len(remaining) > sr:  # เก็บเฉพาะที่ยาวกว่า 1 วินาที
            output_path = output_dir / f"chunk_{chunk_num:03d}.wav"
            sf.write(output_path, remaining, sr)
            chunk_files.append(str(output_path))
    
    print(f"ตัดไฟล์เสียงเป็น {len(chunk_files)} ช่วง")
    return chunk_files

In [18]:
# ใช้งาน
audio_file = "audio/chang.wav"
chunks = split_audio(audio_file, chunk_duration=2, overlap=0.5)

ตัดไฟล์เสียงเป็น 17 ช่วง


In [32]:
# ใช้งาน
audio_file = "audio/fah.wav"
chunks = split_audio(audio_file, chunk_duration=2, overlap=0.25)

ตัดไฟล์เสียงเป็น 9 ช่วง


In [26]:
# ใช้งาน
audio_file = "audio/mick.wav"
chunks = split_audio(audio_file, chunk_duration=2, overlap=0.5)

ตัดไฟล์เสียงเป็น 10 ช่วง
