cutfile.py

# coding=utf-8
import glob
import os
import time
from multiprocessing import cpu_count

import concurrent.futures
from pydub import AudioSegment
from pydub.silence import split_on_silence

max_duration = 16


def deal_file(file_name, min_silence=500, silence_thresh=-50):
    if file_name[-3:] == "wav":
        sound = AudioSegment.from_wav(file_name)
    elif file_name[-3:] == "mp3":
        sound = AudioSegment.from_mp3(file_name)
    info = "%s start pid: %s deal: %s" % (str(time.time()), str(os.getpid()), file_name)
    print(info)
    result = []
    deal_chunk(sound, min_silence, silence_thresh, result)
    return result


def deal_chunk(sound, min_silence, silence_thresh, result):
    # AudioSegment.from_wav
    chunks = split_on_silence(sound, min_silence_len=min_silence,
                              silence_thresh=silence_thresh)  # silence time:700ms and silence_dBFS<-70dBFS
    for chunk in chunks:
        if chunk.duration_seconds > max_duration:
            if min_silence > 100:
                print(min_silence)
                result = deal_chunk(chunk, min_silence - 100, silence_thresh, result)
            else:
                print(silence_thresh)
                result = deal_chunk(chunk, min_silence, silence_thresh + 10, result)
        else:
            result.append(chunk.set_channels(1).set_frame_rate(16000))
    return result

def future_done(future):
    print("done")

if __name__ == "__main__":

    # file_name = "/Users/lonica/Downloads/7ebec23e-0d20-4e3d-afca-de325f7c2239.wav"

    files = glob.glob("/Users/lonica/Downloads/7*be*.wav")

    with concurrent.futures.ProcessPoolExecutor(max_workers=cpu_count() - 2) as executor:
        future_to_f = {executor.submit(deal_file, f, min_silence=700, silence_thresh=-70): f for f in files}
        for future in concurrent.futures.as_completed(future_to_f):
            f = future_to_f[future]
            future.add_done_callback(future_done)
            try:
                data = future.result()
                # result = []
                j = 0
                print(len(data))
                for i in range(1, len(data)):
                    # 如果result最后一个chunk时间小于阈值
                    # if len(result) > 0 and result[len(result) - 1].duration_seconds < 2:
                    #     # 合并到result最后一条
                    #     if d.duration_seconds + result[len(result) - 1].duration_seconds < max_duration:
                    #         result[len(result) - 1] += d
                    #     else:
                    #         result.append(d)
                    # else:
                    #     result.append(d)
                    if data[j].duration_seconds < 2 and data[j].duration_seconds + data[i].duration_seconds < max_duration:
                        print("合并%s到%s, 当前时间%s"%(i, j, data[i].duration_seconds))
                        data[j] += data[i]
                    else:
                        j += 1
                        print("把%s放到%s, 当前时间%s"%(i, j, data[i].duration_seconds))
                        data[j] = data[i]
                print(j)
                path, name = f.rsplit("/", 1)
                newpath = path + "/wav/"
                if not os.path.exists(newpath):
                    os.makedirs(newpath)
                for i, d in enumerate(data[:j+1]):
                    output_file = newpath + name[:-4] + "_%03d.wav" % i
                    print(output_file, d.duration_seconds)
                    d.export(output_file, format="wav")
            except Exception as exc:
                print('%r generated an exception: %s' % (f, exc))
            else:
                print('%r file return %d chunks' % (f, len(data)))
                print('future status %s' % future.done())
                del future_to_f[future]
        # for f, data in zip(files, executor.map(deal_file, files, min_silence=500, silence_thresh=-50, result=[])):
        #     print('%r file return %d chunks' % (f, len(data)))
        #     result = []
        #     for d in data:
        #         # 如果result最后一个chunk时间小于阈值
        #         if len(result) > 0 and result[len(result) - 1].duration_seconds < 2:
        #             # 合并到result最后一条
        #             if d.duration_seconds + result[len(result) - 1].duration_seconds < max_duration:
        #                 result[len(result) - 1] += d
        #             else:
        #                 result.append(d)
        #         else:
        #             result.append(d)
        #     path, name = f.rsplit("/", 1)
        #     for i, d in enumerate(result):
        #         output_file = path + "/zt/500/" + name[:-4] + "_%03d.wav" % i
        #         print(output_file, d.duration_seconds)
        #         d.export(output_file, format="wav")