In [18]:
import os
from pydub import AudioSegment
import librosa
import numpy as np
import matplotlib.pyplot as plt
from tqdm import tqdm
import time
from dsp import *

我们希望使用 SVM 实现语音识别，步骤如下：

1. 特征提取

2. 模型训练

3. 模型识别

In [8]:
def readDat(filepath):
    # 使用16位有符号整数(int16)格式读取原始数据
    y = np.fromfile(filepath, dtype=np.int16)
    # 将整数值归一化到[-1, 1]范围
    y = y.astype(np.float32) / 32768.0
    return y

In [9]:
y = readDat('22307110206-00-01.dat')
print(y.shape)

(20310,)


In [24]:
# 特征提取
def extractFeature(audio_file, sr=8000, win=256):
    y = readDat(audio_file)
    
    segments = vad(y, sr, win, win//2)

    if len(segments) == 0:
        print("No segments found.")
        return None
    
    # 取所有音频段的起始和结束时间
    start = segments[0][0]
    end = segments[-1][1]
    y_speech = y[int(start):int(end)]

    # 确保语音段足够长
    min_length = win * 2  # 确保能生成至少一个完整的STFT帧
    if len(y_speech) < min_length:
        print(f"警告: {audio_file} 语音段太短({len(y_speech)}采样点)，填充至{min_length}采样点")
        # y_speech = np.pad(y_speech, (0, min_length - len(y_speech)), 'constant')
        return None

    # print("Start time:", start)
    # print("End time:", end)
    # print("Segment Num:", len(segments))
    # print("-" * 20)

    # 提取MFCC特征
    mfcc_feature = computeMFCC(y_speech, sr, win, D=13, M=26)

    mfcc_mean = np.mean(mfcc_feature, axis=1)
    mfcc_std = np.std(mfcc_feature, axis=1)

    feature = np.concatenate([mfcc_mean, mfcc_std])

    return feature

In [None]:
# 准备数据集
# def prepareData(base_dir, classes):
#     features = []
#     labels = []
    
#     total_files = 0         # 总文件数
#     processed_files = 0     # 处理的文件数
    
#     print("计算总文件数...")
#     for idx, name in enumerate(classes):
#         class_dir = os.path.join(base_dir, str(idx).zfill(2))
#         if os.path.exists(class_dir):
#             for filename in os.listdir(class_dir):
#                 if filename.endswith('.dat'):
#                     total_files += 1
#     print(f"找到 {total_files} 个文件")
    
#     for idx, name in enumerate(classes):
#         class_dir = os.path.join(base_dir, str(idx).zfill(2))
#         if not os.path.exists(class_dir):
#             print(f"警告: 目录 {class_dir} 不存在")
#             continue
            
#         print(f"处理类别 {idx}: {name}")
#         for filename in os.listdir(class_dir):
#             if filename.endswith('.dat'):
#                 filepath = os.path.join(class_dir, filename)
#                 feature = extractFeature(filepath)
#                 if feature is not None:
#                     features.append(feature)
#                     labels.append(idx)
                
#                 processed_files += 1
#                 percent = processed_files / total_files * 100
#                 print(f"\r进度: [{processed_files}/{total_files}] {percent:.1f}%", end="")
    
#     print("\n处理完成!")
#     return np.array(features), np.array(labels)

# 准备数据集
def prepareData(base_dir, classes):
    features = []
    labels = []

    print(f"开始从 {base_dir} 加载数据...")
    
    total_files = 0         # 总文件数
    error_files = 0         # 出错的文件数
    
    # 先计算总文件数
    for idx, name in enumerate(classes):
        class_dir = os.path.join(base_dir, str(idx).zfill(2))
        if os.path.exists(class_dir):
            for filename in os.listdir(class_dir):
                if filename.endswith('.dat'):
                    total_files += 1
    print(f"找到 {total_files} 个文件")
    
    # 创建总进度条
    with tqdm(total=total_files, desc="总进度") as pbar:
        for idx, name in enumerate(classes):
            class_dir = os.path.join(base_dir, str(idx).zfill(2))
            
            if not os.path.exists(class_dir):
                print(f"警告：目录 {class_dir} 不存在，跳过类别 '{name}'")
                continue
                
            class_files = [f for f in os.listdir(class_dir) if f.endswith('.dat')]
            print(f"正在处理类别 '{name}' ({len(class_files)}个文件)...")
            
            for filename in class_files:
                filepath = os.path.join(class_dir, filename)
                try:
                    feature = extractFeature(filepath)
                    if feature is not None:
                        features.append(feature)
                        labels.append(idx)
                    else:
                        error_files += 1
                except Exception as e:
                    print(f"处理文件 {filepath} 出错: {str(e)}")
                    error_files += 1
                
                pbar.set_postfix({"出错": error_files})
                pbar.update(1)
            
    print(f"\n处理完成: 共 {total_files} 个文件, 出错 {error_files} 个")
    if len(features) == 0:
        raise ValueError("没有成功处理任何文件!请检查数据路径和文件格式")
    
    return np.array(features), np.array(labels)

In [None]:
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC
from sklearn.metrics import classification_report, accuracy_score
import joblib

# 训练SVM模型
def train_svm_model(features, labels, test_size=0.2, random_state=42):
    # 分割训练集和测试集
    X_train, X_test, y_train, y_test = train_test_split(
        features, labels, test_size=test_size, random_state=random_state, stratify=labels
    )
    
    # 特征标准化
    scaler = StandardScaler()
    X_train_scaled = scaler.fit_transform(X_train)
    X_test_scaled = scaler.transform(X_test)
    
    # 训练SVM模型
    svm = SVC(kernel='rbf', C=10, gamma='scale', probability=True)
    svm.fit(X_train_scaled, y_train)
    
    # 评估模型
    y_pred = svm.predict(X_test_scaled)
    accuracy = accuracy_score(y_test, y_pred)
    report = classification_report(y_test, y_pred)
    
    print(f"Accuracy: {accuracy:.4f}")
    print("Classification Report:")
    print(report)
    
    # 保存模型和标准化器
    joblib.dump(svm, 'svm_model.pkl')
    joblib.dump(scaler, 'scaler.pkl')
    
    return svm, scaler, (X_test_scaled, y_test)

In [None]:
# 使用模型进行识别
def recognize_speech(audio_file, model, scaler, class_names):
    # 提取特征
    feature = extractFeature(audio_file)
    if feature is None:
        return "无法检测到语音"
    
    # 标准化特征
    features_scaled = scaler.transform(feature.reshape(1, -1))
    
    # 预测
    probabilities = model.predict_proba(features_scaled)[0]
    class_idx = np.argmax(probabilities)
    confidence = probabilities[class_idx]
    
    return class_names[class_idx], confidence

In [26]:
classes = ["数字", "语音", "语言", "处理", "中国", "忠告", "北京", "背景", "上海", 
              "Speech", "Speaker", "Signal", "Sequence", "Processing", "Print", "Project", "File", "Open"]

features, labels = prepareData('../Data', classes)


开始从 ../Data 加载数据...
找到 9719 个文件


总进度:   0%|          | 0/9719 [00:00<?, ?it/s]

正在处理类别 '数字' (539个文件)...


总进度:   0%|          | 1/9719 [00:00<55:17,  2.93it/s, 出错=1]

警告: ../Data/00/21307130052_00_19.dat 语音段太短(128采样点)，填充至512采样点


总进度:   0%|          | 21/9719 [00:09<2:20:30,  1.15it/s, 出错=2]

警告: ../Data/00/22307130038_00_18.dat 语音段太短(128采样点)，填充至512采样点


总进度:   0%|          | 37/9719 [00:04<2:20:16,  1.15it/s, 出错=4]

警告: ../Data/00/21307130052_00_11.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/00/21307130052_00_10.dat 语音段太短(128采样点)，填充至512采样点


总进度:   1%|          | 69/9719 [00:08<29:22,  5.47it/s, 出错=6]  

警告: ../Data/00/22307130038_00_07.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/00/21307130052_00_12.dat 语音段太短(128采样点)，填充至512采样点


总进度:   1%|          | 118/9719 [00:15<23:45,  6.73it/s, 出错=7]

警告: ../Data/00/22307130038_00_16.dat 语音段太短(128采样点)，填充至512采样点


总进度:   1%|▏         | 127/9719 [00:16<23:44,  6.73it/s, 出错=8]

警告: ../Data/00/22307130013_00_17.dat 语音段太短(128采样点)，填充至512采样点


总进度:   1%|▏         | 132/9719 [00:16<23:43,  6.73it/s, 出错=9]

警告: ../Data/00/21307130052_00_07.dat 语音段太短(128采样点)，填充至512采样点


总进度:   1%|▏         | 138/9719 [00:17<23:42,  6.73it/s, 出错=10]

警告: ../Data/00/21307130052_00_16.dat 语音段太短(128采样点)，填充至512采样点


总进度:   1%|▏         | 145/9719 [00:17<23:41,  6.73it/s, 出错=11]

警告: ../Data/00/21307130052_00_18.dat 语音段太短(128采样点)，填充至512采样点


总进度:   2%|▏         | 148/9719 [00:18<23:41,  6.73it/s, 出错=12]

警告: ../Data/00/22307130038_00_12.dat 语音段太短(128采样点)，填充至512采样点


总进度:   2%|▏         | 188/9719 [00:22<19:58,  7.95it/s, 出错=16]

警告: ../Data/00/21307130052_00_13.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/00/22307130013_00_01.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/00/21307130052_00_20.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/00/22307130038_00_06.dat 语音段太短(384采样点)，填充至512采样点


总进度:   2%|▏         | 211/9719 [00:25<19:04,  8.31it/s, 出错=17]

警告: ../Data/00/21307130052_00_09.dat 语音段太短(128采样点)，填充至512采样点


总进度:   2%|▏         | 230/9719 [00:27<19:02,  8.31it/s, 出错=18]

警告: ../Data/00/22307130038_00_11.dat 语音段太短(128采样点)，填充至512采样点


总进度:   2%|▏         | 241/9719 [00:29<19:06,  8.27it/s, 出错=20]

警告: ../Data/00/21307130150-00-20.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/00/22307130013_00_20.dat 语音段太短(128采样点)，填充至512采样点


总进度:   3%|▎         | 250/9719 [00:30<19:05,  8.27it/s, 出错=21]

警告: ../Data/00/21307130150-00-18.dat 语音段太短(128采样点)，填充至512采样点


总进度:   3%|▎         | 263/9719 [00:31<19:03,  8.27it/s, 出错=22]

警告: ../Data/00/21307130052_00_03.dat 语音段太短(128采样点)，填充至512采样点


总进度:   3%|▎         | 272/9719 [00:33<19:02,  8.27it/s, 出错=23]

警告: ../Data/00/21307130052_00_02.dat 语音段太短(128采样点)，填充至512采样点


总进度:   3%|▎         | 283/9719 [00:33<19:00,  8.27it/s, 出错=24]

警告: ../Data/00/22307130013_00_06.dat 语音段太短(128采样点)，填充至512采样点


总进度:   3%|▎         | 290/9719 [00:34<18:59,  8.27it/s, 出错=25]

警告: ../Data/00/21307130150-00-16.dat 语音段太短(128采样点)，填充至512采样点


总进度:   4%|▎         | 341/9719 [00:41<18:20,  8.52it/s, 出错=26]

警告: ../Data/00/21307130052_00_15.dat 语音段太短(128采样点)，填充至512采样点


总进度:   4%|▎         | 361/9719 [00:49<18:42,  8.34it/s, 出错=27]

警告: ../Data/00/22307130038_00_01.dat 语音段太短(128采样点)，填充至512采样点


总进度:   4%|▎         | 363/9719 [00:43<18:41,  8.34it/s, 出错=28]

警告: ../Data/00/22307130038_00_14.dat 语音段太短(128采样点)，填充至512采样点


总进度:   4%|▍         | 375/9719 [00:45<18:40,  8.34it/s, 出错=30]

警告: ../Data/00/21307130052_00_17.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/00/22307130013_00_12.dat 语音段太短(128采样点)，填充至512采样点


总进度:   4%|▍         | 391/9719 [00:46<18:38,  8.34it/s, 出错=31]

警告: ../Data/00/22307130038_00_19.dat 语音段太短(128采样点)，填充至512采样点


总进度:   4%|▍         | 402/9719 [00:47<18:37,  8.34it/s, 出错=32]

警告: ../Data/00/21307130052_00_01.dat 语音段太短(128采样点)，填充至512采样点


总进度:   5%|▍         | 443/9719 [00:52<17:54,  8.63it/s, 出错=33]

警告: ../Data/00/21307130150-00-14.dat 语音段太短(128采样点)，填充至512采样点


总进度:   5%|▍         | 452/9719 [00:53<17:53,  8.63it/s, 出错=34]

警告: ../Data/00/21307130052_00_04.dat 语音段太短(128采样点)，填充至512采样点


总进度:   5%|▍         | 462/9719 [00:55<09:48, 15.74it/s, 出错=35]

警告: ../Data/00/22307130038_00_03.dat 语音段太短(128采样点)，填充至512采样点


总进度:   5%|▍         | 466/9719 [00:55<09:47, 15.74it/s, 出错=36]

警告: ../Data/00/22307130013_00_16.dat 语音段太短(128采样点)，填充至512采样点


总进度:   5%|▍         | 473/9719 [00:55<10:12, 15.10it/s, 出错=37]

警告: ../Data/00/21307130052_00_05.dat 语音段太短(128采样点)，填充至512采样点


总进度:   5%|▌         | 509/9719 [00:59<2:07:06,  1.21it/s, 出错=38]

警告: ../Data/00/22307130143_00_02.dat 语音段太短(128采样点)，填充至512采样点


总进度:   5%|▌         | 513/9719 [00:59<2:07:03,  1.21it/s, 出错=39]

警告: ../Data/00/22307130038_00_08.dat 语音段太短(384采样点)，填充至512采样点


总进度:   5%|▌         | 518/9719 [01:00<2:06:58,  1.21it/s, 出错=40]

警告: ../Data/00/21307130052_00_06.dat 语音段太短(128采样点)，填充至512采样点


总进度:   5%|▌         | 530/9719 [01:01<2:06:49,  1.21it/s, 出错=43]

警告: ../Data/00/22307130038_00_02.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/00/22307130038_00_10.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/00/22307130038_00_20.dat 语音段太短(128采样点)，填充至512采样点


总进度:   6%|▌         | 541/9719 [01:09<29:26,  5.19it/s, 出错=43]  

正在处理类别 '语音' (540个文件)...


总进度:   6%|▌         | 562/9719 [01:06<28:18,  5.39it/s, 出错=44]

警告: ../Data/01/21307130150-01-14.dat 语音段太短(128采样点)，填充至512采样点


总进度:   6%|▌         | 567/9719 [01:06<28:17,  5.39it/s, 出错=45]

警告: ../Data/01/21307130052_01_07.dat 语音段太短(128采样点)，填充至512采样点


总进度:   6%|▌         | 591/9719 [01:08<21:47,  6.98it/s, 出错=46]

警告: ../Data/01/21307130150-01-09.dat 语音段太短(128采样点)，填充至512采样点


总进度:   6%|▌         | 596/9719 [01:09<21:47,  6.98it/s, 出错=47]

警告: ../Data/01/22307130038_01_14.dat 语音段太短(128采样点)，填充至512采样点


总进度:   6%|▋         | 617/9719 [01:12<21:44,  6.98it/s, 出错=49]

警告: ../Data/01/21307130052_01_19.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/01/22307130038_01_20.dat 语音段太短(128采样点)，填充至512采样点


总进度:   7%|▋         | 632/9719 [01:14<20:28,  7.40it/s, 出错=50]

警告: ../Data/01/21307130150-01-10.dat 语音段太短(128采样点)，填充至512采样点


总进度:   7%|▋         | 641/9719 [01:15<20:26,  7.40it/s, 出错=51]

警告: ../Data/01/22307130013_01_13.dat 语音段太短(128采样点)，填充至512采样点


总进度:   7%|▋         | 653/9719 [01:16<20:25,  7.40it/s, 出错=56]

警告: ../Data/01/22307130013_01_04.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/01/21307130150-01-01.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/01/22307130013_01_03.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/01/22307130013_01_05.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/01/22307130013_01_15.dat 语音段太短(128采样点)，填充至512采样点


总进度:   7%|▋         | 657/9719 [01:17<20:24,  7.40it/s, 出错=57]

警告: ../Data/01/21307130052_01_18.dat 语音段太短(128采样点)，填充至512采样点


总进度:   7%|▋         | 660/9719 [01:17<20:24,  7.40it/s, 出错=58]

警告: ../Data/01/22307130013_01_06.dat 语音段太短(128采样点)，填充至512采样点


总进度:   7%|▋         | 673/9719 [01:18<19:07,  7.89it/s, 出错=60]

警告: ../Data/01/21307130052_01_08.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/01/21307130150-01-02.dat 语音段太短(128采样点)，填充至512采样点


总进度:   7%|▋         | 678/9719 [01:19<19:06,  7.89it/s, 出错=61]

警告: ../Data/01/22307130143_01_16.dat 语音段太短(128采样点)，填充至512采样点


总进度:   7%|▋         | 686/9719 [01:20<19:05,  7.89it/s, 出错=62]

警告: ../Data/01/22307130038_01_05.dat 语音段太短(128采样点)，填充至512采样点


总进度:   7%|▋         | 690/9719 [01:20<19:04,  7.89it/s, 出错=63]

警告: ../Data/01/21307130052_01_04.dat 语音段太短(128采样点)，填充至512采样点


总进度:   7%|▋         | 700/9719 [01:22<19:03,  7.89it/s, 出错=64]

警告: ../Data/01/21307130150-01-18.dat 语音段太短(128采样点)，填充至512采样点


总进度:   7%|▋         | 713/9719 [01:23<19:01,  7.89it/s, 出错=65]

警告: ../Data/01/22307130013_01_17.dat 语音段太短(128采样点)，填充至512采样点


总进度:   7%|▋         | 720/9719 [01:24<19:00,  7.89it/s, 出错=66]

警告: ../Data/01/22307130013_01_09.dat 语音段太短(128采样点)，填充至512采样点


总进度:   8%|▊         | 729/9719 [01:25<18:59,  7.89it/s, 出错=67]

警告: ../Data/01/21307130150-01-17.dat 语音段太短(128采样点)，填充至512采样点


总进度:   8%|▊         | 747/9719 [01:27<18:57,  7.89it/s, 出错=68]

警告: ../Data/01/22307130038_01_10.dat 语音段太短(128采样点)，填充至512采样点


总进度:   8%|▊         | 761/9719 [01:28<17:28,  8.55it/s, 出错=69]

警告: ../Data/01/22307130013_01_12.dat 语音段太短(128采样点)，填充至512采样点


总进度:   8%|▊         | 783/9719 [01:31<17:25,  8.55it/s, 出错=70]

警告: ../Data/01/21307130052_01_01.dat 语音段太短(128采样点)，填充至512采样点


总进度:   8%|▊         | 791/9719 [01:32<17:24,  8.55it/s, 出错=71]

警告: ../Data/01/21307130052_01_14.dat 语音段太短(128采样点)，填充至512采样点


总进度:   8%|▊         | 801/9719 [01:33<17:47,  8.35it/s, 出错=72]

警告: ../Data/01/21307130150-01-11.dat 语音段太短(128采样点)，填充至512采样点


总进度:   8%|▊         | 821/9719 [01:37<17:45,  8.35it/s, 出错=74]

警告: ../Data/01/21307130150-01-13.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/01/21307130150-01-15.dat 语音段太短(128采样点)，填充至512采样点


总进度:   8%|▊         | 825/9719 [01:37<17:44,  8.35it/s, 出错=75]

警告: ../Data/01/21307130150-01-19.dat 语音段太短(128采样点)，填充至512采样点


总进度:   9%|▊         | 831/9719 [01:38<17:43,  8.35it/s, 出错=76]

警告: ../Data/01/21307130150-01-03.dat 语音段太短(128采样点)，填充至512采样点


总进度:   9%|▉         | 851/9719 [01:40<18:17,  8.08it/s, 出错=77]

警告: ../Data/01/21307130052_01_03.dat 语音段太短(128采样点)，填充至512采样点


总进度:   9%|▉         | 856/9719 [01:40<18:17,  8.08it/s, 出错=78]

警告: ../Data/01/22307130013_01_18.dat 语音段太短(128采样点)，填充至512采样点


总进度:   9%|▉         | 861/9719 [01:41<18:16,  8.08it/s, 出错=79]

警告: ../Data/01/21307130052_01_02.dat 语音段太短(128采样点)，填充至512采样点


总进度:   9%|▉         | 863/9719 [01:41<18:16,  8.08it/s, 出错=80]

警告: ../Data/01/21307130150-01-16.dat 语音段太短(128采样点)，填充至512采样点


总进度:   9%|▉         | 870/9719 [01:42<18:15,  8.08it/s, 出错=81]

警告: ../Data/01/22307130013_01_19.dat 语音段太短(128采样点)，填充至512采样点


总进度:   9%|▉         | 885/9719 [01:43<17:19,  8.50it/s, 出错=83]

警告: ../Data/01/21307130052_01_06.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/01/21307130052_01_20.dat 语音段太短(128采样点)，填充至512采样点


总进度:   9%|▉         | 897/9719 [01:44<17:17,  8.50it/s, 出错=84]

警告: ../Data/01/22307130013_01_16.dat 语音段太短(128采样点)，填充至512采样点


总进度:   9%|▉         | 916/9719 [01:47<17:15,  8.50it/s, 出错=85]

警告: ../Data/01/22307130038_01_06.dat 语音段太短(128采样点)，填充至512采样点


总进度:   9%|▉         | 920/9719 [01:48<17:15,  8.50it/s, 出错=86]

警告: ../Data/01/22307130038_01_01.dat 语音段太短(128采样点)，填充至512采样点


总进度:  10%|▉         | 924/9719 [01:48<17:32,  8.36it/s, 出错=87]

警告: ../Data/01/21307130052_01_12.dat 语音段太短(128采样点)，填充至512采样点


总进度:  10%|▉         | 929/9719 [01:49<17:31,  8.36it/s, 出错=88]

警告: ../Data/01/22307130038_01_08.dat 语音段太短(128采样点)，填充至512采样点


总进度:  10%|▉         | 945/9719 [01:51<17:29,  8.36it/s, 出错=89]

警告: ../Data/01/22307130224_01_03.dat 语音段太短(256采样点)，填充至512采样点


总进度:  10%|▉         | 965/9719 [01:53<17:39,  8.26it/s, 出错=90]

警告: ../Data/01/21307130052_01_13.dat 语音段太短(128采样点)，填充至512采样点


总进度:  10%|█         | 974/9719 [01:54<17:38,  8.26it/s, 出错=91]

警告: ../Data/01/21307130052_01_10.dat 语音段太短(128采样点)，填充至512采样点


总进度:  10%|█         | 977/9719 [01:55<17:38,  8.26it/s, 出错=92]

警告: ../Data/01/21307130052_01_15.dat 语音段太短(128采样点)，填充至512采样点


总进度:  10%|█         | 1003/9719 [02:04<17:25,  8.34it/s, 出错=93]

警告: ../Data/01/21307130052_01_11.dat 语音段太短(128采样点)，填充至512采样点


总进度:  10%|█         | 1014/9719 [01:59<17:22,  8.35it/s, 出错=94]

警告: ../Data/01/21307130052_01_09.dat 语音段太短(128采样点)，填充至512采样点


总进度:  11%|█         | 1022/9719 [02:01<17:21,  8.35it/s, 出错=95]

警告: ../Data/01/21307130150-01-04.dat 语音段太短(128采样点)，填充至512采样点


总进度:  11%|█         | 1027/9719 [02:01<17:20,  8.35it/s, 出错=96]

警告: ../Data/01/22307130013_01_11.dat 语音段太短(128采样点)，填充至512采样点


总进度:  11%|█         | 1029/9719 [02:02<17:20,  8.35it/s, 出错=97]

警告: ../Data/01/22307130038_01_18.dat 语音段太短(128采样点)，填充至512采样点


总进度:  11%|█         | 1040/9719 [02:03<17:19,  8.35it/s, 出错=98]

警告: ../Data/01/21307130052_01_16.dat 语音段太短(128采样点)，填充至512采样点


总进度:  11%|█         | 1047/9719 [02:03<17:18,  8.35it/s, 出错=100]

警告: ../Data/01/22307130038_01_04.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/01/21307130052_01_05.dat 语音段太短(128采样点)，填充至512采样点


总进度:  11%|█         | 1053/9719 [02:04<17:17,  8.35it/s, 出错=103]

警告: ../Data/01/22307130013_01_20.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/01/21307130150-01-20.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/01/21307130052_01_17.dat 语音段太短(128采样点)，填充至512采样点


总进度:  11%|█         | 1059/9719 [02:04<08:17, 17.42it/s, 出错=104]

警告: ../Data/01/22307130038_01_12.dat 语音段太短(128采样点)，填充至512采样点


总进度:  11%|█         | 1067/9719 [02:05<08:16, 17.42it/s, 出错=105]

警告: ../Data/01/22307130013_01_08.dat 语音段太短(128采样点)，填充至512采样点


总进度:  11%|█         | 1073/9719 [02:06<09:42, 14.85it/s, 出错=106]

警告: ../Data/01/22307130143_01_12.dat 语音段太短(384采样点)，填充至512采样点


总进度:  11%|█         | 1084/9719 [02:07<10:08, 14.19it/s, 出错=108]

正在处理类别 '语言' (540个文件)...
警告: ../Data/02/22307130038_02_20.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/02/22307130013_02_16.dat 语音段太短(128采样点)，填充至512采样点


总进度:  11%|█▏        | 1116/9719 [02:10<38:15,  3.75it/s, 出错=109]

警告: ../Data/02/21307130150-02-09.dat 语音段太短(128采样点)，填充至512采样点


总进度:  12%|█▏        | 1132/9719 [02:13<38:11,  3.75it/s, 出错=110]

警告: ../Data/02/21307130052_02_04.dat 语音段太短(128采样点)，填充至512采样点


总进度:  12%|█▏        | 1139/9719 [02:13<23:23,  6.11it/s, 出错=111]

警告: ../Data/02/21307130052_02_20.dat 语音段太短(128采样点)，填充至512采样点


总进度:  12%|█▏        | 1142/9719 [02:13<23:22,  6.11it/s, 出错=112]

警告: ../Data/02/21307130052_02_17.dat 语音段太短(128采样点)，填充至512采样点


总进度:  12%|█▏        | 1149/9719 [02:14<23:21,  6.11it/s, 出错=113]

警告: ../Data/02/22307130013_02_03.dat 语音段太短(128采样点)，填充至512采样点


总进度:  12%|█▏        | 1161/9719 [02:15<23:19,  6.11it/s, 出错=114]

警告: ../Data/02/22307130013_02_20.dat 语音段太短(128采样点)，填充至512采样点


总进度:  12%|█▏        | 1173/9719 [02:17<23:17,  6.11it/s, 出错=116]

警告: ../Data/02/21307130052_02_02.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/02/21307130150-02-06.dat 语音段太短(128采样点)，填充至512采样点


总进度:  12%|█▏        | 1175/9719 [02:17<23:17,  6.11it/s, 出错=117]

警告: ../Data/02/21307130052_02_10.dat 语音段太短(128采样点)，填充至512采样点


总进度:  12%|█▏        | 1187/9719 [02:24<17:38,  8.06it/s, 出错=118]

警告: ../Data/02/21307130052_02_09.dat 语音段太短(128采样点)，填充至512采样点


总进度:  12%|█▏        | 1200/9719 [02:19<17:37,  8.06it/s, 出错=120]

警告: ../Data/02/21307130052_02_13.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/02/22307130013_02_10.dat 语音段太短(128采样点)，填充至512采样点


总进度:  12%|█▏        | 1208/9719 [02:21<17:36,  8.06it/s, 出错=121]

警告: ../Data/02/21307130052_02_05.dat 语音段太短(128采样点)，填充至512采样点


总进度:  13%|█▎        | 1219/9719 [02:22<17:34,  8.06it/s, 出错=122]

警告: ../Data/02/22307130013_02_09.dat 语音段太短(128采样点)，填充至512采样点


总进度:  13%|█▎        | 1225/9719 [02:23<17:33,  8.06it/s, 出错=124]

警告: ../Data/02/21307130150-02-03.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/02/21307130150-02-08.dat 语音段太短(128采样点)，填充至512采样点


总进度:  13%|█▎        | 1229/9719 [02:23<17:47,  7.95it/s, 出错=125]

警告: ../Data/02/21307130052_02_12.dat 语音段太短(128采样点)，填充至512采样点


总进度:  13%|█▎        | 1234/9719 [02:24<17:47,  7.95it/s, 出错=126]

警告: ../Data/02/21307130150-02-12.dat 语音段太短(128采样点)，填充至512采样点


总进度:  13%|█▎        | 1266/9719 [02:28<18:38,  7.55it/s, 出错=127]

警告: ../Data/02/21307130052_02_01.dat 语音段太短(128采样点)，填充至512采样点


总进度:  13%|█▎        | 1274/9719 [02:29<18:37,  7.55it/s, 出错=128]

警告: ../Data/02/21307130150-02-14.dat 语音段太短(128采样点)，填充至512采样点


总进度:  13%|█▎        | 1278/9719 [02:29<18:37,  7.55it/s, 出错=129]

警告: ../Data/02/21307130052_02_15.dat 语音段太短(128采样点)，填充至512采样点


总进度:  13%|█▎        | 1302/9719 [02:32<18:34,  7.55it/s, 出错=130]

警告: ../Data/02/21307130150-02-05.dat 语音段太短(128采样点)，填充至512采样点


总进度:  13%|█▎        | 1305/9719 [02:33<18:33,  7.55it/s, 出错=131]

警告: ../Data/02/22307130038_02_02.dat 语音段太短(128采样点)，填充至512采样点


总进度:  14%|█▍        | 1340/9719 [02:37<17:07,  8.15it/s, 出错=133]

警告: ../Data/02/22307130013_02_14.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/02/21307130150-02-07.dat 语音段太短(128采样点)，填充至512采样点


总进度:  14%|█▍        | 1347/9719 [02:38<17:06,  8.15it/s, 出错=134]

警告: ../Data/02/22307130013_02_02.dat 语音段太短(128采样点)，填充至512采样点


总进度:  14%|█▍        | 1368/9719 [02:40<17:08,  8.12it/s, 出错=136]

警告: ../Data/02/22307130038_02_12.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/02/22307130013_02_06.dat 语音段太短(128采样点)，填充至512采样点


总进度:  14%|█▍        | 1389/9719 [02:43<17:05,  8.12it/s, 出错=137]

警告: ../Data/02/22307130038_02_04.dat 语音段太短(128采样点)，填充至512采样点


总进度:  14%|█▍        | 1391/9719 [02:49<16:56,  8.19it/s, 出错=138]

警告: ../Data/02/21307130150-02-11.dat 语音段太短(128采样点)，填充至512采样点


总进度:  14%|█▍        | 1398/9719 [02:44<16:55,  8.19it/s, 出错=139]

警告: ../Data/02/22307130013_02_13.dat 语音段太短(128采样点)，填充至512采样点


总进度:  15%|█▍        | 1427/9719 [02:48<16:52,  8.19it/s, 出错=140]

警告: ../Data/02/22307130038_02_07.dat 语音段太短(128采样点)，填充至512采样点


总进度:  15%|█▍        | 1431/9719 [02:48<17:12,  8.03it/s, 出错=141]

警告: ../Data/02/22307130013_02_11.dat 语音段太短(128采样点)，填充至512采样点


总进度:  15%|█▍        | 1437/9719 [02:49<17:11,  8.03it/s, 出错=143]

警告: ../Data/02/21307130052_02_06.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/02/22307130038_02_18.dat 语音段太短(128采样点)，填充至512采样点


总进度:  15%|█▍        | 1443/9719 [02:49<17:11,  8.03it/s, 出错=144]

警告: ../Data/02/21307130052_02_08.dat 语音段太短(128采样点)，填充至512采样点


总进度:  15%|█▍        | 1445/9719 [02:49<17:10,  8.03it/s, 出错=145]

警告: ../Data/02/21307130150-02-02.dat 语音段太短(128采样点)，填充至512采样点


总进度:  15%|█▍        | 1457/9719 [02:51<17:09,  8.03it/s, 出错=146]

警告: ../Data/02/22307130038_02_17.dat 语音段太短(128采样点)，填充至512采样点


总进度:  15%|█▌        | 1481/9719 [02:54<16:32,  8.30it/s, 出错=147]

警告: ../Data/02/21307130052_02_03.dat 语音段太短(128采样点)，填充至512采样点


总进度:  15%|█▌        | 1506/9719 [02:56<16:29,  8.30it/s, 出错=149]

警告: ../Data/02/21307130052_02_11.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/02/22307130038_02_06.dat 语音段太短(128采样点)，填充至512采样点


总进度:  16%|█▌        | 1543/9719 [03:03<16:02,  8.49it/s, 出错=150]

警告: ../Data/02/21307130052_02_07.dat 语音段太短(128采样点)，填充至512采样点


总进度:  16%|█▌        | 1546/9719 [03:03<16:02,  8.49it/s, 出错=152]

警告: ../Data/02/22307130013_02_15.dat 语音段太短(256采样点)，填充至512采样点
警告: ../Data/02/22307130013_02_04.dat 语音段太短(128采样点)，填充至512采样点


总进度:  16%|█▌        | 1554/9719 [03:04<17:54,  7.60it/s, 出错=153]

警告: ../Data/02/22307130038_02_05.dat 语音段太短(128采样点)，填充至512采样点


总进度:  16%|█▋        | 1581/9719 [03:14<18:26,  7.35it/s, 出错=154]

警告: ../Data/02/22307130013_02_05.dat 语音段太短(128采样点)，填充至512采样点


总进度:  16%|█▋        | 1595/9719 [03:10<18:26,  7.34it/s, 出错=155]

警告: ../Data/02/21307130150-02-13.dat 语音段太短(128采样点)，填充至512采样点


总进度:  16%|█▋        | 1597/9719 [03:11<18:25,  7.34it/s, 出错=156]

警告: ../Data/02/22307130038_02_16.dat 语音段太短(128采样点)，填充至512采样点


总进度:  16%|█▋        | 1602/9719 [03:11<18:25,  7.34it/s, 出错=158]

警告: ../Data/02/21307130150-02-10.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/02/21307130052_02_14.dat 语音段太短(128采样点)，填充至512采样点


总进度:  17%|█▋        | 1612/9719 [03:12<18:23,  7.34it/s, 出错=159]

警告: ../Data/02/21307130150-02-04.dat 语音段太短(128采样点)，填充至512采样点


总进度:  17%|█▋        | 1618/9719 [03:13<18:23,  7.34it/s, 出错=159]

正在处理类别 '处理' (540个文件)...


总进度:  17%|█▋        | 1627/9719 [03:14<18:11,  7.41it/s, 出错=160]

警告: ../Data/03/21307130052_03_04.dat 语音段太短(128采样点)，填充至512采样点


总进度:  17%|█▋        | 1633/9719 [03:15<18:10,  7.41it/s, 出错=161]

警告: ../Data/03/21307130052_03_06.dat 语音段太短(128采样点)，填充至512采样点


总进度:  17%|█▋        | 1653/9719 [03:17<18:08,  7.41it/s, 出错=162]

警告: ../Data/03/22307130013_03_18.dat 语音段太短(128采样点)，填充至512采样点


总进度:  17%|█▋        | 1661/9719 [03:18<18:06,  7.41it/s, 出错=165]

警告: ../Data/03/22307130143_03_13.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/03/22307130038_03_02.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/03/22307130013_03_20.dat 语音段太短(128采样点)，填充至512采样点


总进度:  17%|█▋        | 1668/9719 [03:18<16:36,  8.08it/s, 出错=166]

警告: ../Data/03/21307130052_03_11.dat 语音段太短(128采样点)，填充至512采样点


总进度:  17%|█▋        | 1686/9719 [03:21<16:34,  8.08it/s, 出错=167]

警告: ../Data/03/21307130052_03_07.dat 语音段太短(128采样点)，填充至512采样点


总进度:  17%|█▋        | 1696/9719 [03:22<16:33,  8.08it/s, 出错=169]

警告: ../Data/03/22307130143_03_02.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/03/22307130013_03_02.dat 语音段太短(128采样点)，填充至512采样点


总进度:  17%|█▋        | 1698/9719 [03:23<16:32,  8.08it/s, 出错=170]

警告: ../Data/03/21307130052_03_10.dat 语音段太短(128采样点)，填充至512采样点


总进度:  18%|█▊        | 1714/9719 [03:24<16:30,  8.08it/s, 出错=171]

警告: ../Data/03/21307130052_03_01.dat 语音段太短(128采样点)，填充至512采样点


总进度:  18%|█▊        | 1723/9719 [03:25<10:04, 13.24it/s, 出错=172]

警告: ../Data/03/22307130013_03_06.dat 语音段太短(128采样点)，填充至512采样点


总进度:  18%|█▊        | 1732/9719 [03:27<10:46, 12.36it/s, 出错=173]

警告: ../Data/03/22307130013_03_09.dat 语音段太短(128采样点)，填充至512采样点


总进度:  18%|█▊        | 1736/9719 [03:28<12:16, 10.84it/s, 出错=174]

警告: ../Data/03/22307130038_03_20.dat 语音段太短(128采样点)，填充至512采样点


总进度:  18%|█▊        | 1744/9719 [03:28<13:15, 10.02it/s, 出错=175]

警告: ../Data/03/22307130038_03_16.dat 语音段太短(128采样点)，填充至512采样点


总进度:  18%|█▊        | 1754/9719 [03:29<11:28, 11.57it/s, 出错=176]

警告: ../Data/03/21307130052_03_18.dat 语音段太短(128采样点)，填充至512采样点


总进度:  18%|█▊        | 1761/9719 [03:30<10:54, 12.15it/s, 出错=177]

警告: ../Data/03/22307130038_03_17.dat 语音段太短(128采样点)，填充至512采样点


总进度:  18%|█▊        | 1776/9719 [03:31<12:33, 10.54it/s, 出错=180]

警告: ../Data/03/22307130038_03_06.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/03/22307130013_03_10.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/03/21307130052_03_12.dat 语音段太短(128采样点)，填充至512采样点


总进度:  19%|█▊        | 1806/9719 [03:34<10:21, 12.73it/s, 出错=181]

警告: ../Data/03/21307130052_03_03.dat 语音段太短(128采样点)，填充至512采样点


总进度:  19%|█▊        | 1809/9719 [03:35<08:49, 14.94it/s, 出错=182]

警告: ../Data/03/22307130038_03_18.dat 语音段太短(128采样点)，填充至512采样点


总进度:  19%|█▊        | 1815/9719 [03:35<12:18, 10.70it/s, 出错=183]

警告: ../Data/03/22307130013_03_12.dat 语音段太短(128采样点)，填充至512采样点


总进度:  19%|█▉        | 1834/9719 [03:38<15:22,  8.55it/s, 出错=184]

警告: ../Data/03/21307130150-03-06.dat 语音段太短(128采样点)，填充至512采样点


总进度:  19%|█▉        | 1838/9719 [03:44<2:06:29,  1.04it/s, 出错=185]

警告: ../Data/03/21307130052_03_09.dat 语音段太短(128采样点)，填充至512采样点


总进度:  19%|█▉        | 1855/9719 [03:39<2:06:13,  1.04it/s, 出错=187]

警告: ../Data/03/21307130150-03-15.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/03/22307130013_03_19.dat 语音段太短(128采样点)，填充至512采样点


总进度:  19%|█▉        | 1865/9719 [03:41<2:06:03,  1.04it/s, 出错=188]

警告: ../Data/03/22307130013_03_15.dat 语音段太短(128采样点)，填充至512采样点


总进度:  19%|█▉        | 1875/9719 [03:43<2:05:54,  1.04it/s, 出错=189]

警告: ../Data/03/21307130150-03-20.dat 语音段太短(128采样点)，填充至512采样点


总进度:  19%|█▉        | 1891/9719 [03:45<27:12,  4.79it/s, 出错=191]  

警告: ../Data/03/21307130150-03-18.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/03/21307130150-03-17.dat 语音段太短(128采样点)，填充至512采样点


总进度:  20%|█▉        | 1897/9719 [03:46<27:11,  4.79it/s, 出错=192]

警告: ../Data/03/21307130052_03_17.dat 语音段太短(128采样点)，填充至512采样点


总进度:  20%|█▉        | 1899/9719 [03:46<27:10,  4.79it/s, 出错=193]

警告: ../Data/03/21307130052_03_16.dat 语音段太短(128采样点)，填充至512采样点


总进度:  20%|█▉        | 1918/9719 [03:48<27:06,  4.79it/s, 出错=194]

警告: ../Data/03/22307130013_03_13.dat 语音段太短(384采样点)，填充至512采样点


总进度:  20%|█▉        | 1923/9719 [03:49<27:05,  4.79it/s, 出错=196]

警告: ../Data/03/21307130150-03-13.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/03/22307130013_03_05.dat 语音段太短(128采样点)，填充至512采样点


总进度:  20%|█▉        | 1934/9719 [03:50<08:43, 14.88it/s, 出错=197]

警告: ../Data/03/22307130038_03_14.dat 语音段太短(384采样点)，填充至512采样点


总进度:  20%|█▉        | 1937/9719 [03:50<08:43, 14.88it/s, 出错=198]

警告: ../Data/03/21307130052_03_05.dat 语音段太短(128采样点)，填充至512采样点


总进度:  20%|██        | 1953/9719 [03:51<08:57, 14.45it/s, 出错=199]

警告: ../Data/03/21307130052_03_20.dat 语音段太短(128采样点)，填充至512采样点


总进度:  21%|██        | 1993/9719 [03:56<1:41:29,  1.27it/s, 出错=200]

警告: ../Data/03/22307130143_03_10.dat 语音段太短(128采样点)，填充至512采样点


总进度:  21%|██        | 2007/9719 [03:58<1:41:18,  1.27it/s, 出错=201]

警告: ../Data/03/21307130052_03_08.dat 语音段太短(128采样点)，填充至512采样点


总进度:  21%|██        | 2037/9719 [04:01<24:58,  5.13it/s, 出错=203]  

警告: ../Data/03/22307130038_03_04.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/03/21307130052_03_15.dat 语音段太短(128采样点)，填充至512采样点


总进度:  21%|██        | 2043/9719 [04:02<24:57,  5.13it/s, 出错=205]

警告: ../Data/03/21307130150-03-14.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/03/22307130013_03_03.dat 语音段太短(128采样点)，填充至512采样点


总进度:  21%|██        | 2047/9719 [04:02<24:56,  5.13it/s, 出错=206]

警告: ../Data/03/22307130038_03_10.dat 语音段太短(128采样点)，填充至512采样点


总进度:  21%|██        | 2050/9719 [04:02<24:56,  5.13it/s, 出错=207]

警告: ../Data/03/21307130150-03-16.dat 语音段太短(128采样点)，填充至512采样点


总进度:  21%|██▏       | 2073/9719 [04:06<18:27,  6.90it/s, 出错=208]

警告: ../Data/03/21307130052_03_13.dat 语音段太短(128采样点)，填充至512采样点


总进度:  22%|██▏       | 2093/9719 [04:08<18:24,  6.90it/s, 出错=209]

警告: ../Data/03/22307130013_03_08.dat 语音段太短(128采样点)，填充至512采样点


总进度:  22%|██▏       | 2112/9719 [04:10<17:51,  7.10it/s, 出错=210]

警告: ../Data/03/22307130143_03_17.dat 语音段太短(128采样点)，填充至512采样点


总进度:  22%|██▏       | 2116/9719 [04:11<17:50,  7.10it/s, 出错=211]

警告: ../Data/03/21307130052_03_02.dat 语音段太短(128采样点)，填充至512采样点


总进度:  22%|██▏       | 2121/9719 [04:11<17:50,  7.10it/s, 出错=212]

警告: ../Data/03/22307130038_03_01.dat 语音段太短(128采样点)，填充至512采样点


总进度:  22%|██▏       | 2127/9719 [04:12<17:49,  7.10it/s, 出错=213]

警告: ../Data/03/22307130038_03_12.dat 语音段太短(128采样点)，填充至512采样点


总进度:  22%|██▏       | 2132/9719 [04:12<17:48,  7.10it/s, 出错=214]

警告: ../Data/03/22307130013_03_14.dat 语音段太短(128采样点)，填充至512采样点


总进度:  22%|██▏       | 2159/9719 [04:15<16:10,  7.79it/s, 出错=214]

正在处理类别 '中国' (540个文件)...


总进度:  22%|██▏       | 2164/9719 [04:16<16:09,  7.79it/s, 出错=215]

警告: ../Data/04/22307130038_04_07.dat 语音段太短(128采样点)，填充至512采样点


总进度:  22%|██▏       | 2168/9719 [04:16<16:09,  7.79it/s, 出错=216]

警告: ../Data/04/22307130013_04_15.dat 语音段太短(128采样点)，填充至512采样点


总进度:  23%|██▎       | 2195/9719 [04:21<10:31, 11.91it/s, 出错=218]

警告: ../Data/04/22307130038_04_18.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/04/22307130013_04_02.dat 语音段太短(128采样点)，填充至512采样点


总进度:  23%|██▎       | 2210/9719 [04:23<12:01, 10.41it/s, 出错=219]

警告: ../Data/04/22307130013_04_09.dat 语音段太短(128采样点)，填充至512采样点


总进度:  23%|██▎       | 2234/9719 [04:26<1:25:58,  1.45it/s, 出错=220]

警告: ../Data/04/21307130052_04_16.dat 语音段太短(128采样点)，填充至512采样点


总进度:  23%|██▎       | 2243/9719 [04:27<1:25:52,  1.45it/s, 出错=221]

警告: ../Data/04/22307130013_04_03.dat 语音段太短(128采样点)，填充至512采样点


总进度:  23%|██▎       | 2255/9719 [04:28<1:25:43,  1.45it/s, 出错=223]

警告: ../Data/04/21307130150-04-04.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/04/22307130038_04_14.dat 语音段太短(128采样点)，填充至512采样点


总进度:  23%|██▎       | 2263/9719 [04:29<27:12,  4.57it/s, 出错=224]  

警告: ../Data/04/21307130052_04_03.dat 语音段太短(128采样点)，填充至512采样点


总进度:  24%|██▎       | 2295/9719 [04:33<22:31,  5.49it/s, 出错=226]

警告: ../Data/04/22307130013_04_16.dat 语音段太短(128采样点)，填充至512采样点
警告: ../Data/04/21307130052_04_19.dat 语音段太短(128采样点)，填充至512采样点


总进度:  24%|██▎       | 2299/9719 [04:34<14:45,  8.38it/s, 出错=226]


KeyboardInterrupt: 