In [None]:
import os
import subprocess
from tqdm import tqdm

def extract_audio_ffmpeg(input_path, output_path=None, sample_rate=16000, duration=5):
    """
    使用ffmpeg提取MP4中的音频为WAV格式，只提取指定秒数
    
    参数:
        input_path: MP4文件路径
        output_path: 输出WAV文件路径，默认为None（自动生成）
        sample_rate: 输出音频采样率，默认16kHz
        duration: 提取的音频时长（秒），默认5秒
    """
    # 生成输出路径
    if output_path is None:
        # 默认在同目录下创建同名WAV文件
        output_path = os.path.splitext(input_path)[0] + f'_{duration}s.wav'
    
    # 确保输出目录存在
    os.makedirs(os.path.dirname(output_path), exist_ok=True)
    
    # 调用ffmpeg提取音频
    try:
        cmd = [
            'ffmpeg', '-i', input_path,
            '-ss', '0',          # 从开始位置
            '-t', str(duration), # 只提取指定秒数
            '-vn',               # 禁用视频
            '-acodec', 'pcm_s16le',  # 16位PCM编码
            '-ar', str(sample_rate),  # 采样率
            '-ac', '1',          # 单声道
            '-y',                # 覆盖已存在文件
            output_path
        ]
        subprocess.run(cmd, stdout=subprocess.PIPE, stderr=subprocess.PIPE, check=True)
        print(f"已成功提取 {duration} 秒音频: {input_path} -> {output_path}")
        return True
    except subprocess.CalledProcessError as e:
        print(f"处理失败: {e}")
        return False
    except Exception as e:
        print(f"出错: {e}")
        return False

# 示例使用 - 修改这里的文件路径
input_video = "/Users/mac/Desktop/ECAPA_TDNN/vedios/vedio1.mp4"  # 输入视频文件路径
output_audio = "/Users/mac/Desktop/ECAPA_TDNN/audios/audio1.wav"  # 输出音频文件路径

# 调用函数处理单个文件
extract_audio_ffmpeg(input_video, output_audio, duration=5)

In [4]:
def convert_mp3_to_wav(input_path, output_path=None, sample_rate=16000):
    """
    使用ffmpeg将MP3文件转换为WAV格式
    
    参数:
        input_path: MP3文件路径
        output_path: 输出WAV文件路径，默认为None（自动生成）
        sample_rate: 输出音频采样率，默认16kHz
    """
    # 生成输出路径
    if output_path is None:
        # 默认在同目录下创建同名WAV文件
        output_path = os.path.splitext(input_path)[0] + '.wav'
    
    # 确保输出目录存在
    os.makedirs(os.path.dirname(output_path), exist_ok=True)
    
    # 调用ffmpeg转换音频
    try:
        cmd = [
            'ffmpeg', '-i', input_path,
            '-vn',               # 禁用视频流
            '-acodec', 'pcm_s16le',  # 16位PCM编码
            '-ar', str(sample_rate),  # 采样率
            '-ac', '1',          # 单声道
            '-y',                # 覆盖已存在文件
            output_path
        ]
        subprocess.run(cmd, stdout=subprocess.PIPE, stderr=subprocess.PIPE, check=True)
        print(f"已成功转换: {input_path} -> {output_path}")
        return True
    except subprocess.CalledProcessError as e:
        print(f"处理失败: {e}")
        return False
    except Exception as e:
        print(f"出错: {e}")
        return False

# 示例使用 - MP3转WAV
input_mp3 = "/Users/mac/Desktop/ECAPA_TDNN/audios/yinpin.mp3"  # 输入MP3文件路径
output_wav = "/Users/mac/Desktop/ECAPA_TDNN/audios/yinpin.wav"  # 输出WAV文件路径
convert_mp3_to_wav(input_mp3, output_wav)

已成功转换: /Users/mac/Desktop/ECAPA_TDNN/audios/yinpin.mp3 -> /Users/mac/Desktop/ECAPA_TDNN/audios/yinpin.wav


True