# 5.4 语音控制无人机

In [3]:
import gradio as gr
from pydub import AudioSegment
import os

# 确保安装了 ffmpeg 工具
# 如果未安装，请运行以下命令：
# pip install pydub
# 以及下载并安装 ffmpeg：https://ffmpeg.org/

def save_audio_as_mp3(audio):
    # audio 是一个元组，包含采样率 (sample_rate) 和音频数据 (audio_data)
    if isinstance(audio, str):
        # 如果是文件路径，加载音频文件
        audio_segment = AudioSegment.from_file(audio)
    else:
        # 如果是 NumPy 数组，转换为 PyDub 的 AudioSegment 对象
        sample_rate, audio_data = audio
        audio_segment = AudioSegment(
            audio_data.tobytes(),  # 音频数据
            frame_rate=sample_rate,  # 采样率
            sample_width=audio_data.dtype.itemsize,  # 样本宽度
            channels=1  # 单声道
        )

    # 保存为 MP3 文件
    output_file = "output2.mp3"
    audio_segment.export(output_file, format="mp3")

    return f"音频已保存为 {output_file}"

# 创建 Gradio 界面
with gr.Blocks() as demo:
    gr.Markdown("### 实时录制声音并保存为 MP3 示例")

    # 使用 gr.Audio 组件，默认支持从麦克风录制或上传音频文件
    audio_input = gr.Audio(label="录制音频或上传文件", type="numpy")

    # 输出组件，显示处理结果
    output_text = gr.Textbox(label="处理结果")

    # 按钮触发处理
    submit_button = gr.Button("保存为 MP3")

    # 绑定按钮点击事件到处理函数
    submit_button.click(save_audio_as_mp3, inputs=audio_input, outputs=output_text)

# 启动 Gradio 应用
demo.launch()

* Running on local URL:  http://127.0.0.1:7883

To create a public link, set `share=True` in `launch()`.


