基于小米 MiMo-V2.5-TTS API 的语音合成桌面工具,提供直观的 Web UI 界面。
- 预置音色 - 使用小米提供的精品音色进行语音合成
- 音色设计 - 通过文字描述自定义音色特征
- 音色复刻 - 上传音频样本复刻音色
- 风格控制 - 支持自然语言描述、音频标签、导演模式三种风格控制方式
- 预设管理 - 保存和管理自定义音色预设
- API Key 管理 - 安全存储 API Key 到本地
| 类别 | 音色 | 描述 |
|---|---|---|
| 中文女声 | 冰糖 | 清澈甜美的年轻女声 |
| 中文女声 | 茉莉 | 温柔知性的成熟女声 |
| 中文男声 | 苏打 | 阳光活力的年轻男声 |
| 中文男声 | 白桦 | 沉稳磁性的成熟男声 |
| 英文女声 | Mia | Bright, youthful female voice |
| 英文女声 | Chloe | Warm, sophisticated female voice |
| 英文男声 | Milo | Energetic, friendly male voice |
| 英文男声 | Dean | Deep, authoritative male voice |
前往 小米 MiMo 开放平台 注册并获取 API Key。
# 克隆仓库
git clone https://github.com/jarodise/MimoTTS.git
cd MimoTTS
# 创建虚拟环境
python -m venv venv
source venv/bin/activate # Windows: venv\Scripts\activate
# 安装依赖
pip install -r requirements.txt有两种方式配置 API Key:
方式一:环境变量
export MIMO_API_KEY="your_api_key_here"
# 或创建 .env 文件
echo "MIMO_API_KEY=your_api_key_here" > .env方式二:界面输入 启动应用后在界面中输入 API Key 并点击"保存 Key"。
python app.py访问 http://127.0.0.1:7860 开始使用。
如果创建了符号链接,可以直接使用 mimo 命令启动:
sudo ln -sf "$(pwd)/mimo" /usr/local/bin/mimo
mimo用自然语言描述想要的语音风格:
- "用温柔舒缓的语调,像在讲睡前故事"
- "用激昂有力的声音,像体育解说员一样充满激情"
选择预设标签组合:
- 基础情绪:开心、悲伤、愤怒、恐惧等
- 整体语调:温柔、高冷、活泼、严肃等
- 音色定位:磁性、醇厚、清亮、空灵等
- 方言:东北话、四川话、河南话、粤语
精细控制语音表现:
- 角色:人物身份、性格、外形气质、说话习惯
- 场景:发生了什么、和谁说话、情绪状态
- 指导:语速、气息、停顿、重音、音色质感、情绪起伏
MimoTTS/
├── app.py # 主应用入口
├── api_client.py # MiMo API 客户端
├── config.py # 配置常量
├── mimo # 启动脚本
├── requirements.txt # 依赖列表
├── ui/
│ ├── components.py # 共享 UI 组件
│ ├── styles.py # 自定义样式
│ ├── preset_voice_tab.py # 预置音色标签页
│ ├── voice_design_tab.py # 音色设计标签页
│ ├── voice_clone_tab.py # 音色复刻标签页
│ └── preset_manager_tab.py # 预设管理标签页
└── utils/
├── config_manager.py # 配置管理
├── preset_manager.py # 预设管理
└── validators.py # 输入验证
- API Key:
~/.mimo_tts/config.json - 音色预设:
~/.mimo_tts/presets/
MIT
