Skip to content

jarodise/MimoTTS

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

MiMo TTS 语音合成工作台

基于小米 MiMo-V2.5-TTS API 的语音合成桌面工具,提供直观的 Web UI 界面。

MiMo TTS Screenshot

功能特性

  • 预置音色 - 使用小米提供的精品音色进行语音合成
  • 音色设计 - 通过文字描述自定义音色特征
  • 音色复刻 - 上传音频样本复刻音色
  • 风格控制 - 支持自然语言描述、音频标签、导演模式三种风格控制方式
  • 预设管理 - 保存和管理自定义音色预设
  • API Key 管理 - 安全存储 API Key 到本地

预置音色

类别 音色 描述
中文女声 冰糖 清澈甜美的年轻女声
中文女声 茉莉 温柔知性的成熟女声
中文男声 苏打 阳光活力的年轻男声
中文男声 白桦 沉稳磁性的成熟男声
英文女声 Mia Bright, youthful female voice
英文女声 Chloe Warm, sophisticated female voice
英文男声 Milo Energetic, friendly male voice
英文男声 Dean Deep, authoritative male voice

快速开始

1. 获取 API Key

前往 小米 MiMo 开放平台 注册并获取 API Key。

2. 安装依赖

# 克隆仓库
git clone https://github.com/jarodise/MimoTTS.git
cd MimoTTS

# 创建虚拟环境
python -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate

# 安装依赖
pip install -r requirements.txt

3. 配置 API Key

有两种方式配置 API Key:

方式一:环境变量

export MIMO_API_KEY="your_api_key_here"
# 或创建 .env 文件
echo "MIMO_API_KEY=your_api_key_here" > .env

方式二:界面输入 启动应用后在界面中输入 API Key 并点击"保存 Key"。

4. 启动应用

python app.py

访问 http://127.0.0.1:7860 开始使用。

快捷启动(可选)

如果创建了符号链接,可以直接使用 mimo 命令启动:

sudo ln -sf "$(pwd)/mimo" /usr/local/bin/mimo
mimo

风格控制

自然语言描述

用自然语言描述想要的语音风格:

  • "用温柔舒缓的语调,像在讲睡前故事"
  • "用激昂有力的声音,像体育解说员一样充满激情"

音频标签

选择预设标签组合:

  • 基础情绪:开心、悲伤、愤怒、恐惧等
  • 整体语调:温柔、高冷、活泼、严肃等
  • 音色定位:磁性、醇厚、清亮、空灵等
  • 方言:东北话、四川话、河南话、粤语

导演模式

精细控制语音表现:

  • 角色:人物身份、性格、外形气质、说话习惯
  • 场景:发生了什么、和谁说话、情绪状态
  • 指导:语速、气息、停顿、重音、音色质感、情绪起伏

项目结构

MimoTTS/
├── app.py              # 主应用入口
├── api_client.py       # MiMo API 客户端
├── config.py           # 配置常量
├── mimo                # 启动脚本
├── requirements.txt    # 依赖列表
├── ui/
│   ├── components.py       # 共享 UI 组件
│   ├── styles.py           # 自定义样式
│   ├── preset_voice_tab.py # 预置音色标签页
│   ├── voice_design_tab.py # 音色设计标签页
│   ├── voice_clone_tab.py  # 音色复刻标签页
│   └── preset_manager_tab.py # 预设管理标签页
└── utils/
    ├── config_manager.py   # 配置管理
    ├── preset_manager.py   # 预设管理
    └── validators.py       # 输入验证

本地存储

  • API Key:~/.mimo_tts/config.json
  • 音色预设:~/.mimo_tts/presets/

API 文档

License

MIT

About

基于小米 MiMo-V2.5-TTS API 的语音合成桌面工具

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors