TalkGPT是一个基于一系列开放API服务的语音对话AI助手,计划提供一系列定制化功能。
TalkGPT的基本结构
- 你需要拥有一个OpenAI账户,在用户页面中创建一个api_key,用于语音转文字API访问和聊天完成API访问。
- 你需要拥有一个AWS账户,在凭证管理页面上创建一个IAM帐户,并创建一组IAM帐户的凭据,用于文本转语音API访问。
git clone https://github.com/Smilence7/TalkGPT.git
cd ./TalkGPT
- 项目依赖python环境,建议使用python-3.8版本
- 安装第三方库
pip3 install -r requirements.txt
cp ./config/config.yml.example ./config/config.yml
vim ./config/config.yml
将你申请的秘钥填写在对应位置,根据需要修改其他配置
python ./src/main.py
- 按住键盘上的“T”键说话。
- 释放键后,根据网络状况,约在1~5秒后,你将听到来自输出设备的响应
kill it.
你可以像在ChatGPT网站上一样与GPT-3.5进行交谈,但以语音输入和输出的形式。
没有输入/输出限制。
说几句话,程序将用更好或更自然的版本进行回应,主要用于语言学习。
- 语音到语音的工作流
- 实现热键绑定和可视化配置的GUI
- 打包
- 本地微调的文本转语音(TTS)模型 (参考AI xQc
- 在GUI中显示文字聊天记录
- 功能:重放最后一句回答