Skip to content

Latest commit

 

History

History
17 lines (13 loc) · 905 Bytes

README.md

File metadata and controls

17 lines (13 loc) · 905 Bytes

AI

1.使用openAI的whisper实现语音转文字
2.使用chatgpt api使用同人工智能的文字沟通
3.使用MacOSTTS实现文字转语音读出,暂时没有找到更合适的语音合成工具
4.使用yolov5来实现了查看摄像头看到的物体功能,并看到物体添加到聊天上下文

todo:
0.whisper的语音识别成功率还有待检验
1.后面考虑使用chatgpt-4
2.暂时没有找到更合适的语音合成工具,MacOSTTS只能在mac系统使用
3.图像识别还有待优化 5.最后的实现方式肯定是聊天和物体识别都用chat-GPT4,后续再说

使用方法,python HanGPT.py 运行程序后,电脑会打开麦克风监听用户语音,然后将语音转文字同chatGPT交流,当用户说出“这是什么?”的时候,会自动打开摄像头抓拍五张图片分析看到的物体,然后保存物体名称到gpt会话中。