Skip to content
Junjie Wang edited this page Jan 11, 2018 · 10 revisions

1. 准备

硬件肯定是基于树莓派了。树莓派是台全功能卡片尺寸电脑,可以运行多种操作系统,支持键盘、鼠标、显示器等。选择树莓派的好处就是即使觉得这个音箱没啥用,还有好多其他有意思的玩法。小朋友可以玩,装个Scratch。喜欢小米产品的大朋友可以玩,装个Home Assistant,恩,成了智能家居控制中心;话说,智能音箱的理想不就是智能家居控制中心么?

既然是智能音箱,音频输入音频输出必不可少。我的选择是:麦克先用单麦,后面再尝试多麦,树莓派的多麦解决方案现在也是多如牛毛了啊!外放用USB微型音箱,不需要外接电源的那种。这样,整个音箱就可以用一根Mini USB线给点亮啦!

另外的一个大问题是造型!咱需要一个专业的外壳,但没必要外壳用金属,再类似小米发布会普及的、用6000目砂纸细细打磨,说实在的,磨的再亮也没用。那咋搞?3D打印机,咱打印个外壳。

网上可以下载到各种各样的外壳文件去打印,这里不一一赘述了。第一个版本我选的是IBM的TJBot,看起来也是蛮酷的,有个胳膊还能动。

软件选择是:

  • 软件开发语言是Python。
  • 语音识别、语音合成基于百度的服务,需要注册一个开发者账号。
  • 众所周知,和语音相比,语义理解难度较小、进入门槛较低,所以本宝希望这部分尽可能由开源代码完成。我申请了新浪云服务、并慷慨投入50元巨资购买了若干云豆,大家后续可以体验。

其他似乎也没有什么了!

2. 安装

来宝是基于Jasper的,所以参考Jasper的文档即可;点击访问Jasper的完整安装、配置和使用指南

3. 启动

来宝使用时,先说出唤醒词“OKEY TOMMY”、听到“嘀”的一声后说出语音指令;来宝检测到语音结束会播放“嘟”提示音;稍等片刻后,来宝即会回复。

写完如何启动来宝的介绍性文字后,我才意识到:实际上来宝是很难配置的。

  • 第一步的配置障碍就是麦克风和音箱,这步我建议禁掉内置的声卡输出,麦克风和音箱均使用上文推荐的USB外接设备。
  • 第二步是各种软件的安装,这个也是相当的繁琐。
  • 第三步需要申请百度语音的开发者账号,并填写配置文件。好吧,为方便大家使用,我尽快把我的Key分享出来,先借你用一下。
  • 第四步就是运行了。说真的,现在这个版本运行体验不大好,不说“OKEY TOMMY”的成功率、光识别的网络延迟我觉得就有点抓狂;等我共享视频后大家体验一下。