New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
中文的deploy问题 #73
Comments
@john81529 是一条case都办法打印?如果是的话,建议你简单验证一下,python环境打印中文是否正常(UTF-8)编码 |
这个问题解决了,然后我尝试说些话,然后都只有一个识别结果:虎。 |
@john81529 你用的模型是? |
你们发布的aishell模型,lm模型,vocab_txt |
很奇怪,这个模型我们有试过demo,你能贴一下log看看吗,server端的 |
为了减少时间,我把cutoff_prob改成0.99了,可能这个原因吗 |
warm-up的预测结果为什么没有显示?可以同样打印出来看看吗,从时长上看你录制的音频有些异常 |
是这样的 |
这个结果完全不正常,这里需要验证一下:1. 是否是中文打印问题 2. 是否模型本身的问题 |
我是使用aishell的test文件,进行warm-up的。‘’另外贴log的时候,最好用引用,否则显示混乱‘’,我是在网页上直接用github的。 |
我将服务器处理后的结果写在一个txt文件中,然后显示:虎。应该不是中文打印问题。另外,我按照你们最新更改后的代码更改了,运行infer.py,出现这样的问题:
|
在修改后,infer目前的结果:
|
有点诡异,能否告知一下repo的commit id? |
是进行infer的语音文件的id吗? |
不是,是你使用的repo的最近一次commit的id,类似于
|
这我真的不记得了,下载代码估计有半个月了。不过,我今天按照pull request的两种更改前后,infer都是那样的问题。请问你们是什么id,要不我直接复现你们的测试成功的id吧。 |
@yyhlvdl 很好判断,你执行一下 |
yyh@yyh-System-Product-Name:~/DeepSpeech$ git log
commit 23e4483
commit f9ebff7
: |
add_arg('use_gru', bool, True, "Use GRUs instead of simple RNNs.") |
@yyhlvdl 我用最新的repo验证了一下模型效果,是没问题的,这是我的log
|
就是直接在浏览器上下载代码,而不是git获得代码吗? |
恩,这两种方式获取的代码一致 |
Target Transcription: 推行 统一 的 标准 操作 规程 和 技术 规范 Target Transcription: 大力 发展 农业 职业 培养 Target Transcription: 提高 防汛 抗旱 减灾 能力 Target Transcription: 使 其 市值 分秒 间 蒸发 近 四百亿 美元 Target Transcription: 完善 机耕 道 农田 防护 林 等 设施 Target Transcription: 众人 一 起 为 寿 寿星 女 庆生 Target Transcription: 失 孤 等 影片 的 上映 Target Transcription: 对于 谋求 转型 发展 怀揣 创新 型 国家 梦想 的 中国 来说 Target Transcription: 荞麦 窝窝 头 一零 月 二零 日 Target Transcription: 瞬间 将 苹果 估价 拉 低 了 至少 百分 之 六 |
不过,我好奇的是: |
打印问题 |
在我执行客户端后,发现识别我自己的声音特别费时间,等待了很久,请问你们实验的时候,每次语音识别时间是多久呢? |
硬件不同,也不好直接对比,这边k40m显卡,cutoff_prob=0.99,一条样本不到1s的响应时间吧 |
然后不动了。 |
@yyhlvdl 信息太少,看不出问题,建议先debug一下看 |
服务器显示:
客户端显示: 然而,存储的语音文件播放的话很正常 |
这看不出来呀,建议自己debug一下看,如果存储音频播放正常,可以手动构造一下manifest试试infer是否合理 |
不好意思,我忘记打开麦克风了,所以录制的是系统声音。 |
因为数据量小,所以对抗噪声能力可能不如人意,你测试时,尽量找个安静环境,然后说话声大些,发音清晰些 |
多谢多谢。 |
目前,我用的是2.8g的那个语言模型,采用80g的那个语言模型效果会不会好一点? |
@yyhlvdl 您好,我运行demo_server后也给出 |
不好意思,我实际上没有解决这个问题,我在代码中将其注释掉了 |
I solved the problem by encoding: |
@yyhlvdl 好的~感谢帮助~ |
@DimaMcar Change encoding in terminal means set LANG=zh_CN.UTF-8 ? |
@Pelhans What do you mean by modle package? I also faced your problem. Thanks! |
@xuzhaoqing 就是说 mean_std.npz and vocab.txt 这两个文件不用自己通过run_data.sh生成的,而是用他提供的模型压缩包里解压出来带的那俩。 |
…s_trian_se_resnext3 [multi process] Update se_resnext
终于,我在docker中启动了服务器和客户端,然后说了一段中文,出现这样的错误:
Exception happened during processing of request from ('127.0.0.1', 59312)
Traceback (most recent call last):
File "/usr/lib/python2.7/SocketServer.py", line 290, in _handle_request_noblock
self.process_request(request, client_address)
File "/usr/lib/python2.7/SocketServer.py", line 318, in process_request
self.finish_request(request, client_address)
File "/usr/lib/python2.7/SocketServer.py", line 331, in finish_request
self.RequestHandlerClass(request, client_address, self)
File "/usr/lib/python2.7/SocketServer.py", line 652, in init
self.handle()
File "deploy/demo_server.py", line 108, in handle
(finish_time - start_time, transcript))
UnicodeEncodeError: 'ascii' codec can't encode characters in position 39-48: ordinal not in range(128)
我个人觉得,可以把识别结果存储到一个文件中,没必要打印出来,当然,如果作者可以解决打印的问题,就更好了。
The text was updated successfully, but these errors were encountered: