Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

拼音到汉字的转换 #184

Open
codemayq opened this issue Sep 10, 2019 · 7 comments
Open

拼音到汉字的转换 #184

codemayq opened this issue Sep 10, 2019 · 7 comments

Comments

@codemayq
Copy link

运行环境

问题描述

是否能支持,输入拼音,给出所有可能的汉字、词组的功能

问题复现步骤

@mozillazg
Copy link
Owner

mozillazg commented Sep 10, 2019

目前不支持。后面有空的时候可能会支持这个功能。如果你有兴趣来实现这个功能的话,欢迎提交 PR 或者创建一个新的实现这个功能的模块/库/包。

@yaleimeng
Copy link

这就是另外一个很大很复杂的项目了。类似于一个输入法,要将短语或句子级的拼音串转为汉字,肯定要用到语言模型。

@R0uter
Copy link

R0uter commented Nov 22, 2020

我有个开源的整句引擎,是目前我自己输入法在用的,开源的刚好是Python版,必要的话可以拿来用啊

@yaleimeng
Copy link

@R0uter 感谢分享,很有用。

@someoneyoulike
Copy link

@R0uter 可以分享下吗? 谢谢

@yaleimeng
Copy link

@someoneyoulike 你点击它头像或用户名就可以看到他的代码库了啊。。
他所说的项目叫落格输入法。 玩一玩没问题,别抱太高期望就行。

@R0uter
Copy link

R0uter commented Jan 25, 2022

@someoneyoulike https://github.com/R0uter/LoginputEngine
代码和实现完全开源,你需要就拿去用,唯一的缺点大概就是不支持变长组合……不过开源的引擎部分好像没包含拼音拆分,这个你得自己去研究,我目前也就是简单的使用最长匹配,接下来打算用 transformer 之类的模型炼一波,还在研究中。最近把算法换到了 KenLM,直接用它生成的 arpa,准确度不变的情况下,训练速度更快。

@yaleimeng 你的评价我不认同,至少也是生产环境级别的算法和实现呢……😬

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

5 participants