Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

计划扩充 Web 版拼音库 #34

Closed
hotoo opened this issue Feb 10, 2015 · 19 comments
Closed

计划扩充 Web 版拼音库 #34

hotoo opened this issue Feb 10, 2015 · 19 comments
Milestone

Comments

@hotoo
Copy link
Owner

hotoo commented Feb 10, 2015

Web 版目前是根据国家教育部发布的 《现代汉语常用字表》 收录的 2500个常用字,和 1000个次常用字表来做的字典,这导致很多不在常用和次常用字表中,但仍然挺常用的字无法进行转换。

例如 , #29 中提到的 , ,以及 #26

考虑到实用性,计划扩充 Web 版的拼音库:

  • 增加常用地名用字。
  • 增加常用姓氏用字。

如果有需要,可以回复本 issue,或者提交新的 issue 来讨论其他的非常用字是否默认添加到拼音库中。

另外你也可以自行处理这些非常用字。

参考

@hotoo hotoo changed the title Web 版目前是根据国家教育部发布的《现代汉语常用字表》 计划扩充 Web 版拼音库 Feb 10, 2015
@lygstate
Copy link

lygstate commented Nov 6, 2015

可以让 Web版跟Node版功能一致么?共用一个数据库

@hotoo
Copy link
Owner Author

hotoo commented Nov 6, 2015

是有这个考虑,但是怕词典太大。这种场景还是推荐在服务端使用。

@lygstate
Copy link

lygstate commented Nov 7, 2015

@hotoo 我们是把这个用在扩展或者桌面环境下,比如 electron. 所以可以把这个改成配置项,而不是依赖于具体的环境,比如用户想要小字典那么可以下载小字典版本,大字典就下载大字典版本

@hotoo
Copy link
Owner Author

hotoo commented Nov 10, 2015

服务端还有个可选的分词功能,能提高多音字准确率。分词模块是使用第三方模块,不适合浏览器端用。

不过统一词库的事情会考虑的。

@liqichao
Copy link

蔡 佟 俞

@hotoo hotoo modified the milestone: 3.0.0 Nov 19, 2015
@muyuballs
Copy link

濮(pu)阳
睢(sui)宁
邳(pi)州
菏(he)泽
淄(zi)博
阜(fu)阳
莆(pu)田
漳(zhang)州
襄(xiang)阳
赣(gan)州
泸(lu)州

@liyatang
Copy link

圳太明显了。可以加下么?

@bayun2
Copy link

bayun2 commented Sep 14, 2016

阮(ruan)

@yangjinguang
Copy link

在web端使用需要引入哪些文件?

@soyaine
Copy link

soyaine commented Mar 19, 2017

web版:昕 楠 (常用的姓名)

@TimYi
Copy link

TimYi commented Mar 24, 2017

尴尬,这个也没有

@zlh562011966
Copy link

能否pinyin/data/dict-zi-web.js文件里加三个字:珂、柯、喽(常用字)
谢谢

@larryspace
Copy link

嘻嘻哈哈 嘻嘻这个没有

@cy-mjy
Copy link

cy-mjy commented Aug 28, 2017

倪(ni) 昝(zan)这两个也没有

@136446529
Copy link

能显示的汉字 Unicode 编码
字符集 | 字数 | Unicode 编码
基本汉字 | 20902字 | 4E00-9FA5
基本汉字补充 | 38字 | 9FA6-9FCB
...
生成首字母出来了汉字真的很尴尬的。。。
可以参考GB2312以及ASCII编码/Unicode编码, 推荐使用wiki查询

@elvisqi
Copy link
Contributor

elvisqi commented Jun 23, 2018

常用字: 建邺 的 “邺” 没有被翻译

@rottenpen
Copy link

web版 嘻嘻哈哈的嘻也没翻译出来

@cuilaixi
Copy link

pinyin('亭轩',style=Style.FINALS)
[['ing'], ['uan']]
应该是[['ing'], ['van']]
兄弟这个什么时候能更正啊?或者教我可以改动什么回避这个问题?

@hotoo
Copy link
Owner Author

hotoo commented Mar 22, 2022

请使用 3.x npm i pinyin@alpha,支持完整的字库。

@hotoo hotoo closed this as completed Mar 22, 2022
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests