汉字拼音表

根据网上资料整理的汉字拼音表，主要包括Unicode 0x4E00—0x9FA5中的汉字，其中一些韩国汉字、日本汉字不包含在内。

data目录是原始文本数据，其中hzpy-utf8.txt为汉字列表，每行6列，分别是： 1.汉字本身； 2.汉字的拼音； 3.声母； 4.韵母； 5.Unicode编码； 6.0表示不常用汉字，1表示常用汉字，2表示该汉字是姓氏；多音字每个读音单独一行。

simplified2traditional.txt是简繁转换表，第一列是简体Unicode编码，第二列是对应的繁体字Unicode编码。

db目录下的hanzi.db是sqlite3数据库，其中数据位于hanzi这个表中。这个数据库是用script中的store-hanzi.py创建的，该表共5列，结构如下： 1.unicode, int类型，主键，内容为汉字的Unicode编码； 2.pinyin, text类型，汉字的拼音，多音字的多个读音用","(英文逗号)隔开； 3.type, int类型，1为简体字，2为繁体字，其他汉字为0; 4.map, int类型，简体字对应的繁体字，或繁体字对应的简体字，或0; 5.freq, int类型，和hzpy-utf8.txt中的最后一列含义相同，多音字取最大值。

script包含一些没什么用的脚本。

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
data		data
db		db
script		script
LICENSE.md		LICENSE.md
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

汉字拼音表

About

Releases

Packages

Languages

License

ervinzhao/hanzipinyin

Folders and files

Latest commit

History

Repository files navigation

汉字拼音表

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages