Skip to content

ben-hua/general_standard_chinese

Repository files navigation

通用规范汉字表

  • gsc_pinyin.csv 补全了拼音,部首,笔画,繁体,五行,五笔等信息。 详情来源: 百度汉语, Unihan
  • gsc_pinyin_with_tone.csvgsc_pinyin.csv 多了声母,韵母,声调。多音字选取第一个拼音。详情来源:pinyin4j

Information

一、2013年教育部、国家语言文字工作委员会组织制定《通用规范汉字表》。

二、共收字8105个,分为三级:

百度汉语抓取程序

使用scrapy 抓取。

```bash
pip install scrapy

scrapy runspider ./script/baidu_hanzi_spider.py -o gsc_pinyin.csv
```

Reference

  1. 通用规范汉字表wiki https://zh.wikisource.org/wiki/通用规范汉字表
  2. baidu汉语 https://dict.baidu.com/
  3. 汉语拼音方案(教育部官网文件) http://www.moe.gov.cn/ewebeditor/uploadfile/2015/03/02/20150302165814246.pdf
  4. 中华字典 https://www.zhonghuazidian.com/zi/%F0%AB%98%9D
  5. unicode汉语 https://util.unicode.org/UnicodeJsps/character.jsp?a=2B61D

About

通用规范汉字表+拼音+笔画+部首+五行

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages