Python Makefile
Permalink
Failed to load latest commit information.
.circleci 修复 CI 没有在 Python 3.7 下运行检查操作 Aug 5, 2018
.github Update ISSUE_TEMPLATE Nov 27, 2017
docs v0.33.0 Aug 5, 2018
phrase-pinyin-data @ c5a9488 更新拼音数据 Fixed #137 Aug 4, 2018
pinyin-data @ 0b3d00b 更新拼音数据 Fixed #137 Aug 4, 2018
pypinyin Bump version: 0.32.0 → 0.33.0 Aug 5, 2018
tests 使用 `phrase-pinyin-data`_ v0.7.3 的词语拼音数据 Jun 10, 2018
.bumpversion.cfg Bump version: 0.32.0 → 0.33.0 Aug 5, 2018
.coveragerc more tests Jun 22, 2015
.editorconfig Added ISSUE_TEMPLATE and PULL_REQUEST_TEMPLATE Oct 28, 2017
.gitignore Use pytest-random-order instead of pytest-random Apr 15, 2018
.gitmodules 改为使用来自 phrase-pinyin-data 的词语拼音数据 Mar 12, 2017
.pre-commit-config.yaml use pre-commit-hooks v0.7.1 Mar 13, 2017
.travis.yml 增加类型注解 Dec 3, 2017
CHANGELOG.rst v0.33.0 Aug 5, 2018
CODE_OF_CONDUCT.md adding a Code of Conduct Jun 15, 2017
LICENSE.txt 🌟 Happy New Year 🌟 Jan 2, 2016
MANIFEST.in Add py.typed marker Jun 10, 2018
Makefile 改为使用 twine 上传文件到 PyPI Apr 22, 2018
README.rst v0.33.0 Aug 5, 2018
README_ru.rst test on python 3.6 Feb 12, 2017
gen_phrases_dict.py 改为使用来自 phrase-pinyin-data 的词语拼音数据 Mar 12, 2017
gen_pinyin_dict.py 增加几处注释 Mar 12, 2017
pytest.ini 更新文档和测试 Apr 22, 2018
requirements_dev.txt 改为使用 twine 上传文件到 PyPI Apr 22, 2018
setup.cfg wheel -> bdist_wheel Apr 10, 2017
setup.py 配置使用 CircleCI,不再测试 Python 2.6 和 Python 3.3,增加测试 PyPy3 Aug 5, 2018
tox.ini 配置使用 CircleCI,不再测试 Python 2.6 和 Python 3.3,增加测试 PyPy3 Aug 5, 2018

README.rst

汉字拼音转换工具(Python 版)

Build Coverage PyPI version

将汉字转为拼音。可以用于汉字注音、排序、检索(Russian translation) 。

基于 hotoo/pinyin 开发。

特性

  • 根据词组智能匹配最正确的拼音。
  • 支持多音字。
  • 简单的繁体支持, 注音支持。
  • 支持多种不同拼音/注音风格。

安装

$ pip install pypinyin

使用示例

Python 3(Python 2 下把 '中心' 替换为 u'中心' 即可):

>>> from pypinyin import pinyin, lazy_pinyin, Style
>>> pinyin('中心')
[['zhōng'], ['xīn']]
>>> pinyin('中心', heteronym=True)  # 启用多音字模式
[['zhōng', 'zhòng'], ['xīn']]
>>> pinyin('中心', style=Style.FIRST_LETTER)  # 设置拼音风格
[['z'], ['x']]
>>> pinyin('中心', style=Style.TONE2, heteronym=True)
[['zho1ng', 'zho4ng'], ['xi1n']]
>>> pinyin('中心', style=Style.BOPOMOFO)  # 注音风格
[['ㄓㄨㄥ'], ['ㄒㄧㄣ']]
>>> pinyin('中心', style=Style.CYRILLIC)  # 俄语字母风格
[['чжун1'], ['синь1']]
>>> lazy_pinyin('中心')  # 不考虑多音字的情况
['zhong', 'xin']

命令行工具:

$ pypinyin 音乐
yīn yuè
$ pypinyin -h

文档

详细文档请访问:http://pypinyin.rtfd.io/

FAQ

词语中的多音字拼音有误?

目前是通过词组拼音库的方式来解决多音字问题的。如果出现拼音有误的情况, 可以自定义词组拼音来调整词语中的拼音:

>>> from pypinyin import Style, pinyin, load_phrases_dict
>>> pinyin('步履蹒跚')
[[''], [''], ['mán'], ['shān']]
>>> load_phrases_dict({'步履蹒跚': [[''], [''], ['pán'], ['shān']]})
>>> pinyin('步履蹒跚')
[[''], [''], ['pán'], ['shān']]

详见 文档

为什么没有 y, w, yu 几个声母?

>>> from pypinyin import Style, pinyin
>>> pinyin('下雨天', style=Style.INITIALS)
[['x'], [''], ['t']]

因为根据 《汉语拼音方案》 , y,w,ü (yu) 都不是声母。

声母风格(INITIALS)下,“雨”、“我”、“圆”等汉字返回空字符串,因为根据 《汉语拼音方案》 , y,w,ü (yu) 都不是声母,在某些特定韵母无声母时,才加上 y 或 w,而 ü 也有其特定规则。 —— @hotoo

如果你觉得这个给你带来了麻烦,那么也请小心一些无声母的汉字(如“啊”、“饿”、“按”、“昂”等)。 这时候你也许需要的是首字母风格(FIRST_LETTER)。 —— @hotoo

参考: hotoo/pinyin#57, #22, #27, #44

如果觉得这个行为不是你想要的,就是想把 y 当成声母的话,可以指定 strict=False , 这个可能会符合你的预期:

>>> from pypinyin import Style, pinyin
>>> pinyin('下雨天', style=Style.INITIALS)
[['x'], [''], ['t']]
>>> pinyin('下雨天', style=Style.INITIALS, strict=False)
[['x'], ['y'], ['t']]

详见 strict 参数的影响

如何减少内存占用

如果对拼音的准确性不是特别在意的话,可以通过设置环境变量 PYPINYIN_NO_PHRASESPYPINYIN_NO_DICT_COPY 来节省内存。 详见 文档

更多 FAQ 详见文档中的 FAQ 部分。

拼音数据

Related Projects