jiebac

使用cython对cppjieba进行了封装

相对python版本约有5~10倍速度提升，内存占用稳定

使用方法示例

# encoding=utf-8

from jiebac import jiebac as jieba

text = u'分词对于研究和应用中文自然语言处理的童鞋来说，都是一个非常非常基础的部件，\
分词的质量直接影响到后续词性标注、命名实体识别、句法分析等部件的准确性。'
print jieba.ucut(text,True)

性能测试如下

对于python实现（https://github.com/fxsjy/jieba）

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.idea		.idea
build/temp.macosx-10.6-x86_64-2.7		build/temp.macosx-10.6-x86_64-2.7
cmake-build-debug		cmake-build-debug
cppjieba		cppjieba
dict		dict
jiebac		jiebac
.gitignore		.gitignore
CMakeLists.txt		CMakeLists.txt
Jieba.pxd		Jieba.pxd
README.md		README.md
demo.cpp		demo.cpp
jieba_cpy.cpp		jieba_cpy.cpp
jieba_cpy.pyx		jieba_cpy.pyx
jieba_cpy.so		jieba_cpy.so
main.cpp		main.cpp
perf.png		perf.png
setup.py		setup.py
test.py		test.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

jiebac

使用方法示例

性能测试如下

About

Releases

Packages

Languages

qiangsiwei/jiebac

Folders and files

Latest commit

History

Repository files navigation

jiebac

使用方法示例

性能测试如下

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages