Support zh-CN
, ja-JP
ja.cut "あー、合成は結合法則を満たすんでしたね"
#=> ["あー", "、", "合成", "は", "結合法則", "を", "満たす", "ん", "でした", "ね"]
zh.tag "全世界的无产者,联合起来!", s: true
#=> "全世界_n 的_uj 无产者_n ,_x 联合_v 起来_v !_x"
gem install igo
for use Thulac
in Python, you need to install:
pip install thulac
require 'igo'
require 'igo/ja'
j = Igo::Ja
j.cut "あー、合成は結合法則を満たすんでしたね"
#=> ["あー", "、", "合成", "は", "結合法則", "を", "満たす", "ん", "でした", "ね"]
j.kana ["無色で透明な私たちは互いに融合しながらも、", "他方で消えない血液と己の半身を希求する。"], s: "/", lr: "()"
#=> ["無色(むしょく)/で/透明な(とうめいな)/私たち(わたしたち)/は/互いに(たがいに)/融合し(ゆうごうし)/ながら/も/、", "他方(たほう)/で/消えない(きえない)/血液(けつえき)/と/己(おのれ)/の/半身(はんしん)/を/希求する(ききゅうする)/。"]
j.tag "ゆかりさんが勉強してる圏論に興味を持ったそして", s: "/", kana: 1, short: 4, lr: "[]"
# "ゆかり_prop/さん_suff/が_part/勉強してる[べんきょうしてる]_verb/圏論[けんろん]_noun/に_part/興味[きょうみ]_noun/を_part/持った[もった]_verb/そして_conj"
reference:
- UCEjVFAKrcjUWqBnHl_NlacQ - 【圏論】圏の圏を考えたい!そうだ関手を定義しよう!
- ukiyojingu 「無色で透明な私たちは互いに融合しながらも、他方で消えない血液と己の半身を希求する。」
下ノ関数は、暫く未完成です、ごめんね:
j.dict
Lack Trad-Zh :: 暂不支持「正體中文」
require 'igo'
require 'igo/zh'
z = Igo::Zh
z.pinyin "全世界的无产者,联合起来!"
#=> ["quan2", "shi4", "jie4", "de5", "wu2", "chan3", "zhe3", "lian2", "he2", "qi3", "lai2"]
z.pinyin "全世界的无产者,联合起来!", s: " "
#=> "quan2 shi4 jie4 de5 wu2 chan3 zhe3 lian2 he2 qi3 lai2"
z.cut "全世界的无产者,联合起来!"
#=> ["全世界", "的", "無產階級", ",", "聯合", "起來", "!"]
z.cut "全世界的无产者,联合起来!", s: "/"
#=> "全世界/的/无产者/!/联合/起来/!"
后续可能添加 by
关键词指定函数。
z.tag "全世界的无产者,联合起来!"
#=> [["全世界", "n"], ["的", "uj"], ["无产者", "n"], ["!", "x"], ["联合", "v"], ["起来", "v"], ["!", "x"]]
z.tag "全世界的无产者,联合起来!", s: true
#=> "全世界_n 的_uj 无产者_n ,_x 联合_v 起来_v !_x"
z.freq "全世界的无产者,联合起来!", 5
#=> [["无产者", 9.96885201925], ["全世界", 6.80147590842], ["联合", 5.64979650728], ["起来", 3.96134044655]]
所有方法都有别名:拼音
, 分词
, 标记
, 词频
MPL 2.0
jieba-rb
nokogiri
open-uri