In [1]:
from pyhanlp import *
content = "现如今，机器学习和深度学习带动人工智能飞速的发展，并在图片处理、语音识别领域取得巨大成功。"
print(HanLP.segment(content))

[现如今/t, ，/w, 机器学习/gi, 和/cc, 深度/n, 学习/v, 带动/v, 人工智能/n, 飞速/d, 的/ude1, 发展/vn, ，/w, 并/cc, 在/p, 图片/n, 处理/vn, 、/w, 语音/n, 识别/vn, 领域/n, 取得/v, 巨大/a, 成功/a, 。/w]


In [2]:
txt = "铁甲网是中国最大的工程机械交易平台。"
print(HanLP.segment(txt))

[铁甲/n, 网/n, 是/vshi, 中国/ns, 最大/gm, 的/ude1, 工程机械/nz, 交易平台/nz, 。/w]


In [6]:
for term in HanLP.segment(txt):
    print('{}\t{}'.format(term.word, term.nature))

铁甲	n
网	n
是	vshi
中国	ns
最大	gm
的	ude1
工程机械	nz
交易平台	nz
。	w


In [12]:
# 關鍵字提取
content = "现如今，机器学习和深度学习带动人工智能飞速的发展，并在图片处理、语音识别领域取得巨大成功。"
print(HanLP.extractKeyword(content,3))

[带动, 识别, 语音]


In [19]:
# 自動摘要
content = "现如今，机器学习和深度学习带动人工智能飞速的发展，并在图片处理、语音识别领域取得巨大成功。"
print(HanLP.extractSummary(content,3))

[并在图片处理、语音识别领域取得巨大成功]


In [20]:
# 依存句法分析
content = "现如今，机器学习和深度学习带动人工智能飞速的发展，并在图片处理、语音识别领域取得巨大成功。"
print(HanLP.parseDependency(content))

1	现如今	现如今	nt	t	_	4	状中结构	_	_
2	，	，	wp	w	_	1	标点符号	_	_
3	机器	机器	n	n	_	4	定中关系	_	_
4	学习	学习	v	v	_	0	核心关系	_	_
5	和	和	c	c	_	7	左附加关系	_	_
6	深度	深度	n	n	_	7	状中结构	_	_
7	学习	学习	v	v	_	4	并列关系	_	_
8	带动	带动	v	v	_	4	并列关系	_	_
9	人工智能	人工智能	n	n	_	12	定中关系	_	_
10	飞速	飞速	d	d	_	12	定中关系	_	_
11	的	的	u	u	_	10	右附加关系	_	_
12	发展	发展	v	vn	_	8	动宾关系	_	_
13	，	，	wp	w	_	4	标点符号	_	_
14	并	并	c	c	_	22	状中结构	_	_
15	在	在	p	p	_	22	状中结构	_	_
16	图片	图片	n	n	_	17	前置宾语	_	_
17	处理	处理	v	vn	_	21	定中关系	_	_
18	、	、	wp	w	_	20	标点符号	_	_
19	语音	语音	n	n	_	20	前置宾语	_	_
20	识别	识别	v	vn	_	17	并列关系	_	_
21	领域	领域	n	n	_	15	介宾关系	_	_
22	取得	取得	v	v	_	4	并列关系	_	_
23	巨大	巨大	a	a	_	24	定中关系	_	_
24	成功	成功	a	an	_	22	动宾关系	_	_
25	。	。	wp	w	_	4	标点符号	_	_



In [4]:
def load_dictionary():
    IOUtil = JClass('com.hankcs.hanlp.corpus.io.IOUtil')
    path = HanLP.Config.CoreDictionaryPath.replace('.txt','.mini.txt')
    dic = IOUtil.loadDictiornary([path])
    return set(dic.keySet())
print(load_dictionary())

AttributeError: type object 'com.hankcs.hanlp.corpus.io.IOUtil' has no attribute 'loadDictiornary'

In [5]:
content = """ㄟ 法律是道德的最低標準 你懂不懂?
你說你沒有違反法律 那就是說你只是達到了道德的最低標準而已
你反質詢合乎法律沒錯啊 但是觀感很差你知道嗎?
其實從這邊就知道你平時做事的態度了
只要不違反法律 就只是達到了道德觀感的最低標準...
道德規範體現著每個人的文明程度和素養
如果只是狹隘的認為 只要不違法 觀感標準隨便應對
那真是可憐吶"""

In [3]:
# 自動摘要
print(HanLP.extractSummary(content,3))

[只要不違反法律 就只是達到了道德觀感的最低標準..., 你反質詢合乎法律沒錯啊 但是觀感很差你知道嗎, 你說你沒有違反法律 那就是說你只是達到了道德的最低標準而已]


In [7]:
# 關鍵字提取
print(HanLP.extractKeyword(content,3))

[準, 觀, 違]


In [6]:
print(HanLP.segment(content))

[ㄟ /w, 法律/n, 是/vshi, 道德/n, 的/ude1, 最低/a, 標/w, 準/nz,  /w, 你/rr, 懂不懂/v, ?/w, 
/w, 你/rr, 說/v, 你/rr, 沒有/v, 違/n, 反/vi, 法律/n,  /w, 那/rzv, 就是/v, 說/v, 你/rr, 只是/d, 達/v, 到/v, 了/ule, 道德/n, 的/ude1, 最低/a, 標/w, 準/nz, 而已/y, 
/w, 你/rr, 反/vi, 質詢/n, 合乎/v, 法律/n, 沒/nz, 錯/n, 啊/y,  /w, 但是/c, 觀/n, 感/vg, 很差/d, 你/rr, 知道/v, 嗎/w, ?/w, 
/w, 其/rz, 實/w, 從/p, 這邊/n, 就/d, 知道/v, 你/rr, 平/v, 時/ng, 做事/vi, 的/ude1, 態度/n, 了/ule, 
/w, 只/d, 要不/c, 違/n, 反/vi, 法律/n,  /w, 就/d, 只是/d, 達/v, 到/v, 了/ule, 道德/n, 觀/n, 感/vg, 的/ude1, 最低/a, 標/w, 準/nz, .../w, 
/w, 道德/n, 規範體/n, 現/w, 著/nz, 每/rz, 個人/n, 的/ude1, 文明/n, 程度/n, 和/cc, 素/ag, 養/n, 
/w, 如果/c, 只是/d, 狹/w, 隘/ng, 的/ude1, 認/n, 為/nz,  /w, 只/d, 要不/c, 違/n, 法/n,  /w, 觀/n, 感/vg, 標/w, 準/nz, 隨/nz, 便/d, 應/w, 對/p, 
/w, 那/rzv, 真是/d, 可/v, 憐/w, 吶/n]


In [8]:
# 依存句法分析
print(HanLP.parseDependency(content))

1	ㄟ 法律	ㄟ 法律	n	n	_	2	主谓关系	_	_
2	是	是	v	v	_	0	核心关系	_	_
3	道德	道德	n	n	_	6	定中关系	_	_
4	的	的	u	u	_	3	右附加关系	_	_
5	最低	最低	a	a	_	6	定中关系	_	_
6	標準 你懂	標準 你懂	n	n	_	8	主谓关系	_	_
7	不	不	d	d	_	8	状中结构	_	_
8	懂?
你說	懂?
你說	v	v	_	2	动宾关系	_	_
9	你	你	r	r	_	12	定中关系	_	_
10	沒有	沒有	d	d	_	12	定中关系	_	_
11	違反	違反	v	v	_	12	定中关系	_	_
12	法律 那就是說	法律 那就是說	n	n	_	8	动宾关系	_	_
13	你	你	r	r	_	15	主谓关系	_	_
14	只是	只是	d	d	_	15	状中结构	_	_
15	達到	達到	v	v	_	8	并列关系	_	_
16	了	了	u	u	_	15	右附加关系	_	_
17	道德	道德	n	n	_	20	定中关系	_	_
18	的	的	u	u	_	17	右附加关系	_	_
19	最低	最低	a	a	_	20	定中关系	_	_
20	標準	標準	n	n	_	22	主谓关系	_	_
21	而已
你反質詢	而已
你反質詢	a	ad	_	22	状中结构	_	_
22	合乎	合乎	v	v	_	15	并列关系	_	_
23	法律	法律	n	n	_	22	动宾关系	_	_
24	沒錯啊 但是	沒錯啊 但是	d	d	_	28	状中结构	_	_
25	觀感	觀感	Vg	Vg	_	28	状中结构	_	_
26	很差	很差	p	p	_	28	状中结构	_	_
27	你	你	r	r	_	28	主谓关系	_	_
28	知道	知道	v	v	_	22	并列关系	_	_
29	嗎?
其實	嗎?
其實	d	d	_	33	状中结构	_	_
30	從	從	p	p	_	33	状中结构	_	_
31	這邊	這邊	r	r	_	30	介宾关系	_	_
32	就	就	d	d	_	33	状中结构	_	_
33	知道	知道	v	v	_	28	动宾关系	_	_
34	你	你	r	r	_	36	主谓关系	_	_
35	平時	平時	nt	t	_	36	状中结构	_	_
36	做事	做事	v	v	_	38	定中关系	_	_
37	的	的	u	u	_

In [9]:
for term in HanLP.segment(content):
    print('{}\t{}'.format(term.word, term.nature))

ㄟ 	w
法律	n
是	vshi
道德	n
的	ude1
最低	a
標	w
準	nz
 	w
你	rr
懂不懂	v
?	w

	w
你	rr
說	v
你	rr
沒有	v
違	n
反	vi
法律	n
 	w
那	rzv
就是	v
說	v
你	rr
只是	d
達	v
到	v
了	ule
道德	n
的	ude1
最低	a
標	w
準	nz
而已	y

	w
你	rr
反	vi
質詢	n
合乎	v
法律	n
沒	nz
錯	n
啊	y
 	w
但是	c
觀	n
感	vg
很差	d
你	rr
知道	v
嗎	w
?	w

	w
其	rz
實	w
從	p
這邊	n
就	d
知道	v
你	rr
平	v
時	ng
做事	vi
的	ude1
態度	n
了	ule

	w
只	d
要不	c
違	n
反	vi
法律	n
 	w
就	d
只是	d
達	v
到	v
了	ule
道德	n
觀	n
感	vg
的	ude1
最低	a
標	w
準	nz
...	w

	w
道德	n
規範體	n
現	w
著	nz
每	rz
個人	n
的	ude1
文明	n
程度	n
和	cc
素	ag
養	n

	w
如果	c
只是	d
狹	w
隘	ng
的	ude1
認	n
為	nz
 	w
只	d
要不	c
違	n
法	n
 	w
觀	n
感	vg
標	w
準	nz
隨	nz
便	d
應	w
對	p

	w
那	rzv
真是	d
可	v
憐	w
吶	n


In [3]:
NEWS = """2022/06/08 22:05
〔即時新聞／綜合報導〕烏克蘭盧甘斯克州（Lugansk）州長蓋戴（Sergiy Gaiday）今（8）日表示，由於戰況不利，烏軍有可能得從北頓內茨克（Severodonetsk）撤退。

《法新社》報導，蓋戴本日在接受1+1電視台採訪時表示，「有可能我們得撤退到位置更好的據點。」因為北頓內茨克全天24小時持續遭受俄軍砲擊。

北頓內茨克原本為盧甘斯克州的工業重鎮，也是近期烏俄兩軍激烈爭奪的戰略要點，俄羅斯昨日公開宣稱已成功占領北頓內茨克的住宅區，工業區則尚在烏克蘭掌握中。

北頓內茨克與利西昌斯克（Lysychansk）是烏克蘭在盧甘斯克州的最後兩處據點，這兩座城市被北頓涅茨河（Siverskyi Donets）分隔，不過利西昌斯克也正在遭受俄軍的砲火打擊。

"""
print(HanLP.segment(NEWS))

[2022/m, //w, 06/m, //w, 08/m,  /w, 22/m, :/w, 05/m, 
/w, 〔/w, 即/v, 時/ng, 新/a, 聞/n, ／/w, 綜/nz, 合/v, 報/nz, 導/w, 〕/mq, 烏/w, 克/q, 蘭/nz, 盧/n, 甘斯/nrf, 克州/nz, （/w, Lugansk/nx, ）/w, 州/n, 長蓋/n, 戴/v, （/w, Sergiy/nx,  /w, Gaiday/nx, ）/w, 今/tg, （/w, 8/m, ）/w, 日/b, 表示/v, ，/w, 由/p, 於/nz, 戰/v, 況/w, 不利/a, ，/w, 烏/w, 軍/nz, 有可能/nz, 得/ude3, 從/p, 北/f, 頓/n, 內/nz, 茨/ng, 克/q, （/w, Severodonetsk/nx, ）/w, 撤退/vi, 。/w, 

/w, 《/w, 法新社/j, 》/w, 報/nz, 導/w, ，/w, 蓋/n, 戴/v, 本/rz, 日/b, 在/p, 接受/v, 1/m, +/w, 1/m, 電視台/nis, 採/nz, 訪/n, 時/ng, 表示/v, ，/w, 「/w, 有可能/nz, 我們/rr, 得/ude3, 撤退/vi, 到/v, 位置/n, 更好/d, 的/ude1, 據/nz, 點/qt, 。/w, 」/w, 因/p, 為/nz, 北/f, 頓/n, 內/nz, 茨/ng, 克/q, 全天/n, 24/m, 小/a, 時/ng, 持/v, 續/n, 遭受/v, 俄/b, 軍/nz, 砲/n, 擊/w, 。/w, 

/w, 北/f, 頓/n, 內/nz, 茨/ng, 克/q, 原本/d, 為/nz, 盧/n, 甘斯/nrf, 克州/nz, 的/ude1, 工/n, 業/nz, 重/a, 鎮/n, ，/w, 也/d, 是/vshi, 近期/t, 烏/w, 俄/b, 兩/w, 軍/nz, 激烈/a, 爭奪/w, 的/ude1, 戰/v, 略/d, 要/v, 點/qt, ，/w, 俄/b, 羅斯/nr, 昨日/t, 公開/ad, 宣/nz, 稱/v, 已/d, 成功/a, 占/v, 領/n, 北/f, 頓/n, 內/nz, 茨/ng, 克/q, 的/ude1, 住宅/n, 區/w, ，/w, 工/n