# 成分句法分析

In [1]:
from hanlp_restful import HanLPClient

# 实例化客户端：指定API和语言类型
HanLP = HanLPClient('https://www.hanlp.com/api', auth=None, language='zh')
# 成分句法分析：指定了成分句法分析任务dep
doc = HanLP.parse('小吴在净月潭徒步的过程中偶遇了小王。', tasks='dep')
print(doc)

{
  "tok/fine": [
    ["小吴", "在", "净月潭", "徒步", "的", "过程", "中", "偶遇", "了", "小王", "。"]
  ],
  "dep": [
    [[8, "nsubj"], [6, "case"], [4, "dep"], [6, "acl"], [4, "mark"], [8, "nmod:prep"], [6, "case"], [0, "root"], [8, "aux:asp"], [8, "dobj"], [8, "punct"]]
  ]
}


In [2]:
# 显示成分句法分析结果：描述了句子结构和成分关系
print(doc.to_conll())

1	小吴	_	_	_	_	8	nsubj	_	_
2	在	_	_	_	_	6	case	_	_
3	净月潭	_	_	_	_	4	dep	_	_
4	徒步	_	_	_	_	6	acl	_	_
5	的	_	_	_	_	4	mark	_	_
6	过程	_	_	_	_	8	nmod:prep	_	_
7	中	_	_	_	_	6	case	_	_
8	偶遇	_	_	_	_	0	root	_	_
9	了	_	_	_	_	8	aux:asp	_	_
10	小王	_	_	_	_	8	dobj	_	_
11	。	_	_	_	_	8	punct	_	_


In [3]:
# 使用pretty_print函数，可视化句法分析树
'''
    “小吴” nsubj：主语
    “在” case：介词，表示位置关系
    “净月潭” dep：依赖成分，介词“在”的宾语
    "徒步" acl：名词短语，表示行为的方式
    “的” mark：标记，用于连接
    “过程” nmod:prep：名词短语“徒步”的介词短语修饰
    “中” case：介词“过程”的位置修饰
    “偶遇” root：句子的核心动词
    “了” aux:asp：助动词，表示动作的完成
    “小王” dobj：动词“偶遇”的直接宾语，表示了动作的对象
    “。” punct：句子的结尾标点
'''
doc.pretty_print()

# 依存句法分析

In [4]:
# 依存句法分析：指定了分词pos及依存句法分析con任务
doc1 = HanLP.parse('小吴在净月潭徒步的过程中偶遇了小王。', tasks=['pos', 'con'])
# doc1中含有句子的分词、词性标注及依存句法分析结果
'''
    “小吴” NR：人名
    “在” P：介词
    “净月潭” NR：地名
    "徒步" VV：动词
    “的” DEC：连接词
    “过程” NN：名词
    “中” LC：方位词
    “偶遇” VV：动词
    “了” AS：助动词
    “小王” NR：人名
    “。” PU：句号
'''
print(doc1)

{
  "tok/fine": [
    ["小吴", "在", "净月潭", "徒步", "的", "过程", "中", "偶遇", "了", "小王", "。"]
  ],
  "pos/ctb": [
    ["NR", "P", "NR", "VV", "DEC", "NN", "LC", "VV", "AS", "NR", "PU"]
  ],
  "con": [
    ["TOP", [["IP", [["NP", [["NR", ["小吴"]]]], ["VP", [["PP", [["P", ["在"]], ["LCP", [["NP", [["CP", [["IP", [["VP", [["NP", [["NR", ["净月潭"]]]], ["VP", [["VV", ["徒步"]]]]]]]], ["DEC", ["的"]]]], ["NP", [["NN", ["过程"]]]]]], ["LC", ["中"]]]]]], ["VP", [["VV", ["偶遇"]], ["AS", ["了"]], ["NP", [["NR", ["小王"]]]]]]]], ["PU", ["。"]]]]]]
  ]
}


In [5]:
# 使用pretty_print函数，可视化句法分析树
'''
    TOP：表示整个句子的顶层标签
    IP：表示简单句的标签
    NP：表示名词短语的标签
    VP：表示动词短语的标签
    PP：表示介词短语的标签
    CP：表示从句的标签
'''
doc1.pretty_print()