In [1]:
from ltp import LTP
ltp = LTP()

In [22]:
from typing import Text, Any, Dict, List, Union, Optional, Tuple, Set
from anytree.node.nodemixin import NodeMixin
from anytree.node.util import _repr
class AnalBaseNode(NodeMixin, object):
    name: str

    tags: Set[Text]={}
    term: str='_'
    description: str=''

    def __init__(self, name, parent=None, children=None, **kwargs):
        self.name=name
        self.__dict__.update(kwargs)        
        self.parent = parent
        if children:
            self.children = children

    def __repr__(self):
        return _repr(self)

class AnalKgNode(AnalBaseNode):
    def __repr__(self):
        return _repr(self)

In [7]:
def proc_sents(sents):
    seg, hidden = ltp.seg([sents])
    print(seg[0])
    sdp = ltp.sdp(hidden, graph=False)
    for start, end, tag in sdp[0]:
        print(seg[0][start-1],f"({tag})", seg[0][end-1])

proc_sents("他叫汤姆去拿外衣。")

['他', '叫', '汤姆', '去', '拿', '外衣', '。']
他 (Agt) 叫
叫 (Root) 。
汤姆 (Datv) 叫
去 (eEfft) 叫
拿 (eEfft) 去
外衣 (Pat) 拿
。 (mPunc) 叫


In [54]:
term_exprs='''关系类型	Tag	Description	Example
施事关系	Agt	Agent	我送她一束花 (我 <-- 送)
当事关系	Exp	Experiencer	我跑得快 (跑 --> 我)
感事关系	Aft	Affection	我思念家乡 (思念 --> 我)
领事关系	Poss	Possessor	他有一本好读 (他 <-- 有)
受事关系	Pat	Patient	他打了小明 (打 --> 小明)
客事关系	Cont	Content	他听到鞭炮声 (听 --> 鞭炮声)
成事关系	Prod	Product	他写了本小说 (写 --> 小说)
源事关系	Orig	Origin	我军缴获敌人四辆坦克 (缴获 --> 坦克)
涉事关系	Datv	Dative	他告诉我个秘密 ( 告诉 --> 我 )
比较角色	Comp	Comitative	他成绩比我好 (他 --> 我)
属事角色	Belg	Belongings	老赵有俩女儿 (老赵 <-- 有)
类事角色	Clas	Classification	他是中学生 (是 --> 中学生)
依据角色	Accd	According	本庭依法宣判 (依法 <-- 宣判)
缘故角色	Reas	Reason	他在愁女儿婚事 (愁 --> 婚事)
意图角色	Int	Intention	为了金牌他拼命努力 (金牌 <-- 努力)
结局角色	Cons	Consequence	他跑了满头大汗 (跑 --> 满头大汗)
方式角色	Mann	Manner	球慢慢滚进空门 (慢慢 <-- 滚)
工具角色	Tool	Tool	她用砂锅熬粥 (砂锅 <-- 熬粥)
材料角色	Malt	Material	她用小米熬粥 (小米 <-- 熬粥)
材料角色	Matl	Material	她用小米熬粥 (小米 <-- 熬粥)
时间角色	Time	Time	唐朝有个李白 (唐朝 <-- 有)
空间角色	Loc	Location	这房子朝南 (朝 --> 南)
历程角色	Proc	Process	火车正在过长江大桥 (过 --> 大桥)
趋向角色	Dir	Direction	部队奔向南方 (奔 --> 南)
范围角色	Sco	Scope	产品应该比质量 (比 --> 质量)
数量角色	Quan	Quantity	一年有365天 (有 --> 天)
数量数组	Qp	Quantity-phrase	三本书 (三 --> 本)
频率角色	Freq	Frequency	他每天看书 (每天 <-- 看)
顺序角色	Seq	Sequence	他跑第一 (跑 --> 第一)
描写角色	Desc(Feat)	Description	他长得胖 (长 --> 胖)
宿主角色	Host	Host	住房面积 (住房 <-- 面积)
名字修饰角色	Nmod	Name-modifier	果戈里大街 (果戈里 <-- 大街)
时间修饰角色	Tmod	Time-modifier	星期一上午 (星期一 <-- 上午)
反角色	r + main role		打篮球的小姑娘 (打篮球 <-- 姑娘)
嵌套角色	d + main role		爷爷看见孙子在跑 (看见 --> 跑)
并列关系	eCoo	event Coordination	我喜欢唱歌和跳舞 (唱歌 --> 跳舞)
选择关系	eSelt	event Selection	您是喝茶还是喝咖啡 (茶 --> 咖啡)
等同关系	eEqu	event Equivalent	他们三个人一起走 (他们 --> 三个人)
先行关系	ePrec	event Precedent	首先，先
顺承关系	eSucc	event Successor	随后，然后
递进关系	eProg	event Progression	况且，并且
转折关系	eAdvt	event adversative	却，然而
原因关系	eCau	event Cause	因为，既然
结果关系	eResu	event Result	因此，以致
推论关系	eInf	event Inference	才，则
条件关系	eCond	event Condition	只要，除非
假设关系	eSupp	event Supposition	如果，要是
让步关系	eConc	event Concession	纵使，哪怕
手段关系	eMetd	event Method	
目的关系	ePurp	event Purpose	为了，以便
割舍关系	eAban	event Abandonment	与其，也不
选取关系	ePref	event Preference	不如，宁愿
总括关系	eSum	event Summary	总而言之
分叙关系	eRect	event Recount	例如，比方说
连词标记	mConj	Recount Marker	和，或
的字标记	mAux	Auxiliary	的，地，得
介词标记	mPrep	Preposition	把，被
语气标记	mTone	Tone	吗，呢
时间标记	mTime	Time	才，曾经
范围标记	mRang	Range	都，到处
程度标记	mDegr	Degree	很，稍微
频率标记	mFreq	Frequency Marker	再，常常
趋向标记	mDir	Direction Marker	上去，下来
插入语标记	mPars	Parenthesis Marker	总的来说，众所周知
否定标记	mNeg	Negation Marker	不，没，未
情态标记	mMod	Modal Marker	幸亏，会，能
标点标记	mPunc	Punctuation Marker	，。！
重复标记	mPept	Repetition Marker	走啊走 (走 --> 走)
多数标记	mMaj	Majority Marker	们，等
实词虚化标记	mVain	Vain Marker	
离合标记	mSepa	Seperation Marker	吃了个饭 (吃 --> 饭) 洗了个澡 (洗 --> 澡)
根节点	Root	Root	全句核心节点'''.split('\n')
rows=[r.split('\t') for r in term_exprs]
terms_map={t[1]:f"{t[2]}_{t[0]}" for t in rows}
terms_map

{'Tag': 'Description_关系类型',
 'Agt': 'Agent_施事关系',
 'Exp': 'Experiencer_当事关系',
 'Aft': 'Affection_感事关系',
 'Poss': 'Possessor_领事关系',
 'Pat': 'Patient_受事关系',
 'Cont': 'Content_客事关系',
 'Prod': 'Product_成事关系',
 'Orig': 'Origin_源事关系',
 'Datv': 'Dative_涉事关系',
 'Comp': 'Comitative_比较角色',
 'Belg': 'Belongings_属事角色',
 'Clas': 'Classification_类事角色',
 'Accd': 'According_依据角色',
 'Reas': 'Reason_缘故角色',
 'Int': 'Intention_意图角色',
 'Cons': 'Consequence_结局角色',
 'Mann': 'Manner_方式角色',
 'Tool': 'Tool_工具角色',
 'Malt': 'Material_材料角色',
 'Matl': 'Material_材料角色',
 'Time': 'Time_时间角色',
 'Loc': 'Location_空间角色',
 'Proc': 'Process_历程角色',
 'Dir': 'Direction_趋向角色',
 'Sco': 'Scope_范围角色',
 'Quan': 'Quantity_数量角色',
 'Qp': 'Quantity-phrase_数量数组',
 'Freq': 'Frequency_频率角色',
 'Seq': 'Sequence_顺序角色',
 'Desc(Feat)': 'Description_描写角色',
 'Host': 'Host_宿主角色',
 'Nmod': 'Name-modifier_名字修饰角色',
 'Tmod': 'Time-modifier_时间修饰角色',
 'r + main role': '_反角色',
 'd + main role': '_嵌套角色',
 'eCoo': 'event Coordination_并列关系',
 'eSelt': 'eve

In [55]:
from anytree import Node, RenderTree
nodecls=AnalKgNode
def build_tree(sents, verbose=True, lang='zh'):
    if not sents.endswith(('.', '?', '。', '？', '！')):
        sents=sents+'.'
    seg, hidden = ltp.seg([sents])
    words=seg[0]
    nodes = [nodecls(word, lang=lang) for word in words]
    sdp = ltp.sdp(hidden, graph=False)
    root=None
    for start, end, tag in sdp[0]:
        if verbose:
            print(seg[0][start-1],f"({tag})", seg[0][end-1])
        if tag=='mPunc':
            continue
        nodes[start-1].parent=nodes[end-1]
        nodes[start-1].term=tag
        if tag in terms_map:
            nodes[start-1].description=terms_map[tag]
        else:
            nodes[start-1].description='_'
        if tag=='Root':
            root=nodes[end-1]
        
    return root

def print_sdp(sents, detail=True, verbose=False, lang='zh'):
    root=build_tree(sents, verbose=verbose)
    for pre, _, node in RenderTree(root):
        print("%s%s(%s): %s" % (pre, node.term, 
                                node.description if detail else '_', 
                                node.name))
# print(RenderTree(self, style=AsciiStyle()).by_attr(
#             lambda n: f"{n.dependency_relation}: {n.text} "
#                       f"({additional(n)}, {n.upos.lower()})"))

print_sdp('他叫汤姆去拿外衣。')

_(): 。
└── Root(Root_根节点): 叫
    ├── Agt(Agent_施事关系): 他
    ├── Datv(Dative_涉事关系): 汤姆
    └── eEfft(_): 去
        └── eEfft(_): 拿
            └── Pat(Patient_受事关系): 外衣


In [38]:
print_sdp('唐朝有个李白', True)

唐朝 (Time) 有
有 (Root) .
个 (Meas) 李白
李白 (Exp) 有
. (mPunc) 有
_(): .
└── Root(Root_根节点): 有
    ├── Time(Time_时间角色): 唐朝
    └── Exp(Experiencer_当事关系): 李白
        └── Meas(_): 个


In [45]:
print_sdp('我喜欢唱歌和跳舞', True, True)

我 (Agt) 喜欢
喜欢 (Root) .
唱歌 (dCont) 喜欢
和 (mRela) 跳舞
跳舞 (eSymm) 唱歌
. (mPunc) 喜欢
_(): .
└── Root(Root_根节点): 喜欢
    ├── Agt(Agent_施事关系): 我
    └── dCont(_): 唱歌
        └── eSymm(_): 跳舞
            └── mRela(_): 和


In [40]:
print_sdp('您是喝茶还是喝咖啡 ')

您 (Agt) 喝茶
是 (mRela) 喝茶
喝茶 (Root) .
还是 (mRela) 喝
喝 (eSymm) 喝茶
咖啡 (Pat) 喝
. (mPunc) 喝
_(): .
└── Root(Root_根节点): 喝茶
    ├── Agt(Agent_施事关系): 您
    ├── mRela(_): 是
    └── eSymm(_): 喝
        ├── mRela(_): 还是
        └── Pat(Patient_受事关系): 咖啡


In [46]:
print_sdp('他们三个人一起走 ')

_(): .
└── Root(Root_根节点): 走
    ├── Agt(Agent_施事关系): 人
    │   ├── Exp(Experiencer_当事关系): 他们
    │   └── Meas(_): 个
    │       └── Meas(_): 三
    └── Mann(Manner_方式角色): 一起


In [47]:
print_sdp('我家的住房面积是80平米')

_(): .
└── Root(Root_根节点): 是
    ├── Exp(Experiencer_当事关系): 面积
    │   └── Mod(_): 住房
    │       └── Exp(Experiencer_当事关系): 我家
    │           └── mDepd(_): 的
    └── Meas(_): 平米
        └── Meas(_): 80


In [50]:
sents=['他长得胖', '他跑第一', '他每天看书 ', '为了金牌他拼命努力']
for s in sents:
    print_sdp(s)

_(): .
└── Root(Root_根节点): 长
    ├── Exp(Experiencer_当事关系): 他
    ├── mDepd(_): 得
    └── Mod(_): 胖
_(): .
└── Root(Root_根节点): 跑
    ├── Agt(Agent_施事关系): 他
    └── Meas(_): 第一
_(): .
└── Root(Root_根节点): 看
    ├── Agt(Agent_施事关系): 他
    ├── Meas(_): 每天
    └── Cont(Content_客事关系): 书
_(): .
└── Root(Root_根节点): 努力
    ├── Datv(Dative_涉事关系): 金牌
    │   └── mRela(_): 为了
    ├── Agt(Agent_施事关系): 他
    └── mNeg(Negation Marker_否定标记): 拼命


In [60]:
sents=['我吃了个巧克力味冰淇淋。', '今天我去电影院看了浓情巧克力。', 
       '她用小米熬粥', '她用美的砂锅熬粥', '我军缴获敌人四辆坦克']
for s in sents:
    print_sdp(s)

_(): 。
└── Root(Root_根节点): 吃
    ├── Agt(Agent_施事关系): 我
    ├── mDepd(_): 了
    └── Pat(Patient_受事关系): 冰淇淋
        ├── Meas(_): 个
        └── Mod(_): 味
            └── Mod(_): 巧克力
_(): 。
└── Root(Root_根节点): 去
    ├── Time(Time_时间角色): 今天
    ├── Agt(Agent_施事关系): 我
    ├── Loc(Location_空间角色): 电影院
    └── eEfft(_): 看
        ├── mDepd(_): 了
        └── Cont(Content_客事关系): 巧克力
            └── Mod(_): 浓情
_(): .
└── Root(Root_根节点): 熬粥
    ├── Agt(Agent_施事关系): 她
    └── Matl(Material_材料角色): 小米
        └── mRela(_): 用
_(): .
└── Root(Root_根节点): 熬粥
    ├── Agt(Agent_施事关系): 她
    └── Tool(Tool_工具角色): 砂锅
        ├── mRela(_): 用
        └── Mod(_): 美
            └── mDepd(_): 的
_(): .
└── Root(Root_根节点): 缴获
    ├── Agt(Agent_施事关系): 我军
    └── Pat(Patient_受事关系): 坦克
        ├── Exp(Experiencer_当事关系): 敌人
        └── Meas(_): 辆
            └── Meas(_): 四


In [66]:
sents=['一九九五年冬天', '一九九五年的冬天很冷', 
       '一九九五年是他倒霉的一年', '他说他的生日是九月二日']
for s in sents:
    print_sdp(s)

_(): .
└── Root(Root_根节点): 冬天
    └── Mod(_): 一九九五年
_(): .
└── Root(Root_根节点): 冷
    ├── Exp(Experiencer_当事关系): 冬天
    │   └── Time(Time_时间角色): 一九九五年
    │       └── mDepd(_): 的
    └── mDepd(_): 很
_(): .
└── Root(Root_根节点): 是
    ├── Exp(Experiencer_当事关系): 一九九五年
    └── Link(_): 年
        ├── Mod(_): 倒霉
        │   ├── Exp(Experiencer_当事关系): 他
        │   └── mDepd(_): 的
        └── Meas(_): 一
_(): .
└── Root(Root_根节点): 说
    ├── Agt(Agent_施事关系): 他
    └── dCont(_): 是
        ├── Exp(Experiencer_当事关系): 生日
        │   └── Exp(Experiencer_当事关系): 他
        │       └── mDepd(_): 的
        └── Link(_): 二日
            └── Mod(_): 九月


In [1]:
from ltp import LTP

ltp = LTP()

seg, hidden = ltp.seg(["他叫汤姆去拿外衣。"])
sdp = ltp.sdp(hidden, graph=False)
sdp

[[(1, 2, 'Agt'),
  (2, 0, 'Root'),
  (3, 2, 'Datv'),
  (4, 2, 'eEfft'),
  (5, 4, 'eEfft'),
  (6, 5, 'Pat'),
  (7, 2, 'mPunc')]]

In [2]:
seg, hidden = ltp.seg(["他叫汤姆去拿外衣。"])
sdp = ltp.sdp(hidden, graph=True)
sdp

[[(1, 2, 'Agt'),
  (2, 0, 'Root'),
  (3, 2, 'Datv'),
  (3, 4, 'Agt'),
  (3, 5, 'Agt'),
  (4, 2, 'eEfft'),
  (5, 4, 'eEfft'),
  (6, 5, 'Pat'),
  (7, 2, 'mPunc')]]

In [11]:
# seg, hidden = ltp.seg(["我军缴获敌人四辆坦克"])
# seg, hidden = ltp.seg(["这房子朝南"])
sents=['打篮球的小姑娘', '他听到鞭炮声', '他写了本小说', '周杰伦的出生日期是哪天']
for s in sents:
    seg, hidden = ltp.seg([s])
    sdp = ltp.sdp(hidden, graph=False)
    print(s, sdp)

打篮球的小姑娘 [[(1, 4, 'rAgt'), (2, 1, 'Pat'), (3, 1, 'mDepd'), (4, 0, 'Root')]]
他听到鞭炮声 [[(1, 2, 'Agt'), (2, 0, 'Root'), (3, 2, 'Cont')]]
他写了本小说 [[(1, 2, 'Agt'), (2, 0, 'Root'), (3, 2, 'mDepd'), (4, 5, 'Meas'), (5, 2, 'Prod')]]
周杰伦的出生日期是哪天 [[(1, 4, 'Exp'), (2, 1, 'mDepd'), (3, 4, 'rTime'), (4, 5, 'Exp'), (5, 0, 'Root'), (6, 7, 'Sco'), (7, 5, 'Link')]]


In [15]:
seg, hidden = ltp.seg(["他叫汤姆去拿外衣。"])
pos = ltp.pos(hidden)
seg, pos, ltp.ner(hidden)

([['他', '叫', '汤姆', '去', '拿', '外衣', '。']],
 [['r', 'v', 'nh', 'v', 'v', 'n', 'wp']],
 [[('Nh', 2, 2)]])

In [17]:
ners=ltp.ner(hidden)
for tag, start, end in ners[0]:
    print(tag,":", "".join(seg[0][start:end + 1]))

Nh : 汤姆


In [40]:
def print_args(sents):
    seg, hidden = ltp.seg([sents])
    srl=ltp.srl(hidden)
    for tok, term in zip(seg[0], srl[0]):
        print(tok, term)
        for tag, start, end in term:
            print('\t', tag, ":", "".join(seg[0][start:end + 1]))

print_args("叫汤姆在中午去拿外衣。")

叫 [('A1', 1, 1), ('A2', 2, 6)]
	 A1 : 汤姆
	 A2 : 在中午去拿外衣
汤姆 []
在 []
中午 []
去 []
拿 [('A0', 1, 1), ('ARGM-TMP', 2, 3), ('A1', 6, 6)]
	 A0 : 汤姆
	 ARGM-TMP : 在中午
	 A1 : 外衣
外衣 []
。 []


In [41]:
print_args("叫汤姆不要拿外衣。")

叫 [('A1', 1, 1), ('A2', 2, 4)]
	 A1 : 汤姆
	 A2 : 不要拿外衣
汤姆 []
不要 []
拿 [('A0', 1, 1), ('ARGM-ADV', 2, 2), ('A1', 4, 4)]
	 A0 : 汤姆
	 ARGM-ADV : 不要
	 A1 : 外衣
外衣 []
。 []


In [23]:
seg[0][1]

'叫'

In [29]:
def proc_sents(sents):
    seg, hidden = ltp.seg([sents])
    sdp = ltp.sdp(hidden, graph=False)
    for start, end, tag in sdp[0]:
        print(seg[0][start-1],f"({tag})", seg[0][end-1])

proc_sents("他叫汤姆去拿外衣。")

他 (Agt) 叫
叫 (Root) 。
汤姆 (Datv) 叫
去 (eEfft) 叫
拿 (eEfft) 去
外衣 (Pat) 拿
。 (mPunc) 叫


In [31]:
proc_sents("他打了小明。")

他 (Agt) 打
打 (Root) 。
了 (mDepd) 打
小明 (Pat) 打
。 (mPunc) 打


In [34]:
proc_sents("小明被他打了。")
print('*'*15)
proc_sents("他打了小明一拳。")

小明 (Pat) 打
被 (mRela) 他
他 (Agt) 打
打 (Root) 。
了 (mDepd) 打
。 (mPunc) 打
***************
他 (Agt) 打
打 (Root) 。
了 (mDepd) 打
小明 (Pat) 打
一 (Meas) 拳
拳 (Meas) 打
。 (mPunc) 打


In [42]:
# ltp.srl(hidden, keep_empty=False)
ltp.srl(hidden)

[[[('A1', 1, 1), ('A2', 2, 6)],
  [],
  [],
  [],
  [],
  [('A0', 1, 1), ('ARGM-TMP', 2, 3), ('A1', 6, 6)],
  [],
  []]]