Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[Question]: UIE 关系抽取、事件抽取如何进行标签构建、任务标注、使用schema? #5144

Closed
huzing2524 opened this issue Mar 8, 2023 · 2 comments
Assignees
Labels
question Further information is requested

Comments

@huzing2524
Copy link

请提出你的问题

你好:

  • 我是NLP新手,有一批文档,需要从文字描述中把 “同一种命名实体:人物类、组织机构类” 区分开【抵押人】、【保证人】,抽取出“人物类的名称”、“组织机构类的名称”。
  • 文字描述可能非常灵活,保证关系有这些很固定的描述:最高额保证、连带责任保证、保证责任、保证人。
  • 数据集举例如下:
    1. 张三及配偶李四房地产抵押,同时追加借款人股东王五及其配偶赵六孙七及配偶周八 连带责任保证
    2. 虾稻醇酒业有限公司提供工业用地抵押,并由中辉建设集团有限公司李四及配偶王五承担最高额保证
    3. 张三提供票据抵押,全部敞口由李四及配偶王五承担保证责任
    4. 最高额抵押金额为: 3,330,000.00元,抵押人张三李四;最高额保证金额为:3,330,000.00元,保证人王五赵六

问题:

  • 这个任务适合“关系抽取”还是“事件抽取”呢?应该如何“标签构建”、“任务标注”、"Taskflow使用什么schema"呢?我参考了一下其它的issues,下面是我的一些想法,不知道是否正确。
  • 如果使用关系抽取,使用哪种方法更好,或者有更好的方法吗?
    • 方法1:
      • 定义多种Span类型标签:抵押、最高额保证、连带责任保证、保证责任、保证人。
      • Relation标签:抵押关系、保证关系。
      • schema1= {"人物类": ["抵押关系", "保证关系"]}
      • schema2= {"组织机构类": ["抵押关系", "保证关系"]}
        image
    • 方法2:
      • 定义一种Span类型标签:抵押维度、保证维度。
      • Relation标签:抵押关系、保证关系。
      • schema1 = {"人物类": ["抵押关系", "保证关系"]}
      • schema2= {"组织机构类": ["抵押关系", "保证关系"]}
        image
  • 如果使用事件抽取:
    • 定义多种Span类型标签:抵押触发词、最高额保证触发词、连带责任保证触发词、保证责任触发词、保证人触发词、人物类、组织机构类。
    • Relation标签:人物、组织机构。
    • schema1 = {"抵押触发词": ["人物类", "组织机构类"]}]
    • schema2 = {"最高额保证触发词": ["人物类", "组织机构类"]}]
    • schema3 = {"连带责任保证触发词": ["人物类", "组织机构类"]}
    • schema4 = {"保证责任触发词": ["人物类", "组织机构类"]}
    • schema5 = {"保证人触发词": ["人物类", "组织机构类"]}
      image

恳请给出一些专业意见,不胜感激。

@huzing2524 huzing2524 added the question Further information is requested label Mar 8, 2023
@github-actions github-actions bot added the triage label Mar 8, 2023
@huzing2524 huzing2524 changed the title [Question]: UIE [Question]: UIE 关系抽取、事件抽取如何进行标签构建、任务标注、使用schema? Mar 8, 2023
@wawltor wawltor removed the triage label Mar 8, 2023
@linjieccc
Copy link
Contributor

@huzing2524 你好,建议采用关系抽取的形式,UIE关系抽取中prompt的构造主要由主体和关系类别决定,可以不用过多关注客体的标签类别,即标注为抵押维度、保证维度即可。事件抽取触发词字面相同的情况目前UIE还不支持(例如例子里存在两个抵押触发词)

@huzing2524
Copy link
Author

@huzing2524 你好,建议采用关系抽取的形式,UIE关系抽取中prompt的构造主要由主体和关系类别决定,可以不用过多关注客体的标签类别,即标注为抵押维度、保证维度即可。事件抽取触发词字面相同的情况目前UIE还不支持(例如例子里存在两个抵押触发词)

非常感谢!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
question Further information is requested
Projects
None yet
Development

No branches or pull requests

3 participants