Skip to content
master
Go to file
Code

Latest commit

 

Git stats

Files

Permalink
Failed to load latest commit information.
Type
Name
Latest commit message
Commit time

README.md

Chinese sentence similarity

中文问题句子相似度计算

相关比赛

基于Adversarial Attack的问题等价性判别比赛

赛题任务描述

虽然近年来智能对话系统取得了长足的进展,但是针对专业性较强的问答系统(如法律、政务等),如何准确的判别用户的输入是否为给定问题的语义等价问法仍然是智能问答系统的关键。举例而言,**“市政府管辖哪些部门?”“哪些部门受到市政府的管辖?”可以认为是语义上等价的问题,而“市政府管辖哪些部门?”“市长管辖哪些部门?”**则为不等价的问题。

针对问题等价性判别而言,除去系统的准确性外,系统的鲁棒性也是很重要、但常常被忽略的一点需求。举例而言,虽然深度神经网络模型在给定的训练集和测试集上常常可以达到满意的准确度,但是对测试集合的稍微改变(Adversarial Attack)就可能导致整体准确度的大幅度下降(一些相关文献综述可见https://arxiv.org/pdf/1902.07285.pdf和https://www.mitpressjournals.org/doi/full/10.1162/tacl_a_00254)。

解决方案

参考该仓库WenRichard/DIAC2019-Adversarial-Attack-Share

CHIP 2019 task2

赛题任务描述

本次比赛是chip2019中的评测任务二,由平安医疗科技主办。chip2019会议详情见链接:http://cips-chip.org.cn/evaluation

迁移学习是自然语言处理中的重要一环,其主要目的是通过从已学习的相关任务中转移知识来改进新任务的学习效果,从而提高模型的泛化能力。

本次评测任务的主要目标是针对中文的疾病问答数据,进行病种间的迁移学习。具体而言,给定来自5个不同病种的问句对,要求判定两个句子语义是否相同或者相近。所有语料来自互联网上患者真实的问题,并经过了筛选和人工的意图匹配标注。

解决方案

CCKS 2018 微众银行智能客服问句匹配大赛

赛题任务描述

评测任务的主要目标是针对中文的真实客服语料,进行问句意图匹配。集给定两个语句,要求判定两者意图是否相同或者相近。所有语料来自原始的银行领域智能客服日志,并经过了筛选和人工的意图匹配标注。

解决方案

2018 ATEC 蚂蚁金服 金融大脑-金融智能NLP服务

赛题任务描述

问题相似度计算,即给定客服里用户描述的两句话,用算法来判断是否表示了相同的语义。

示例:
a.“花呗如何还款” --“花呗怎么还款”:同义问句
b.“花呗如何还款” -- “我怎么还我的花被呢”:同义问句
c.“花呗分期后逾期了如何还款”-- “花呗分期后逾期了哪里还款”:非同义问句
对于例子a,比较简单的方法就可以判定同义;对于例子b,包含了错别字、同义词、词序变换等问题,两个句子乍一看并不类似,想正确判断比较有挑战;对于例子c,两句话很类似,仅仅有一处细微的差别 “如何”和“哪里”,就导致语义不一致。

解决方案

第三届魔镜杯大赛

赛题任务描述

智能客服聊天机器人场景中,待客户提出问题后,往往需要先计算客户提出问题与知识库问题的相似度,进而定位最相似问题,再对问题给出答案。

解决方案

CHIP 2018 task2

赛题任务描述

主要目标是针对中文的真实患者健康咨询语料,进行问句意图匹配。给定两个语句,要求判定两者意图是否相同或者相近。所有语料来自互联网上患者真实的问题,并经过了筛选和人工的意图匹配标注。

解决方案

To be continued...

About

中文问题句子相似度计算比赛及方案汇总

Topics

Resources

Releases

No releases published

Packages

No packages published
You can’t perform that action at this time.