Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

多观点的抽出是否支持? #27

Closed
LangDaoAI opened this issue Jun 3, 2021 · 56 comments
Closed

多观点的抽出是否支持? #27

LangDaoAI opened this issue Jun 3, 2021 · 56 comments

Comments

@LangDaoAI
Copy link

确认一下多观点的抽出是否支持, 或者提供一些参考,以及一些ideas。

@yangheng95
Copy link
Owner

支持,readme有示例

@LangDaoAI
Copy link
Author

支持,readme有示例

image

还请更新一下readme, 目前readme示例支持aspect和极性, opinion观点并没有显示出来

@yangheng95
Copy link
Owner

你指的opinion是怎么样的,能举个例子吗

@LangDaoAI
Copy link
Author

你指的opinion是怎么样的,能举个例子吗

比方说: 这款手机的大小真的很薄,但是颜色不太好看, 总体上我很满意啦。

这句评论我来做细粒度的情感分析, 那么我的目标就是:
1 Aspect Term + 观点opinion + 极性
1)大小 + (很)薄 + 正面
2)颜色 + 不好看 + 负面

2 总体情感
因为我刻意写了总体的满意程度, 所以这里总体是正面, 当然有些没有明显写出来是隐式的,所以存在局部情感分类后进行程度上的比较进而做概率分析总体是正向还是负向或者各自的概率比例都给出来。

因此,这里的opinion是非常重要的,
1 它解释了局部情感的极性
2 它可以和Aspect形成热词标签做统计,便于后续上游系统的改进和提升,用于更精细化决策。

@yangheng95
Copy link
Owner

抱歉,这么精细的任务现在还不支持的,看后续有没有时间更新了

@yangheng95
Copy link
Owner

没有opinion数据的标注也是一个问题

@LangDaoAI
Copy link
Author

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

@yangheng95
Copy link
Owner

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

你的这个需求更贴近实际应用层次,理论上是可以的,单需要更改模型结构的。我映像中应该有观点-情感对联合抽取研究的论文,但代码是否开源我就不清楚了

@yangheng95
Copy link
Owner

@LangDaoAI
Copy link
Author

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

你的这个需求更贴近实际应用层次,理论上是可以的,单需要更改模型结构的。我映像中应该有观点-情感对联合抽取研究的论文,但代码是否开源我就不清楚了

你说的很对,应用场景非常大

@LangDaoAI
Copy link
Author

例如
https://arxiv.org/abs/2103.15255
https://arxiv.org/abs/2102.08549

我先把LCF测试完并且分析完, 然后再看这些

@LangDaoAI
Copy link
Author

三元组以上同时抽出,无论模型是怎么样的,不是为了增加一个维度而去创新性的做抽出,最终性能比较还是要退化到二元组甚至一元组来比较局部的性能,准确性, 例如, 再多维度的同时抽出如果在Aspect方面准确性都不如二元组抽出,那么肯定不是正确方向

@yangheng95
Copy link
Owner

是的,但是我现在有其他工作安排,所以这个特性不会很快添加,如果你有该模型的想法可以与我讨论

@LangDaoAI
Copy link
Author

LangDaoAI commented Jun 3, 2021 via email

@LangDaoAI
Copy link
Author

刚刚已经跑出来了结果,看一下如下:

image

@LangDaoAI
Copy link
Author

想问一下, 该LCF模型是基于Bert做Fine-tuning, Fine-tuning的部分在哪里请告知一下, 今天想理解一下这个模型架构, 您时间空了回复就可以,感谢!

@LangDaoAI
Copy link
Author

出现一个问题请看一下,我加了一句‘这款手机的大小真的很薄,但是颜色不太好看,总体上我很满意啦。’做测试,没有被识别出来,请看一下下面测试的结果,红色标记

image

@yangheng95
Copy link
Owner

好的,我先看一下如何修复

@LangDaoAI
Copy link
Author

好的,我先看一下如何修复

OK

@LangDaoAI
Copy link
Author

LangDaoAI commented Jun 4, 2021

调试发现大的问题出在all_tokens,也就是分词没有分出来,见下图:

screenshot_20210604091849419

@yangheng95
Copy link
Owner

知道的,我抽时间修复

@yangheng95
Copy link
Owner

你可以先手动把中文用空格分开测试一下

@yangheng95
Copy link
Owner

修复完通知你更新

@LangDaoAI
Copy link
Author

image

嗯,我debug确实是这个函数中的切分单词出错了,我来试一下你的方式啊

@LangDaoAI
Copy link
Author

image

嗯,可以了

@yangheng95
Copy link
Owner

原先的中文数据集一直是单子分开的,分布分开做情感那分类没有影响,做这个的时候没有考虑中文切分的问题

@LangDaoAI
Copy link
Author

image

我做了一个测试,看一下是否可以,

import re

def spliteKeyWord(str):
regex = r"[\u4e00-\ufaff]|[0-9]+|[a-zA-Z]+'[a-z]"
matches = re.findall(regex, str, re.UNICODE)
return matches

print(spliteKeyWord("Testing English text我爱Python123"))
print(spliteKeyWord("Testing English text"))
print(spliteKeyWord("这 款 手 机 的 大 小 真 的 很 薄,但 是 颜 色 不 太 好 看,总 体 上 我 很 满 意 啦。"))

@LangDaoAI
Copy link
Author

本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下,

image

有空格和没有空格都是一样的。

@ScottishFold007
Copy link

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

image
是这样的结果吗?情感根据观点很容易得到

@yangheng95
Copy link
Owner

yangheng95 commented Jun 4, 2021

本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下,

image

有空格和没有空格都是一样的。

这属应该是训练数据不足导致的结果

@LangDaoAI
Copy link
Author

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

image
是这样的结果吗?情感根据观点很容易得到

是这个意思,你的代码是其他模型的吧

@LangDaoAI
Copy link
Author

本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下,
image
有空格和没有空格都是一样的。

这属应该是训练数据不足导致的结果

嗯这个问题我先记下来

@LangDaoAI
Copy link
Author

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

image
是这样的结果吗?情感根据观点很容易得到

但是你这个效果和我想要的还不一样, 我想的是精细化aspects-sentiment-opinion配对输出

@ScottishFold007
Copy link

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

image
是这样的结果吗?情感根据观点很容易得到

但是你这个效果和我想要的还不一样, 我想的是精细化aspects-sentiment-opinion配对输出

一一对应的三元组是吧,也可以的
image

@LangDaoAI
Copy link
Author

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

image
是这样的结果吗?情感根据观点很容易得到

但是你这个效果和我想要的还不一样, 我想的是精细化aspects-sentiment-opinion配对输出

一一对应的三元组是吧,也可以的
image

嗯,很棒, 用哪个模型做的?有参考project或者资料吗

@ScottishFold007
Copy link

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

image
是这样的结果吗?情感根据观点很容易得到

是这个意思,你的代码是其他模型的吧

是其他模型做的

@ScottishFold007
Copy link

本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧

image
是这样的结果吗?情感根据观点很容易得到

但是你这个效果和我想要的还不一样, 我想的是精细化aspects-sentiment-opinion配对输出

一一对应的三元组是吧,也可以的
image

嗯,很棒, 用哪个模型做的?有参考project或者资料吗

没有,生产用的,不开源

@LangDaoAI
Copy link
Author

LangDaoAI commented Jun 4, 2021 via email

@yangheng95
Copy link
Owner

调试发现大的问题出在all_tokens,也就是分词没有分出来,见下图:

screenshot_20210604091849419

已经根据你给的代码修复了,谢谢贡献代码

@LangDaoAI
Copy link
Author

LangDaoAI commented Jun 4, 2021 via email

@LangDaoAI
Copy link
Author

下一步考虑:观点抽取如何加入模型中、模型做改动、数据标注如何考虑观点的抽取。

@yangheng95
Copy link
Owner

本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下,

image

有空格和没有空格都是一样的。

Sentence with predicted labels:
尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O)
{'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'}
Sentence with predicted labels:
照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O)
{'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'}
Sentence with predicted labels:
关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O)
{'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'}
Sentence with predicted labels:
相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O)
{'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'}
Sentence with predicted labels:
相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O)
{'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'}
Sentence with predicted labels:
这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O)
{'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'}
{'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'}

这是综合4个中文数据集训练的模型的结果

@LangDaoAI
Copy link
Author

本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下,
image
有空格和没有空格都是一样的。

Sentence with predicted labels:
尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O)
{'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'}
Sentence with predicted labels:
照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O)
{'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'}
Sentence with predicted labels:
关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O)
{'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'}
Sentence with predicted labels:
相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O)
{'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'}
Sentence with predicted labels:
相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O)
{'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'}
Sentence with predicted labels:
这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O)
{'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'}
{'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'}

这是综合4个中文数据集训练的模型的结果

颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。

@yangheng95
Copy link
Owner

本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下,
image
有空格和没有空格都是一样的。

Sentence with predicted labels:
尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O)
{'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'}
Sentence with predicted labels:
照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O)
{'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'}
Sentence with predicted labels:
关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O)
{'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'}
Sentence with predicted labels:
相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O)
{'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'}
Sentence with predicted labels:
相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O)
{'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'}
Sentence with predicted labels:
这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O)
{'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'}
{'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'}
这是综合4个中文数据集训练的模型的结果

颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。

主要原因是将4个中文数据集合并了,数据量增多,代码已经更新,正在上传模型

@LangDaoAI
Copy link
Author

LangDaoAI commented Jun 4, 2021 via email

@yangheng95
Copy link
Owner

合并的意思是把四个分散的数据集全部放到一个里面,只是单纯追加吗,可否详细说一下,谢谢 Get Outlook for Androidhttps://aka.ms/AAb9ysg

________________________________ From: YangHeng @.> Sent: Friday, June 4, 2021 6:38:12 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27) 本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下, [image]https://user-images.githubusercontent.com/83859417/120736527-fbda2380-c51e-11eb-94b0-c30ecea42979.png 有空格和没有空格都是一样的。 Sentence with predicted labels: 尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O) {'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'} Sentence with predicted labels: 照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O) {'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'} Sentence with predicted labels: 关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O) {'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O) {'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'} {'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'} 这是综合4个中文数据集训练的模型的结果 颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。 主要原因是将4个中文数据集合并了,数据量增多,代码已经更新,正在上传模型 ― You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWNZFDTWARXWMBAVCNTTRCUJJANCNFSM46AW7SCQ.

就是合并所有的中文训练集和测试集作为一整个训练集和测试集,现在可以从google drive下载中文模型,读取模型之后会打印训练时的参数,其中的datasets_files就是采用的数据集

@LangDaoAI
Copy link
Author

LangDaoAI commented Jun 4, 2021 via email

@LangDaoAI
Copy link
Author

LangDaoAI commented Jun 6, 2021 via email

@yangheng95
Copy link
Owner

12号后我再用新的模型验证一下,这几天出差,另外观点抽出可能模型架构要改动的,有空还请看一下,或者说当前模型架构是否支持这样的观点抽出? Get Outlook for Androidhttps://aka.ms/AAb9ysg

________________________________ From: Tang Yong @.> Sent: Friday, June 4, 2021 7:18:13 PM To: yangheng95/pyabsa @.>; yangheng95/pyabsa @.> Cc: Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27) 好的感谢! Get Outlook for Androidhttps://aka.ms/AAb9ysg
________________________________ From: YangHeng @.> Sent: Friday, June 4, 2021 7:17:27 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27) 合并的意思是把四个分散的数据集全部放到一个里面,只是单纯追加吗,可否详细说一下,谢谢 Get Outlook for Androidhttps://aka.ms/AAb9ysg …
________________________________ From: YangHeng @.> Sent: Friday, June 4, 2021 6:38:12 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27>) 本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下, [image]https://user-images.githubusercontent.com/83859417/120736527-fbda2380-c51e-11eb-94b0-c30ecea42979.png 有空格和没有空格都是一样的。 Sentence with predicted labels: 尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O) {'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'} Sentence with predicted labels: 照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O) {'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'} Sentence with predicted labels: 关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O) {'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O) {'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'} {'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'} 这是综合4个中文数据集训练的模型的结果 颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。 主要原因是将4个中文数据集合并了,数据量增多,代码已经更新,正在上传模型 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)<#27 (comment)>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWNZFDTWARXWMBAVCNTTRCUJJANCNFSM46AW7SCQ. 就是合并所有的中文训练集和测试集作为一整个训练集和测试集,现在可以从google drive下载中文模型,读取模型之后会打印训练时的参数,其中的datasets_files就是采用的数据集 ― You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWPQDEJONX3FEGBOKIDTRCY4PANCNFSM46AW7SCQ.

改模型倒不是最大的问题, 问题是没有标注好opinion的数据集

@LangDaoAI
Copy link
Author

LangDaoAI commented Jun 6, 2021 via email

@yangheng95
Copy link
Owner

数据我来提供,加入观点后标记规则是否要做修改 Get Outlook for Androidhttps://aka.ms/AAb9ysg

________________________________ From: YangHeng @.> Sent: Sunday, June 6, 2021 2:59:11 PM To: yangheng95/PyABSA @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/PyABSA] 多观点的抽出是否支持? (#27) 12号后我再用新的模型验证一下,这几天出差,另外观点抽出可能模型架构要改动的,有空还请看一下,或者说当前模型架构是否支持这样的观点抽出? Get Outlook for Androidhttps://aka.ms/AAb9ysg …
________________________________ From: Tang Yong @.> Sent: Friday, June 4, 2021 7:18:13 PM To: yangheng95/pyabsa @.>; yangheng95/pyabsa @.> Cc: Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27>) 好的感谢! Get Outlook for Androidhttps://aka.ms/AAb9ysg
________________________________ From: YangHeng @.> Sent: Friday, June 4, 2021 7:17:27 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27>) 合并的意思是把四个分散的数据集全部放到一个里面,只是单纯追加吗,可否详细说一下,谢谢 Get Outlook for Androidhttps://aka.ms/AAb9ysg …
________________________________ From: YangHeng @.> Sent: Friday, June 4, 2021 6:38:12 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27><#27#27>) 本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下, [image]https://user-images.githubusercontent.com/83859417/120736527-fbda2380-c51e-11eb-94b0-c30ecea42979.png 有空格和没有空格都是一样的。 Sentence with predicted labels: 尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O) {'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'} Sentence with predicted labels: 照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O) {'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'} Sentence with predicted labels: 关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O) {'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O) {'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'} {'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'} 这是综合4个中文数据集训练的模型的结果 颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。 主要原因是将4个中文数据集合并了,数据量增多,代码已经更新,正在上传模型 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27<#27> (comment)<#27 (comment)<#27 (comment)>>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWNZFDTWARXWMBAVCNTTRCUJJANCNFSM46AW7SCQ. 就是合并所有的中文训练集和测试集作为一整个训练集和测试集,现在可以从google drive下载中文模型,读取模型之后会打印训练时的参数,其中的datasets_files就是采用的数据集 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)<#27 (comment)>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWPQDEJONX3FEGBOKIDTRCY4PANCNFSM46AW7SCQ. 改模型倒不是最大的问题, 问题是没有标注好opinion的数据集 ― You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWMACZNRK5NF6JXYGXDTRMMD7ANCNFSM46AW7SCQ.

使用IOB形式将opinion标记在数据集第4列(polarity之后),如果您使用开源数据集标注,请不要直接修改原始数据集,将重新标注的数据集重新命名上传。

@LangDaoAI
Copy link
Author

LangDaoAI commented Jun 6, 2021 via email

@yangheng95
Copy link
Owner

晚上我标记一个例子,确认后再大规模标记 Get Outlook for Androidhttps://aka.ms/AAb9ysg

________________________________ From: YangHeng @.> Sent: Sunday, June 6, 2021 4:47:36 PM To: yangheng95/PyABSA @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/PyABSA] 多观点的抽出是否支持? (#27) 数据我来提供,加入观点后标记规则是否要做修改 Get Outlook for Androidhttps://aka.ms/AAb9ysg …
________________________________ From: YangHeng @.> Sent: Sunday, June 6, 2021 2:59:11 PM To: yangheng95/PyABSA @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/PyABSA] 多观点的抽出是否支持? (#27<#27>) 12号后我再用新的模型验证一下,这几天出差,另外观点抽出可能模型架构要改动的,有空还请看一下,或者说当前模型架构是否支持这样的观点抽出? Get Outlook for Androidhttps://aka.ms/AAb9ysg …
________________________________ From: Tang Yong @.> Sent: Friday, June 4, 2021 7:18:13 PM To: yangheng95/pyabsa @.>; yangheng95/pyabsa @.> Cc: Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27><#27#27>) 好的感谢! Get Outlook for Androidhttps://aka.ms/AAb9ysg
________________________________ From: YangHeng @.> Sent: Friday, June 4, 2021 7:17:27 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27><#27#27>) 合并的意思是把四个分散的数据集全部放到一个里面,只是单纯追加吗,可否详细说一下,谢谢 Get Outlook for Androidhttps://aka.ms/AAb9ysg …
________________________________ From: YangHeng @.> Sent: Friday, June 4, 2021 6:38:12 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27><#27#27><#27#27#27#27>) 本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下, [image]https://user-images.githubusercontent.com/83859417/120736527-fbda2380-c51e-11eb-94b0-c30ecea42979.png 有空格和没有空格都是一样的。 Sentence with predicted labels: 尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O) {'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'} Sentence with predicted labels: 照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O) {'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'} Sentence with predicted labels: 关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O) {'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O) {'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'} {'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'} 这是综合4个中文数据集训练的模型的结果 颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。 主要原因是将4个中文数据集合并了,数据量增多,代码已经更新,正在上传模型 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27<#27><#27#27> (comment)<#27<#27> (comment)<#27 (comment)<#27 (comment)>>>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWNZFDTWARXWMBAVCNTTRCUJJANCNFSM46AW7SCQ. 就是合并所有的中文训练集和测试集作为一整个训练集和测试集,现在可以从google drive下载中文模型,读取模型之后会打印训练时的参数,其中的datasets_files就是采用的数据集 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27<#27> (comment)<#27 (comment)<#27 (comment)>>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWPQDEJONX3FEGBOKIDTRCY4PANCNFSM46AW7SCQ. 改模型倒不是最大的问题, 问题是没有标注好opinion的数据集 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)<#27 (comment)>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWMACZNRK5NF6JXYGXDTRMMD7ANCNFSM46AW7SCQ. 使用IOB形式将opinion标记在数据集第4列(polarity之后),如果您使用开源数据集标注,请不要直接修改原始数据集,将重新标注的数据集重新命名上传。 ― You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWMGE7XZ5WWWWQRKFJDTRMY2RANCNFSM46AW7SCQ.

这个issue我先关闭了,后面沟通就gitter上吧。数据的标注可以参照https://github.com/lixin4ever/E2E-TBSA

@LangDaoAI
Copy link
Author

LangDaoAI commented Jun 6, 2021 via email

@yangheng95
Copy link
Owner

yangheng95 commented Jun 7, 2021

好的,晚上没抽出时间,gitter沟通是啥意思 Get Outlook for Androidhttps://aka.ms/AAb9ysg

________________________________ From: YangHeng @.> Sent: Sunday, June 6, 2021 11:41:29 PM To: yangheng95/PyABSA @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/PyABSA] 多观点的抽出是否支持? (#27) 晚上我标记一个例子,确认后再大规模标记 Get Outlook for Androidhttps://aka.ms/AAb9ysg …
________________________________ From: YangHeng @.> Sent: Sunday, June 6, 2021 4:47:36 PM To: yangheng95/PyABSA @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/PyABSA] 多观点的抽出是否支持? (#27<#27>) 数据我来提供,加入观点后标记规则是否要做修改 Get Outlook for Androidhttps://aka.ms/AAb9ysg …
________________________________ From: YangHeng @.> Sent: Sunday, June 6, 2021 2:59:11 PM To: yangheng95/PyABSA @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/PyABSA] 多观点的抽出是否支持? (#27<#27><#27#27>) 12号后我再用新的模型验证一下,这几天出差,另外观点抽出可能模型架构要改动的,有空还请看一下,或者说当前模型架构是否支持这样的观点抽出? Get Outlook for Androidhttps://aka.ms/AAb9ysg …
________________________________ From: Tang Yong @.> Sent: Friday, June 4, 2021 7:18:13 PM To: yangheng95/pyabsa @.>; yangheng95/pyabsa @.> Cc: Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27><#27#27><#27#27#27#27>) 好的感谢! Get Outlook for Androidhttps://aka.ms/AAb9ysg
________________________________ From: YangHeng @.> Sent: Friday, June 4, 2021 7:17:27 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27><#27#27><#27#27#27#27>) 合并的意思是把四个分散的数据集全部放到一个里面,只是单纯追加吗,可否详细说一下,谢谢 Get Outlook for Androidhttps://aka.ms/AAb9ysg …
________________________________ From: YangHeng @.> Sent: Friday, June 4, 2021 6:38:12 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27><#27#27><#27#27#27#27><#27#27#27#27#27#27#27#27>) 本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下, [image]https://user-images.githubusercontent.com/83859417/120736527-fbda2380-c51e-11eb-94b0-c30ecea42979.png 有空格和没有空格都是一样的。 Sentence with predicted labels: 尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O) {'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'} Sentence with predicted labels: 照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O) {'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'} Sentence with predicted labels: 关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O) {'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O) {'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'} {'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'} 这是综合4个中文数据集训练的模型的结果 颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。 主要原因是将4个中文数据集合并了,数据量增多,代码已经更新,正在上传模型 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27<#27><#27#27><#27#27#27#27> (comment)<#27<#27><#27#27> (comment)<#27<#27> (comment)<#27 (comment)<#27 (comment)>>>>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWNZFDTWARXWMBAVCNTTRCUJJANCNFSM46AW7SCQ. 就是合并所有的中文训练集和测试集作为一整个训练集和测试集,现在可以从google drive下载中文模型,读取模型之后会打印训练时的参数,其中的datasets_files就是采用的数据集 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27<#27><#27#27> (comment)<#27<#27> (comment)<#27 (comment)<#27 (comment)>>>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWPQDEJONX3FEGBOKIDTRCY4PANCNFSM46AW7SCQ. 改模型倒不是最大的问题, 问题是没有标注好opinion的数据集 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27<#27> (comment)<#27 (comment)<#27 (comment)>>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWMACZNRK5NF6JXYGXDTRMMD7ANCNFSM46AW7SCQ. 使用IOB形式将opinion标记在数据集第4列(polarity之后),如果您使用开源数据集标注,请不要直接修改原始数据集,将重新标注的数据集重新命名上传。 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)<#27 (comment)>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWMGE7XZ5WWWWQRKFJDTRMY2RANCNFSM46AW7SCQ. 这个issue我先关闭了,后面沟通就gitter上吧。数据的标注可以参照https://github.com/lixin4ever/E2E-TBSA ― You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWMIHCZ2RZ3DAN7NHHTTROJKTANCNFSM46AW7SCQ.

我建了个Gitter。issue用来反馈bug和问题比较好,不适合讨论功能更新

@LangDaoAI
Copy link
Author

LangDaoAI commented Jun 7, 2021 via email

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants