-
Notifications
You must be signed in to change notification settings - Fork 160
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
多观点的抽出是否支持? #27
Comments
支持,readme有示例 |
你指的opinion是怎么样的,能举个例子吗 |
比方说: 这款手机的大小真的很薄,但是颜色不太好看, 总体上我很满意啦。 这句评论我来做细粒度的情感分析, 那么我的目标就是: 2 总体情感 因此,这里的opinion是非常重要的, |
抱歉,这么精细的任务现在还不支持的,看后续有没有时间更新了 |
没有opinion数据的标注也是一个问题 |
本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧 |
你的这个需求更贴近实际应用层次,理论上是可以的,单需要更改模型结构的。我映像中应该有观点-情感对联合抽取研究的论文,但代码是否开源我就不清楚了 |
你说的很对,应用场景非常大 |
我先把LCF测试完并且分析完, 然后再看这些 |
三元组以上同时抽出,无论模型是怎么样的,不是为了增加一个维度而去创新性的做抽出,最终性能比较还是要退化到二元组甚至一元组来比较局部的性能,准确性, 例如, 再多维度的同时抽出如果在Aspect方面准确性都不如二元组抽出,那么肯定不是正确方向 |
是的,但是我现在有其他工作安排,所以这个特性不会很快添加,如果你有该模型的想法可以与我讨论 |
理解
Get Outlook for Android<https://aka.ms/AAb9ysg>
…________________________________
From: YangHeng ***@***.***>
Sent: Thursday, June 3, 2021 11:44:30 PM
To: yangheng95/pyabsa ***@***.***>
Cc: LangDaoAI ***@***.***>; Author ***@***.***>
Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27)
是的,但是我现在有其他工作安排,所以这个特性不会很快添加,如果你有该模型的想法可以与我讨论
―
You are receiving this because you authored the thread.
Reply to this email directly, view it on GitHub<#27 (comment)>, or unsubscribe<https://github.com/notifications/unsubscribe-auth/AT7ZPWLTZCS3OIEEAECCDWTTQ6PN5ANCNFSM46AW7SCQ>.
|
想问一下, 该LCF模型是基于Bert做Fine-tuning, Fine-tuning的部分在哪里请告知一下, 今天想理解一下这个模型架构, 您时间空了回复就可以,感谢! |
好的,我先看一下如何修复 |
OK |
知道的,我抽时间修复 |
你可以先手动把中文用空格分开测试一下 |
修复完通知你更新 |
原先的中文数据集一直是单子分开的,分布分开做情感那分类没有影响,做这个的时候没有考虑中文切分的问题 |
我做了一个测试,看一下是否可以, import re def spliteKeyWord(str): print(spliteKeyWord("Testing English text我爱Python123")) |
是哪家公司的产品?
Get Outlook for Android<https://aka.ms/AAb9ysg>
…________________________________
From: Scottish_Fold007 ***@***.***>
Sent: Friday, June 4, 2021 12:00:27 PM
To: yangheng95/pyabsa ***@***.***>
Cc: LangDaoAI ***@***.***>; Author ***@***.***>
Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27)
本身模型是否在某一个阶段可以连带把opinion带出呢,比方说,当结合aspect做极性输出的时候, 肯定有判断极性的依据, 这个依据就是opinion,那么只要把它匹配下来,或者单独抽出来后续再和aspect做关联匹配, 我觉得依然可以的,同时,数据也加入opinion的标注, 这个标注也不是很困难吧
[image]<https://user-images.githubusercontent.com/36957508/120736717-583d4300-c51f-11eb-8ecf-6aa36e8aa000.png>
是这样的结果吗?情感根据观点很容易得到
但是你这个效果和我想要的还不一样, 我想的是精细化aspects-sentiment-opinion配对输出
一一对应的三元组是吧,也可以的
[image]<https://user-images.githubusercontent.com/36957508/120740764-6cd10980-c526-11eb-9195-e6dbf292aa45.png>
嗯,很棒, 用哪个模型做的?有参考project或者资料吗
没有,生产用的,不开源
―
You are receiving this because you authored the thread.
Reply to this email directly, view it on GitHub<#27 (comment)>, or unsubscribe<https://github.com/notifications/unsubscribe-auth/AT7ZPWNK3CZSWHMI5ZYVHXLTRBFVXANCNFSM46AW7SCQ>.
|
不客气不客气
Get Outlook for Android<https://aka.ms/AAb9ysg>
…________________________________
From: YangHeng ***@***.***>
Sent: Friday, June 4, 2021 12:46:29 PM
To: yangheng95/pyabsa ***@***.***>
Cc: LangDaoAI ***@***.***>; Author ***@***.***>
Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27)
调试发现大的问题出在all_tokens,也就是分词没有分出来,见下图:
[screenshot_20210604091849419]<https://user-images.githubusercontent.com/83859417/120731663-a69a1400-c516-11eb-970e-372905602d71.png>
已经根据你给的代码修复了,谢谢贡献代码
―
You are receiving this because you authored the thread.
Reply to this email directly, view it on GitHub<#27 (comment)>, or unsubscribe<https://github.com/notifications/unsubscribe-auth/AT7ZPWPOWSKTV7742RI4DF3TRBLCLANCNFSM46AW7SCQ>.
|
下一步考虑:观点抽取如何加入模型中、模型做改动、数据标注如何考虑观点的抽取。 |
Sentence with predicted labels: 这是综合4个中文数据集训练的模型的结果 |
合并的意思是把四个分散的数据集全部放到一个里面,只是单纯追加吗,可否详细说一下,谢谢
Get Outlook for Android<https://aka.ms/AAb9ysg>
…________________________________
From: YangHeng ***@***.***>
Sent: Friday, June 4, 2021 6:38:12 PM
To: yangheng95/pyabsa ***@***.***>
Cc: LangDaoAI ***@***.***>; Author ***@***.***>
Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27)
本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下,
[image]<https://user-images.githubusercontent.com/83859417/120736527-fbda2380-c51e-11eb-94b0-c30ecea42979.png>
有空格和没有空格都是一样的。
Sentence with predicted labels:
尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O)
{'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'}
Sentence with predicted labels:
照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O)
{'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'}
Sentence with predicted labels:
关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O)
{'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'}
Sentence with predicted labels:
相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O)
{'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'}
Sentence with predicted labels:
相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O)
{'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'}
Sentence with predicted labels:
这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O)
{'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'}
{'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'}
这是综合4个中文数据集训练的模型的结果
颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。
主要原因是将4个中文数据集合并了,数据量增多,代码已经更新,正在上传模型
―
You are receiving this because you authored the thread.
Reply to this email directly, view it on GitHub<#27 (comment)>, or unsubscribe<https://github.com/notifications/unsubscribe-auth/AT7ZPWNZFDTWARXWMBAVCNTTRCUJJANCNFSM46AW7SCQ>.
|
就是合并所有的中文训练集和测试集作为一整个训练集和测试集,现在可以从google drive下载中文模型,读取模型之后会打印训练时的参数,其中的datasets_files就是采用的数据集 |
好的感谢!
Get Outlook for Android<https://aka.ms/AAb9ysg>
…________________________________
From: YangHeng ***@***.***>
Sent: Friday, June 4, 2021 7:17:27 PM
To: yangheng95/pyabsa ***@***.***>
Cc: LangDaoAI ***@***.***>; Author ***@***.***>
Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27)
合并的意思是把四个分散的数据集全部放到一个里面,只是单纯追加吗,可否详细说一下,谢谢 Get Outlook for Androidhttps://aka.ms/AAb9ysg
…
________________________________ From: YangHeng @.> Sent: Friday, June 4, 2021 6:38:12 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27>) 本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下, [image]https://user-images.githubusercontent.com/83859417/120736527-fbda2380-c51e-11eb-94b0-c30ecea42979.png 有空格和没有空格都是一样的。 Sentence with predicted labels: 尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O) {'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'} Sentence with predicted labels: 照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O) {'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'} Sentence with predicted labels: 关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O) {'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O) {'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'} {'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'} 这是综合4个中文数据集训练的模型的结果 颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。 主要原因是将4个中文数据集合并了,数据量增多,代码已经更新,正在上传模型 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)<#27 (comment)>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWNZFDTWARXWMBAVCNTTRCUJJANCNFSM46AW7SCQ.
就是合并所有的中文训练集和测试集作为一整个训练集和测试集,现在可以从google drive下载中文模型,读取模型之后会打印训练时的参数,其中的datasets_files就是采用的数据集
―
You are receiving this because you authored the thread.
Reply to this email directly, view it on GitHub<#27 (comment)>, or unsubscribe<https://github.com/notifications/unsubscribe-auth/AT7ZPWPQDEJONX3FEGBOKIDTRCY4PANCNFSM46AW7SCQ>.
|
12号后我再用新的模型验证一下,这几天出差,另外观点抽出可能模型架构要改动的,有空还请看一下,或者说当前模型架构是否支持这样的观点抽出?
Get Outlook for Android<https://aka.ms/AAb9ysg>
…________________________________
From: Tang Yong ***@***.***>
Sent: Friday, June 4, 2021 7:18:13 PM
To: yangheng95/pyabsa ***@***.***>; yangheng95/pyabsa ***@***.***>
Cc: Author ***@***.***>
Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27)
好的感谢!
Get Outlook for Android<https://aka.ms/AAb9ysg>
________________________________
From: YangHeng ***@***.***>
Sent: Friday, June 4, 2021 7:17:27 PM
To: yangheng95/pyabsa ***@***.***>
Cc: LangDaoAI ***@***.***>; Author ***@***.***>
Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27)
合并的意思是把四个分散的数据集全部放到一个里面,只是单纯追加吗,可否详细说一下,谢谢 Get Outlook for Androidhttps://aka.ms/AAb9ysg
…
________________________________ From: YangHeng @.> Sent: Friday, June 4, 2021 6:38:12 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27>) 本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下, [image]https://user-images.githubusercontent.com/83859417/120736527-fbda2380-c51e-11eb-94b0-c30ecea42979.png 有空格和没有空格都是一样的。 Sentence with predicted labels: 尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O) {'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'} Sentence with predicted labels: 照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O) {'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'} Sentence with predicted labels: 关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O) {'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O) {'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'} {'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'} 这是综合4个中文数据集训练的模型的结果 颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。 主要原因是将4个中文数据集合并了,数据量增多,代码已经更新,正在上传模型 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)<#27 (comment)>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWNZFDTWARXWMBAVCNTTRCUJJANCNFSM46AW7SCQ.
就是合并所有的中文训练集和测试集作为一整个训练集和测试集,现在可以从google drive下载中文模型,读取模型之后会打印训练时的参数,其中的datasets_files就是采用的数据集
―
You are receiving this because you authored the thread.
Reply to this email directly, view it on GitHub<#27 (comment)>, or unsubscribe<https://github.com/notifications/unsubscribe-auth/AT7ZPWPQDEJONX3FEGBOKIDTRCY4PANCNFSM46AW7SCQ>.
|
改模型倒不是最大的问题, 问题是没有标注好opinion的数据集 |
数据我来提供,加入观点后标记规则是否要做修改
Get Outlook for Android<https://aka.ms/AAb9ysg>
…________________________________
From: YangHeng ***@***.***>
Sent: Sunday, June 6, 2021 2:59:11 PM
To: yangheng95/PyABSA ***@***.***>
Cc: LangDaoAI ***@***.***>; Author ***@***.***>
Subject: Re: [yangheng95/PyABSA] 多观点的抽出是否支持? (#27)
12号后我再用新的模型验证一下,这几天出差,另外观点抽出可能模型架构要改动的,有空还请看一下,或者说当前模型架构是否支持这样的观点抽出? Get Outlook for Androidhttps://aka.ms/AAb9ysg
…
________________________________ From: Tang Yong @.> Sent: Friday, June 4, 2021 7:18:13 PM To: yangheng95/pyabsa @.>; yangheng95/pyabsa @.> Cc: Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27>) 好的感谢! Get Outlook for Androidhttps://aka.ms/AAb9ysg
________________________________ From: YangHeng @.> Sent: Friday, June 4, 2021 7:17:27 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27>) 合并的意思是把四个分散的数据集全部放到一个里面,只是单纯追加吗,可否详细说一下,谢谢 Get Outlook for Androidhttps://aka.ms/AAb9ysg …
________________________________ From: YangHeng @.> Sent: Friday, June 4, 2021 6:38:12 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>>) 本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下, [image]https://user-images.githubusercontent.com/83859417/120736527-fbda2380-c51e-11eb-94b0-c30ecea42979.png 有空格和没有空格都是一样的。 Sentence with predicted labels: 尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O) {'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'} Sentence with predicted labels: 照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O) {'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'} Sentence with predicted labels: 关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O) {'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O) {'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'} {'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'} 这是综合4个中文数据集训练的模型的结果 颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。 主要原因是将4个中文数据集合并了,数据量增多,代码已经更新,正在上传模型 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27<#27> (comment)<#27 (comment)<#27 (comment)>>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWNZFDTWARXWMBAVCNTTRCUJJANCNFSM46AW7SCQ. 就是合并所有的中文训练集和测试集作为一整个训练集和测试集,现在可以从google drive下载中文模型,读取模型之后会打印训练时的参数,其中的datasets_files就是采用的数据集 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)<#27 (comment)>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWPQDEJONX3FEGBOKIDTRCY4PANCNFSM46AW7SCQ.
改模型倒不是最大的问题, 问题是没有标注好opinion的数据集
―
You are receiving this because you authored the thread.
Reply to this email directly, view it on GitHub<#27 (comment)>, or unsubscribe<https://github.com/notifications/unsubscribe-auth/AT7ZPWMACZNRK5NF6JXYGXDTRMMD7ANCNFSM46AW7SCQ>.
|
使用IOB形式将opinion标记在数据集第4列(polarity之后),如果您使用开源数据集标注,请不要直接修改原始数据集,将重新标注的数据集重新命名上传。 |
晚上我标记一个例子,确认后再大规模标记
Get Outlook for Android<https://aka.ms/AAb9ysg>
…________________________________
From: YangHeng ***@***.***>
Sent: Sunday, June 6, 2021 4:47:36 PM
To: yangheng95/PyABSA ***@***.***>
Cc: LangDaoAI ***@***.***>; Author ***@***.***>
Subject: Re: [yangheng95/PyABSA] 多观点的抽出是否支持? (#27)
数据我来提供,加入观点后标记规则是否要做修改 Get Outlook for Androidhttps://aka.ms/AAb9ysg
…
________________________________ From: YangHeng @.> Sent: Sunday, June 6, 2021 2:59:11 PM To: yangheng95/PyABSA @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/PyABSA] 多观点的抽出是否支持? (#27<#27>) 12号后我再用新的模型验证一下,这几天出差,另外观点抽出可能模型架构要改动的,有空还请看一下,或者说当前模型架构是否支持这样的观点抽出? Get Outlook for Androidhttps://aka.ms/AAb9ysg …
________________________________ From: Tang Yong @.> Sent: Friday, June 4, 2021 7:18:13 PM To: yangheng95/pyabsa @.>; yangheng95/pyabsa @.> Cc: Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>>) 好的感谢! Get Outlook for Androidhttps://aka.ms/AAb9ysg
________________________________ From: YangHeng @.> Sent: Friday, June 4, 2021 7:17:27 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>>) 合并的意思是把四个分散的数据集全部放到一个里面,只是单纯追加吗,可否详细说一下,谢谢 Get Outlook for Androidhttps://aka.ms/AAb9ysg …
________________________________ From: YangHeng @.> Sent: Friday, June 4, 2021 6:38:12 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>><#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>>) 本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下, [image]https://user-images.githubusercontent.com/83859417/120736527-fbda2380-c51e-11eb-94b0-c30ecea42979.png 有空格和没有空格都是一样的。 Sentence with predicted labels: 尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O) {'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'} Sentence with predicted labels: 照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O) {'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'} Sentence with predicted labels: 关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O) {'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O) {'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'} {'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'} 这是综合4个中文数据集训练的模型的结果 颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。 主要原因是将4个中文数据集合并了,数据量增多,代码已经更新,正在上传模型 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>> (comment)<#27<#27> (comment)<#27 (comment)<#27 (comment)>>>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWNZFDTWARXWMBAVCNTTRCUJJANCNFSM46AW7SCQ. 就是合并所有的中文训练集和测试集作为一整个训练集和测试集,现在可以从google drive下载中文模型,读取模型之后会打印训练时的参数,其中的datasets_files就是采用的数据集 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27<#27> (comment)<#27 (comment)<#27 (comment)>>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWPQDEJONX3FEGBOKIDTRCY4PANCNFSM46AW7SCQ. 改模型倒不是最大的问题, 问题是没有标注好opinion的数据集 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)<#27 (comment)>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWMACZNRK5NF6JXYGXDTRMMD7ANCNFSM46AW7SCQ.
使用IOB形式将opinion标记在数据集第4列(polarity之后),如果您使用开源数据集标注,请不要直接修改原始数据集,将重新标注的数据集重新命名上传。
―
You are receiving this because you authored the thread.
Reply to this email directly, view it on GitHub<#27 (comment)>, or unsubscribe<https://github.com/notifications/unsubscribe-auth/AT7ZPWMGE7XZ5WWWWQRKFJDTRMY2RANCNFSM46AW7SCQ>.
|
这个issue我先关闭了,后面沟通就gitter上吧。数据的标注可以参照https://github.com/lixin4ever/E2E-TBSA |
好的,晚上没抽出时间,gitter沟通是啥意思
Get Outlook for Android<https://aka.ms/AAb9ysg>
…________________________________
From: YangHeng ***@***.***>
Sent: Sunday, June 6, 2021 11:41:29 PM
To: yangheng95/PyABSA ***@***.***>
Cc: LangDaoAI ***@***.***>; Author ***@***.***>
Subject: Re: [yangheng95/PyABSA] 多观点的抽出是否支持? (#27)
晚上我标记一个例子,确认后再大规模标记 Get Outlook for Androidhttps://aka.ms/AAb9ysg
…
________________________________ From: YangHeng @.> Sent: Sunday, June 6, 2021 4:47:36 PM To: yangheng95/PyABSA @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/PyABSA] 多观点的抽出是否支持? (#27<#27>) 数据我来提供,加入观点后标记规则是否要做修改 Get Outlook for Androidhttps://aka.ms/AAb9ysg …
________________________________ From: YangHeng @.> Sent: Sunday, June 6, 2021 2:59:11 PM To: yangheng95/PyABSA @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/PyABSA] 多观点的抽出是否支持? (#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>>) 12号后我再用新的模型验证一下,这几天出差,另外观点抽出可能模型架构要改动的,有空还请看一下,或者说当前模型架构是否支持这样的观点抽出? Get Outlook for Androidhttps://aka.ms/AAb9ysg …
________________________________ From: Tang Yong @.> Sent: Friday, June 4, 2021 7:18:13 PM To: yangheng95/pyabsa @.>; yangheng95/pyabsa @.> Cc: Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>><#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>>) 好的感谢! Get Outlook for Androidhttps://aka.ms/AAb9ysg
________________________________ From: YangHeng @.> Sent: Friday, June 4, 2021 7:17:27 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>><#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>>) 合并的意思是把四个分散的数据集全部放到一个里面,只是单纯追加吗,可否详细说一下,谢谢 Get Outlook for Androidhttps://aka.ms/AAb9ysg …
________________________________ From: YangHeng @.> Sent: Friday, June 4, 2021 6:38:12 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>><#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>><#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>>) 本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下, [image]https://user-images.githubusercontent.com/83859417/120736527-fbda2380-c51e-11eb-94b0-c30ecea42979.png 有空格和没有空格都是一样的。 Sentence with predicted labels: 尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O) {'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'} Sentence with predicted labels: 照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O) {'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'} Sentence with predicted labels: 关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O) {'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O) {'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'} {'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'} 这是综合4个中文数据集训练的模型的结果 颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。 主要原因是将4个中文数据集合并了,数据量增多,代码已经更新,正在上传模型 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>><#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>> (comment)<#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>> (comment)<#27<#27> (comment)<#27 (comment)<#27 (comment)>>>>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWNZFDTWARXWMBAVCNTTRCUJJANCNFSM46AW7SCQ. 就是合并所有的中文训练集和测试集作为一整个训练集和测试集,现在可以从google drive下载中文模型,读取模型之后会打印训练时的参数,其中的datasets_files就是采用的数据集 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>> (comment)<#27<#27> (comment)<#27 (comment)<#27 (comment)>>>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWPQDEJONX3FEGBOKIDTRCY4PANCNFSM46AW7SCQ. 改模型倒不是最大的问题, 问题是没有标注好opinion的数据集 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27<#27> (comment)<#27 (comment)<#27 (comment)>>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWMACZNRK5NF6JXYGXDTRMMD7ANCNFSM46AW7SCQ. 使用IOB形式将opinion标记在数据集第4列(polarity之后),如果您使用开源数据集标注,请不要直接修改原始数据集,将重新标注的数据集重新命名上传。 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)<#27 (comment)>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWMGE7XZ5WWWWQRKFJDTRMY2RANCNFSM46AW7SCQ.
这个issue我先关闭了,后面沟通就gitter上吧。数据的标注可以参照https://github.com/lixin4ever/E2E-TBSA
―
You are receiving this because you authored the thread.
Reply to this email directly, view it on GitHub<#27 (comment)>, or unsubscribe<https://github.com/notifications/unsubscribe-auth/AT7ZPWMIHCZ2RZ3DAN7NHHTTROJKTANCNFSM46AW7SCQ>.
|
我建了个Gitter。issue用来反馈bug和问题比较好,不适合讨论功能更新 |
好的
Get Outlook for Android<https://aka.ms/AAb9ysg>
…________________________________
From: YangHeng ***@***.***>
Sent: Monday, June 7, 2021 11:27:10 AM
To: yangheng95/PyABSA ***@***.***>
Cc: LangDaoAI ***@***.***>; Author ***@***.***>
Subject: Re: [yangheng95/PyABSA] 多观点的抽出是否支持? (#27)
好的,晚上没抽出时间,gitter沟通是啥意思 Get Outlook for Androidhttps://aka.ms/AAb9ysg
…
________________________________ From: YangHeng @.> Sent: Sunday, June 6, 2021 11:41:29 PM To: yangheng95/PyABSA @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/PyABSA] 多观点的抽出是否支持? (#27<#27>) 晚上我标记一个例子,确认后再大规模标记 Get Outlook for Androidhttps://aka.ms/AAb9ysg …
________________________________ From: YangHeng @.> Sent: Sunday, June 6, 2021 4:47:36 PM To: yangheng95/PyABSA @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/PyABSA] 多观点的抽出是否支持? (#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>>) 数据我来提供,加入观点后标记规则是否要做修改 Get Outlook for Androidhttps://aka.ms/AAb9ysg …
________________________________ From: YangHeng @.> Sent: Sunday, June 6, 2021 2:59:11 PM To: yangheng95/PyABSA @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/PyABSA] 多观点的抽出是否支持? (#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>><#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>>) 12号后我再用新的模型验证一下,这几天出差,另外观点抽出可能模型架构要改动的,有空还请看一下,或者说当前模型架构是否支持这样的观点抽出? Get Outlook for Androidhttps://aka.ms/AAb9ysg …
________________________________ From: Tang Yong @.> Sent: Friday, June 4, 2021 7:18:13 PM To: yangheng95/pyabsa @.>; yangheng95/pyabsa @.> Cc: Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>><#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>><#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>>) 好的感谢! Get Outlook for Androidhttps://aka.ms/AAb9ysg
________________________________ From: YangHeng @.> Sent: Friday, June 4, 2021 7:17:27 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>><#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>><#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>>) 合并的意思是把四个分散的数据集全部放到一个里面,只是单纯追加吗,可否详细说一下,谢谢 Get Outlook for Androidhttps://aka.ms/AAb9ysg …
________________________________ From: YangHeng @.> Sent: Friday, June 4, 2021 6:38:12 PM To: yangheng95/pyabsa @.> Cc: LangDaoAI @.>; Author @.> Subject: Re: [yangheng95/pyabsa] 多观点的抽出是否支持? (#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>><#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>><#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>><#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>>) 本地替换了方法做了测试,如下图,切词没有问题, 但是BIOE标注(红框:颜色,aspect只抽取了颜)好像有点问题,请看一下, [image]https://user-images.githubusercontent.com/83859417/120736527-fbda2380-c51e-11eb-94b0-c30ecea42979.png 有空格和没有空格都是一样的。 Sentence with predicted labels: 尤(O) 其(O) 是(O) 照(O) 的(O) 大(O) 尺(O) 寸(O) 照(O) 片(O) 时(O) 效(B-ASP) 果(I-ASP) 也(O) 是(O) 非(O) 常(O) 不(O) 错(O) 的(O) {'aspect': '效 果', 'position': '11,12', 'sentiment': 'Good'} Sentence with predicted labels: 照(O) 大(O) 尺(O) 寸(O) 的(O) 照(O) 片(O) 的(O) 时(O) 候(O) 手(O) 机(O) 反(O) 映(O) 速(B-ASP) 度(I-ASP) 太(O) 慢(O) {'aspect': '速 度', 'position': '14,15', 'sentiment': 'Bad'} Sentence with predicted labels: 关(O) 键(O) 的(O) 时(O) 候(O) 需(O) 要(O) 表(O) 现(O) 持(O) 续(O) 影(O) 像(O) 的(O) 短(O) 片(O) 功(B-ASP) 能(I-ASP) 还(O) 是(O) 很(O) 有(O) 用(O) 的(O) {'aspect': '功 能', 'position': '16,17', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 相(O) 比(O) 较(O) 原(O) 系(O) 列(O) 锐(B-ASP) 度(I-ASP) 高(O) 了(O) 不(O) 少(O) 这(O) 一(O) 点(O) 好(O) 与(O) 不(O) 好(O) 大(O) 家(O) 有(O) 争(O) 议(O) {'aspect': '锐 度', 'position': '6,7', 'sentiment': 'Good'} Sentence with predicted labels: 这(O) 款(O) 手(O) 机(O) 的(O) 大(B-ASP) 小(I-ASP) 真(O) 的(O) 很(O) 薄(O) ,(O) 但(O) 是(O) 颜(B-ASP) 色(I-ASP) 不(O) 太(O) 好(O) 看(O) ,(O) 总(O) 体(O) 上(O) 我(O) 很(O) 满(O) 意(O) 啦(O) 。(O) {'aspect': '大 小', 'position': '5,6', 'sentiment': 'Bad'} {'aspect': '颜 色', 'position': '14,15', 'sentiment': 'Bad'} 这是综合4个中文数据集训练的模型的结果 颜色问题不知道是如何解决的,还是说模型做了更新还是数据量做了增强,很想知道, 另外, 新的代码构建的模型空了也帮忙上传一下, 我来做更新测试。 主要原因是将4个中文数据集合并了,数据量增多,代码已经更新,正在上传模型 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>><#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>><#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>> (comment)<#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>><#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>> (comment)<#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>> (comment)<#27<#27> (comment)<#27 (comment)<#27 (comment)>>>>>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWNZFDTWARXWMBAVCNTTRCUJJANCNFSM46AW7SCQ. 就是合并所有的中文训练集和测试集作为一整个训练集和测试集,现在可以从google drive下载中文模型,读取模型之后会打印训练时的参数,其中的datasets_files就是采用的数据集 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>><#27<https://github.com/yangheng95/PyABSA/issues/27>#27<https://github.com/yangheng95/PyABSA/issues/27>> (comment)<#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>> (comment)<#27<#27> (comment)<#27 (comment)<#27 (comment)>>>>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWPQDEJONX3FEGBOKIDTRCY4PANCNFSM46AW7SCQ. 改模型倒不是最大的问题, 问题是没有标注好opinion的数据集 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27<#27><#27<https://github.com/yangheng95/PyABSA/issues/27>> (comment)<#27<#27> (comment)<#27 (comment)<#27 (comment)>>>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWMACZNRK5NF6JXYGXDTRMMD7ANCNFSM46AW7SCQ. 使用IOB形式将opinion标记在数据集第4列(polarity之后),如果您使用开源数据集标注,请不要直接修改原始数据集,将重新标注的数据集重新命名上传。 D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27<#27> (comment)<#27 (comment)<#27 (comment)>>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWMGE7XZ5WWWWQRKFJDTRMY2RANCNFSM46AW7SCQ. 这个issue我先关闭了,后面沟通就gitter上吧。数据的标注可以参照https://github.com/lixin4ever/E2E-TBSA D You are receiving this because you authored the thread. Reply to this email directly, view it on GitHub<#27 (comment)<#27 (comment)>>, or unsubscribehttps://github.com/notifications/unsubscribe-auth/AT7ZPWMIHCZ2RZ3DAN7NHHTTROJKTANCNFSM46AW7SCQ.
我建了个Gitter讨论组,https://gitter.im/PyABSA/community?utm_source=badge&utm_medium=badge&utm_campaign=pr-badge。issue用来反馈bug和问题比较好,不适合讨论功能更新<https://gitter.im/PyABSA/community?utm_source=badge&utm_medium=badge&utm_campaign=pr-badge%E3%80%82issue%E7%94%A8%E6%9D%A5%E5%8F%8D%E9%A6%88bug%E5%92%8C%E9%97%AE%E9%A2%98%E6%AF%94%E8%BE%83%E5%A5%BD%EF%BC%8C%E4%B8%8D%E9%80%82%E5%90%88%E8%AE%A8%E8%AE%BA%E5%8A%9F%E8%83%BD%E6%9B%B4%E6%96%B0>
―
You are receiving this because you authored the thread.
Reply to this email directly, view it on GitHub<#27 (comment)>, or unsubscribe<https://github.com/notifications/unsubscribe-auth/AT7ZPWOKGI62ELY7FTJUXHDTRQ4A5ANCNFSM46AW7SCQ>.
|
确认一下多观点的抽出是否支持, 或者提供一些参考,以及一些ideas。
The text was updated successfully, but these errors were encountered: