-
Notifications
You must be signed in to change notification settings - Fork 51
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
WDC-Dialogue数据来源问题 #27
Comments
主要有微博的转发和评论、豆瓣小组、百度贴吧和知乎问答等。采集的时候我们是直接采集的,没有设定关键词。 |
您好,请问原始未处理的数据可以提供吗? |
抱歉,发布原始数据并不在我们的近期计划之中。 |
请问签订数据协议申请也不可以吗? |
数据协议的问题可以咨询 aihuang@tsinghua.edu.cn |
好的,谢谢 |
@t1101675 昨天下午jiangliqin@migu.cn 已向 aihuang@tsinghua.edu.cn 发送咨询邮件,暂时未收到回应,请帮忙确认下,谢谢! |
您好,感谢你们的工作! |
我们选取了有中文的字幕;我们尽可能选择了通用题材的小说;两者所占数据总量约10%;数据开放问题同上。 |
请问,小说的对话数据你们是怎么做处理的? |
您好,paper中提到WDC-Dialogue数据分别来源于社交平台的转发、网站论坛的评论转发、问答交流,请问能再分别详细说明下分别在哪些网站中通过什么方式采集的吗?
比如zhihu平台是什么入口,或者什么关键词搜索相关数据?
对这部分工作比较感兴趣,请帮忙说明下,谢谢~
The text was updated successfully, but these errors were encountered: