Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

WeiPu.js 无ISSN #70

Closed
pixiandouban opened this issue Jan 26, 2022 · 7 comments
Closed

WeiPu.js 无ISSN #70

pixiandouban opened this issue Jan 26, 2022 · 7 comments

Comments

@pixiandouban
Copy link

pixiandouban commented Jan 26, 2022

WeiPu.js 的 testcase 中无ISSN,实际抓取也没有获得。

@yfdyh000
Copy link
Contributor

yfdyh000 commented Jan 6, 2023

@pixiandouban 保存哪种页面?期刊文章好像本就不显示ISSN。
http://qikan.cqvip.com/Qikan/Journal/Summary?gch=96305X 这种的期刊信息页面?但是否没有合适的条目类型。

@pixiandouban
Copy link
Author

@yfdyh000 有无ISSN问题不大,只是此处提到了

var issn = journal.getElementsByTagName('ISSN')[0];
if (issn.childlNodes) {
newItem.ISSN = issn.childNodes[0].nodeValue;
}

@yfdyh000
Copy link
Contributor

yfdyh000 commented Jan 9, 2023

这个ISSN是getRefByID从搜索结果的“导出题录”中获取,响应中有ISSN。但功能或许有问题了。

@pixiandouban
Copy link
Author

Refworks 格式导出页

@jiaojiaodubai
Copy link
Collaborator

原来的接口似乎已经失效了,我重写了整个脚本,包括ISSN在内的基本信息已经可以正常抓取了,但是我没有维普的帐号,希望 @yfdyh000 可以完善一下。
我重写的分支:
WeiPu.js

@yfdyh000
Copy link
Contributor

原来的接口似乎已经失效了,我重写了整个脚本,包括ISSN在内的基本信息已经可以正常抓取了,但是我没有维普的帐号,希望 @yfdyh000 可以完善一下。 我重写的分支: WeiPu.js

yfdyh000@485a6eb 完成,可以下载PDF了。

@jiaojiaodubai
Copy link
Collaborator

@hujie12306 @56125a @yzy1228682367 @l0o0

经测试,(#173 ) (#90) 有关的问题已经在 485a6eb 解决。

不过有一点需要注意,维普的网页打开后长时间没有操作(实测大概是10分钟),服务器会拒绝导出条目信息的POST请求,估计跟Record、LogBehavior这两个请求有关,要在Translator中模拟相应的过程太困难了,推荐的做法是:

如果抓取到的条目在extra字段有debugMsg,请刷新网页后重新抓取。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants