Zotero translators 中文维护小组

目前 Zotero 中有许多抓取中文学术网站的插件，这些插件有些已经非常老旧，缺少及时的维护。希望能在这里召集一些志同道合的朋友，共同维护中文学术或其他类型网站的抓取插件。如果 Github 下载速度慢，可以试试 Gitee

🎯 目标网站

知网或知网海外 -> CNKI.js Update: 20210129
- 搜索页面PDF附件下载
- 期刊详细页面的信息收集
- 文章格式都为PDF，学位论文的CAJ链接已经替换为PDF，注意学位论文的PDF应该是没有目录信息的。如何设置拆分姓名，保留CAJ格式
- 修改旧版本将知网导出refworks中CN字段保存为期刊条目中的 call number，修改后CN字段不保留
- 修改了拉取知网refworks格式引文的网址，新网址提供的摘要字数最多为500字
- 知网海外版PDF和CAJ附件下载支持
- 支持文献类型：期刊，学位论文，会议论文，报纸，修改知网refworks会议论文类型错误的问题
- 保存文献DOI，引用次数，中文核心期刊信息
- 已同步到官方版本库中
万方数据 -> Wanfang Data.js Update: 20200930
- 抓取引文信息
- 支持文献类型：期刊，学位论文，专利，会议论文
- PDF附件下载
皮书数据库 -> Pishu Data.js
- 抓取引文信息
- 支持文献类型：报告（记录为bookSection）、图书
维普 -> WeiPu.js ❗
- 抓取引文信息
- 支持文献类型：期刊
- PDF附件下载
百度学术 -> Baidu Scholar.js
- 修复抓取图书时错误
- 修复中文作者姓，名问题
谷粉学术-谷歌学术 -> GFSOSO.js
- 修改了网页匹配，识别抓取代码抄自Google Scholar。从搜索结果页识别搜索结果，引文信息正常
- 部分文献的PDF下载可能会有问题，谷粉搜搜上可能没有相应的下载链接
- 安装Adblock插件的朋友请注意下将谷粉学术*.glgoo.top添加到白名单，不然可能会出现问题
专利搜索网站Soopat -> Snnopat.js
- 搜索页面和单个专利页面信息抓取
- PDF附件下载（需要登录，网站验证码可能会导致PDF下载失败）
国家图书馆文津搜索 -> Wenjin.js
- 抓取引文信息
- 支持文献类型：图书，论文
国家版本馆版权数字中心 -> Publications Data Center - China.js
- 抓取引文信息
- 多条目导出
国家科技图书文献中心 -> NSTL.js
- 抓取引文信息
- 支持期刊论文、学位论文、会议论文、图书章节、文集、标准、专利
ProQuest 学位论文全文检索平台 -> ProQuestCN Thesis.js
- 抓取引文信息
- 支持文献类型：学位论文
- PDF附件下载（需要账号或者IP具有下载权限）
中国科学院科技论文预发布平台 -> ChinaXiv.js
- 抓取引文信息
- PDF附件下载
专利之星 -> PatentStar.js
- 抓取专利引文信息
- PDF附件下载（需要注册账号）
微信公众号 -> Weixin.js
- 抓取网页引文信息
- 公众号内容保存为笔记形式(仅保留文本)
知乎 -> Zhihu.js
- 抓取知乎回答与专栏
- 文章内容保存于笔记中
读秀 -> Duxiu.js
- 读秀内容抓取
超星期刊 -> chaoxingqikan.js
- 抓取引文信息
- PDF附件下载（需要帐号或者IP具有下载权限）
豆瓣 -> DouBan.js
- 保留豆瓣评价人数+豆瓣评分+原作名+定价
- 作者优化：欧美作者区分开了名与姓（在这里吐槽下豆瓣编辑对作者的命名规范，尤其是外籍作者的命名规范真是各路牛鬼蛇神）
- 目录信息：目录存放至note附件里
- 支持识别豆瓣阅读的出版图书（因为不像豆瓣读书那么规则，部分字段可能需要手动修改）
国家出版发行信息公共服务平台 -> CCPINFO
- 抓取引文信息
- 匹配出版地址
玛格泰克 -> MagTech.js
- 支持大部分国内期刊（不一定是中文期刊）
- 支持大部分期刊首页或搜索页面的多条目抓取
勤云科技 -> E-Tiller
- 支持最新、次新版的勤云科技期刊网站
- 对照meta标签补全导出结果
仁和汇智 -> RHHZ.js
- 抓取引文信息
- 支持单条目
- 支持多条目
- PDF附件下载
全国报刊索引 -> CNBKSY
- 抓取引文信息
- 支持单条目
- 支持多条目
来自道格学社仓库的翻译器
- Bilibili 视频网站
- 当当网图书
- 京东图书
- 国家哲学社会科学文献中心
- 国家图书馆 - 中国标准在线服务网
- 中国标准在线服务网

📢 如何使用

👉 无聊的视频教程图文教程 👇 1 下载网页翻译器(web translator)文件

2 解压下载的压缩包，将根目录（原为translators目录）中的所有.js文件复制到 Zotero 的 translators 目录

3 更新 translator 信息，Firefox 和 Chrome 浏览器操作类似。下面以 Firefox 为例

Chrome 浏览器按照下面信息找到更新按钮

更新时请多点几下，根据我的经验，Chrome 浏览器更新比较快，Firefox 会比较慢，也可多重启几次 Zotero 或浏览器

最新版的知网翻译器，能够识别VPN之后的知网，不必做额外的设置，如有问题可提交 issue

🍇 如何在Zotero Connector 中添加中文姓名处理以及保留知网CAJ格式文件的设置

需要特别注意的是，这里在 Zotero Connector 中添加的参数，只是方便控制的网页翻译器的数据抓取行为，限本页面列出的一些翻译器中起作用，并不影响其他翻译器和Zotero的其他功能。添加的参数有：

translators.zhnamesplit，默认为true，抓取过程会拆分姓和名，如果想全并姓名，请设置为false
translators.CNKIPDF,默认为true，下载知网上文章的PDF文件，如果想要下载学位论文的CAJ格式，请设置为false

设置方法请参考下面：

为防止设置错误，可以把参数名复制过去。设置完成后，请刷新网页，再重新抓取。如果你参数名写错了也没事，不会有什么问题，放着就好。

📄 相关材料

在开始创建前，浏览下面这些材料可以帮你了解一些创建 translator 的基本知识和开发的工具。

Zotero 文档教你写 translator
Zotero JavaScript API
Translator 中可能用到的函数
Wiki-Create translator，了解基本HTML结构，CSS选择器，javascript基本语法等
refworks 引文格式，有些学术网站可以将引文导出为 refworks 格式
Scaffold 使用说明，官方出品，便于创建 translator 的工具
MDN Javascript 中文教程
Zotero 条目类型说明
How to write a Zotero translator

🦸 其他热心参与者

@jiaojiaodubai @wanyzh
@smilevent
@Lemmingh
@Captain2021 (啊哈船长)
道格学社及学员Felix、018

🎈问题交流

如果有问题的，可以加QQ群 913637964，一起交流。

Name		Name	Last commit message	Last commit date
Latest commit History 778 Commits
.ci		.ci
.github		.github
data		data
.editorconfig		.editorconfig
.eslintrc		.eslintrc
.gitignore		.gitignore
Baidu Baike.js		Baidu Baike.js
Baidu Scholar.js		Baidu Scholar.js
BibTeX.js		BibTeX.js
BiliBili.js		BiliBili.js
CCPINFO.js		CCPINFO.js
CNBKSY.js		CNBKSY.js
CNKI.js		CNKI.js
China Judgements Online.js		China Judgements Online.js
ChinaXiv.js		ChinaXiv.js
Cubox.js		Cubox.js
Dangdang.js		Dangdang.js
Douban.js		Douban.js
Duxiu.js		Duxiu.js
E-Tiller.js		E-Tiller.js
Encyclopedia of China 3rd.js		Encyclopedia of China 3rd.js
GFSOSO.js		GFSOSO.js
Jd.js		Jd.js
LICENSE		LICENSE
MagTech.js		MagTech.js
National Public Service Platform for Standards Information - China.js		National Public Service Platform for Standards Information - China.js
National Science and Technology Library - China.js		National Science and Technology Library - China.js
National Standards Open System - China.js		National Standards Open System - China.js
Ncpssd.js		Ncpssd.js
Nlc.cn.js		Nlc.cn.js
PKULaw.js		PKULaw.js
PatentStar.js		PatentStar.js
People's Daily Database.js		People's Daily Database.js
People's Daily Epaper.js		People's Daily Epaper.js
People's Daily Online.js		People's Daily Online.js
Pishu Data.js		Pishu Data.js
ProQuestCN Thesis.js		ProQuestCN Thesis.js
PubScholar.js		PubScholar.js
Publications Data Center - China.js		Publications Data Center - China.js
QStheory.js		QStheory.js
README.md		README.md
RHHZ.js		RHHZ.js
RefWorks Tagged.js		RefWorks Tagged.js
SKCTK.js		SKCTK.js
Soopat.js		Soopat.js
Spc.org.cn.js		Spc.org.cn.js
SuperLib.js		SuperLib.js
Wanfang Data.js		Wanfang Data.js
WeiPu.js		WeiPu.js
Weixin.js		Weixin.js
Wenjin.js		Wenjin.js
Xinhuanet.js		Xinhuanet.js
Zhihu.js		Zhihu.js
chaoxingqikan.js		chaoxingqikan.js
deleted.txt		deleted.txt
dpaper.js		dpaper.js
index.d.ts		index.d.ts
metadata.py		metadata.py
package.json		package.json
xiaoyuzhoufm.js		xiaoyuzhoufm.js

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Zotero translators 中文维护小组

🎯 目标网站

📢 如何使用

🍇 如何在Zotero Connector 中添加中文姓名处理以及保留知网CAJ格式文件的设置

📄 相关材料

🦸 其他热心参与者

🎈问题交流

About

Releases

Packages

Languages

License

doubanchan/translators_CN

Folders and files

Latest commit

History

Repository files navigation

Zotero translators 中文维护小组

🎯 目标网站

📢 如何使用

🍇 如何在Zotero Connector 中添加中文姓名处理以及保留知网CAJ格式文件的设置

📄 相关材料

🦸 其他热心参与者

🎈问题交流

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages