- 有学习用的代码,注释详细,已经从python打包成exe
- 从两篇博客中受启发而写出的.给出他们的网址
- https://blog.csdn.net/weixin_68789096/article/details/130900608
- https://blog.csdn.net/bookssea/article/details/107309591
- 爬取知网镜像,谷歌学术镜像的文献(需要联网)
- 选择目录/文件,可以将信息写入表格文件.
- 目录是覆盖模式,文件是追加模式.覆盖--删除原有内容,写入新内容.追加--不删除原有内容,在末尾追加新内容..如果选择目录,文献信息会写入一个文件,其名为:搜索输入框的内容,后缀只支持.xlsx
- 文献列表按照年份降序排序
- 直接点击文献列表的一行,如果有链接,则会跳转链接
- 每次爬取都是从网页的第一页开始
- 可以中止爬取
- 第一个文本框是爬取日志,记录运行情况
- 第二个文本框是文献列表,可以快捷查看你想要的文献,并支持点击跳转
- 两个文本框均可随时清空