Skip to content

Latest commit

 

History

History
321 lines (253 loc) · 20.1 KB

update.md

File metadata and controls

321 lines (253 loc) · 20.1 KB

#1.7.3.7版更新说明 0. 在电子书开始处添加了目录,方便进行查阅

  1. 美化电子书样式
  2. 修改问题/答案/文章集锦的默认文件名,使用其内网页标题作为文件名
  3. 调整代码结构,终于把RawBook的名字给改掉了!(45°抬头望天)

#1.7.3.6版更新说明 0. 感谢@五娃的捐赠

  1. 修复了一处由于br过多导致解析失败的bug
  2. 部分解决由于知乎全站迁移至https后导致的429错误

#1.7.3.5版更新说明 0. 修复一处由于opf属性设置错误导致epub无法打开的bug

  1. 简单调整了电子书的样式

#1.7.3.4版更新说明 0. 修复一处由于代码编写失误导致程序崩溃的bug

  1. 修复一处由于知乎站内数据不同步导致异常退出的bug
  2. 简单调整了下电子书样式(统一背景色,调整信息表格显示方式)
  3. 修复一处作者信息抓取不全的bug
  4. 更新epub库代码,将epub库从项目中独立了出来,如果有其他要生成epub的python程序的话将源码拷走即可使用

#1.7.3.3版更新说明 0. 修复一处抓取时会导致程序崩溃的bug

  1. 修复一处由于图片下载不全导致程序崩溃的bug
  2. 重构epub生成模块,调整代码结构
  3. 大幅度优化电子书样式
  4. 考虑到实际情况,把图片超时时间调回10s,尽量减短等待时间,增强用户体验

#1.7.3.2版更新说明 0. 修复div.question-info下浮动方向错误,并将文字颜色设置为白色,以方便阅读

  1. 修复parser里的几处错误,现在在碰见被屏蔽的答案不会再报错退出了
  2. 将控制器单独抽取出来,并建立了debug模式,方便日后调试
  3. 修复tex图片bug,现在可以正常下载tex图片了
  4. 修复输出为单张网页时文本块内会丢失换行样式的问题
  5. 将图片下载超时时间从原先的10s调整至20s,以方便知乎服务器生成tex图片
  6. 删除了标签,避免了在部分阅读器上图片会显示两次的问题
  7. 删除了一处会引发bug的报错语句
  8. 修复了一处由于文件名过长引发的bug

#1.7.3.1版更新说明 0. 添加了输出为单张html网页的功能,用kindle的同学有福了

  1. 修复了不能在中文路径下使用的bug(汗- -)
  2. 修复了生成的电子书中没有目录的bug
  3. 美化了下电子书在电脑上浏览时的样式,以后在电脑上的样式争取向知乎周刊看齐(PS:多看貌似不支持css,无语- -)
  4. 调整了随机输出的文件名,由秒数改成了当前日期,让文件名更友好一点
  5. 更新readme,增加了对设置项的说明

#1.7.3版更新说明 0. 久等了各位

  1. 这段时间一直在重构代码,几乎把助手重写了一遍,今天这一版是第一个可以工作的版本,之前没能及时更新,抱歉(鞠躬
  2. 新加了不少设置项,都在config.json里面,大家可以比照着src/tools/config.py里的注释进行修改
  3. 比较重要的一项改动应该是分卷输出电子书功能,在config.json中有一项max_answer,后边的数字是每本电子书中最大可容纳的答案数,默认为600,还可以接着再调
  4. 另外就是现在改用官方线程库进行并行抓取了,速度快了不少,希望各位能够喜欢
  5. 祝开心:)

#1.7.2版更新说明 0. 感谢各位知友的督促,久等了:)

  1. 重写了爬虫模块,修复了之前的各种解析bug
  2. 移除了线程数的设置,默认为10
  3. 默认显示禁止转载的答案,未来会将这个功能放在设置项中
  4. 感谢@鲶鱼的指点,修复了几处epub模板中的bug
  5. 使用了新的下载图片方法,修复了之前无法正确显示tex图片的bug

#1.7.1.8版更新说明 0. 感谢@宁采臣的捐赠

  1. 感谢@林止语的帮助,成功重现到了无法登陆的bug
  2. 修复了无法登陆的bug

#1.7.1.7版更新说明 0. 感谢@詹博文、@飞元的捐赠

  1. 临时修复了不能下载私人收藏夹和无法下载图片的问题
  2. 目前正在着手进一步调整代码架构,预计中秋&国庆期间可以发布新版本,敬请期待:)

#1.7.1.6版更新说明 0. 这一版里对代码的改动较大,所以出bug之后拖了一个月才发布出去。。。Sorry

  1. setting.ini文件改为使用json格式进行记录
  2. contentParse模块放弃正则表达式,改为使用Beautiful Soup4库对网页内容进行解析(目前解析速度比较慢,还需要进一步的优化)
  3. 启动部分改为使用线程池模式,自己实现了一个简单的线程控制系统,以加速对question和answer型电子书的生成速度
  4. 日志输出部分转为使用python自带的logger模块进行输出,可以在BaseClass里进行设置
  5. 将基础函数划分到了几个全局类中,使用SettingClass储存设置信息,使用BaseClass承载常用的几个工具函数,使用ThreadClass控制线程
  6. 删除了旧版的单元测试,目前暂时使用contentParseTest.py对网页解析功能进行测试
  7. 暂时移除zui,一个python项目因为引入了zui就被识别成了一个js项目。。。太诡异了- -

#1.7.1.5 版更新说明 0. 感谢@金兀术同学的pullRequest,更正了登陆地址:)

#1.7.1.4版更新说明 0. 感谢知友@Philip Matthew、@鱼藻君的捐赠

  1. 修复了一处在制作大体积电子书时出现的http错误
  2. 修正了一处由于代码编写失误导致当知乎全站页面切换到gzip格式后引起的程序崩溃
  3. 开始着手添加单元测试,为进一步的发展做准备

#1.7.1.3版更新说明 0. 感谢知友@梨花雨凉、@Popeye和@圈圈的捐赠!

  1. 感谢知友@程峰的建议,对开始运行时的导语做了一定的调整
  2. 感谢知友@废柴大叔的反馈,修复了一处由于问题标题中含有非法字符导致创建文件夹失败的bug
  3. 感谢知友@派先生的反馈,修复了一处由于未添加cookie导致的私人收藏夹下载失败的bug
  4. 感谢众多知友的反馈,专栏下载功能修好了已经XD
  5. 修复了一处由于if判断写反了导致的专栏题图丢失的bug

#1.7.1.2版更新说明

  1. 修复了专栏文章未按发布日期排列的bug
  2. 同样感谢知友@沸羊羊的夏天、@Oliver Xia、@毛轶彬反馈的bug,昨天晚上写代码写的精神恍惚,忘记致谢了。。。Sorry。。。 再次感谢!

#1.7.1.1版更新说明

  1. 紧急修复了一处css的bug

#1.7.1版更新说明

  1. 感谢知友张佳硕,陈松的捐赠!
  2. 感谢知友@fun-gun反馈的bug,助手无法将话题保存为电子书的bug已修复
  3. 感谢知友@罗晨的建议,将code文件夹改为了codes
  4. 热烈欢迎@青葭回归知乎,撒花~
  5. 增加专栏助手功能,而且,专栏按时间顺序逆序排列!这个功能终于实现了,再次撒花~
  6. 大幅度调整代码,简化了代码结构
  7. 重做了网页生成模板

#1.7.0.2版更新说明

  1. 进行了压力测试
  2. 增强了抓取答案的能力,降低了漏答率
  3. 将关键文件夹的名字改为英文,避免解压缩时的乱码问题

#1.7.0.1版更新说明

  1. 修复了图片下载不全的bug
  2. 修复了ReadList中不支持空行的Bug

#1.7.0版更新说明

  1. 使用全新代码架构,极大增强了扩展性与稳定性
  2. 支持对问题与答案的保存
  3. 支持多种类答案混排

#1.6.9.3版更新说明

  1. 感谢知友@欸乃,@二分法v而我,@,@老大,@邸大人,@浅小枫反馈的bug,虽然没能全部修复,= =
  2. 修复了一处由于知乎更改登陆的验证方式助手均无法正常运行的bug

#1.6.9.2版更新说明

  1. 感谢知友@边敏 @当我们一起去跳海的反馈,更正了一处由于答案不友善或者涉及政治内容被知乎屏蔽时导致答案丢失的bug
  2. 感谢知友@梁瑞鑫的反馈,修正了一处由于meta标签书写错误导致epub文件无法正常显示的错误
  3. 感谢知友@当我们一起去跳海的反馈, 修正了一处由于同时打开的网页过多导致知乎服务器拒绝服务的bug

#1.6.9.1版更新说明

  1. 感谢知友@张伟杰 的帮助,现在知乎助手生成的电子书已经可以在苹果设备上进行浏览
  2. 感谢知友@Lin Henry的帮助,修复了一处由于知乎专栏API变动导致的专栏助手运行故障。目前暂时限定为只抓取专栏的前100篇文章,原因见3
  3. 过段时间会放出1.6.9.2版,在这一版中将会添加按问题手机答案的功能,争取年前放出带有图形界面的1.7.0版,这几个月天天晚上在家里打魔兽= =罪过啊。。。
  4. 敬请期待~

#1.6.9版更新说明

  1. 修复了一处由于知乎网页
    标签未闭合导致生成的电子书无法正常打开的bug,感谢sxw的反馈
  2. 修复了高清图模式下部分图片无法正常下载的bug,感谢知友三清的反馈
  3. 修复了输出的网页版收藏夹答案内容居中对齐而不是左对齐的bug,感谢知友三清的反馈
  4. 更正了Mac与Linux用户的使用说明中的bug,感谢Peter的反馈
  5. 增加将html打印为pdf时所应注意的问题,感谢知友周末的反馈

#1.6.8版更新说明

  1. 修复了一处因中文文件名导致程序崩溃的bug
  2. 错误报告收集文件改名为ErrorReport.txt

#1.6.7版更新说明

  1. 紧急添加了读取验证码的功能,当然,鉴于目前程序还是命令行界面的残酷现实,打开验证码还得劳烦各位手工双击咯,嗯哼~

#1.6.6版更新说明

  1. 针对知乎修改了登陆验证方式,更新了登陆流程
  2. 生成Epub电子书之后附带生成了HTML文件用于转换为PDF格式,方便在其他阅读平台上观看,建议反馈via钟馨Luo Wen
  3. 改进了登陆方式,登陆成功之后10天之内免登陆
  4. 修改了使用说明,将增量更新软件保留数据库的方法加了进来,功能建议viaSam
  5. 感谢公子妖同学的捐赠!

#1.6.5版更新说明

  1. 修复了一处由于线程计数器故障导致的程序崩溃,感谢@三清的反馈
  2. 更正了一处有歧义的提示语句,感谢@夏小山的反馈
  3. 修复了由于知乎更改页面结构导致无法正确识别用户头像的bug,现已支持读取御姐@王豖的答案,感谢梁文驹murir^92***680的反馈~
  4. 完善了bug反馈模块,以后bug将会被自动记录到『错误信息_未能成功打开的页面.txt』中,再反馈邮件直接发这个就可以了的说~
  5. 支持使用前缀注释的形式对网址进行注释,示例
  6. 将通用函数和模块移至ZhihuLib模块

#1.6.4版更新说明

  1. 修复了一处因removeTag函数编写错误导致的程序崩溃,感谢@三清的反馈
  2. 感谢@夏小山的捐赠~
  3. 略微更新了一下使用说明,现在更漂亮了~
  4. 正在编写新版助手,希望能尽快做好吧~

#1.6.3版更新说明

  1. 修复了由于知乎页面结构改变导致程序无法正常运行的Bug
  2. 修复了因代码书写错误导致专栏助手无法正常打开的Bug
  3. 在代码内补充了部分函数说明,随后会争取做到每个函数都配予以功能、参数、返回值说明
  4. 增加了下载图片选项,可以根据网络情况自行选择下载『无图』、『标清图』、『高清大图』三种选择
  5. 版本说明转为使用MarkDown进行书写,便于排版
  6. 在专栏助手中增加了检测更新的函数,此后专栏助手将与知乎助手同步更新
  7. 下载图片时会出现死循环的情况,表现为一直剩余1~2个线程待完成,为了尽量避免这种情况的出现我将下载线程超时时间从20s缩短为了10s,如果还是出现的话可以直接关闭程序重新运行之

#1.6.2版更新说明:

  1. 每次只生成一本电子书,方便定位故障
  2. 图书封面与首页图片更新,首页图片替换为盐Club,更漂亮些
  3. 去除背景颜色,便于使用多看官方默认颜色
  4. 修复了因为图书标题里含有非法字符导致创建文件夹失败程序崩溃的bug
  5. 每次生成电子书前都会清空之前的缓存,避免出现重复文章的bug
  6. 在主程序之外添加了一个catch,便于捕获bug

#1.6.1版说明 ##考试周期间,暂不进行大版本的更新 ##更新说明:

  1. 修正了一处由于知乎网页结构变化导致的软件Bug
  2. 在多看阅读中打开电子书时,双击图片可放大

#1.6版说明: ##写的时间跨度太长,忘了更新的哪儿了(大雾) ##说说我还记得的更新吧~

  1. 去除了输出html的功能,直接将答案输出为Epub
  2. 增加了记住密码功能,一次设置完成后以后再运行直接一路回车即可
  3. 识别失败的网页直接输出到『未成功打开的页面.txt』中,而且不再需要敲击回车确认,初始配置完之后就可以让程序自己慢慢跑了,嗯
  4. 感谢@刘三清同学的捐赠和督促,这几天光忙着赶作业了,更新的比较慢。。。再次致歉。。。
  5. 去除了Epub目录建的间隙,并添加了序号
  6. 话题、收藏夹和专栏如果有介绍的话会在封面上显示出来
  7. 修复了一处因编码错误导致程序崩溃的bug,bug反馈@咚咚的咚
  8. 精简了代码行数,和显示模式,下一步的目标是把代码压缩到1500行以内
  9. 知乎助手专栏版改名为了专栏助手,还是四个字名的叫起来方便啊 10 .可以在ReadList.txt中的网址后面加『#』,然后#后面可以加备注,程序会在读取时自动忽略掉这些备注~ 11 .http://zhi.hu/3pki这儿有已经制作好的电子书合集,推荐下载前先去那儿找找,知乎服务器不容易啊~ 12 .为了能更好的下载大图,所以我把下载最长等待时间设置成了15s,这样程序的最长等待时间将会达到150s——也就是三分钟,所以有时候等待的时间会比较长,嗯

#1.5.1版说明:

  1. 修复了将mimetype文件压缩两次的错误,bug反馈via@Francis Fung
  2. 增加了设定下载图片线程数模块,1.5版里把线程直接设成了50导致图片各种下载失败,现在可以根据网络情况自定义线程数了
  3. 修正了一个无论图片有没有下载都一律认为已下载的一个bug,汗。。。

#1.5版说明:

  1. 添加了一个Epub_zhuanlan脚本用于将专栏下载为电子书
  2. 增加了一个图片池,所有电子书临时文件夹共用一个图片池,加快图片下载速度,缓解对知乎服务器的压力
  3. 感谢@Molly麥 小麦姐的捐赠,嘿嘿~
  4. 知乎专栏本身就处于内测状态,变更接口导致软件失效的概率非常大,所以我把专栏功能独立了出来,给大伙添麻烦了,见谅则个:)
  5. 鉴于程序已经非常稳定,所以,改名以后就正式改名叫知乎助手了哈哈

#1.4版说明:

  1. 增加输出为Epub的功能
  2. 修正无法读取私人收藏夹的bug
  3. 修正密码中不能带标点的bug
  4. 电子书中相同问题下的答案都在一起,功能建议via@Henry

#1.3版说明:

  1. 基本上把程序重写了一遍。。。
    1. 添加了以下功能:
      1. 根据@莫筱七的建议,将捕捉到的答案储存于『知乎答案集锦』文件夹中,便于后期制作电子书
    2. 可以保存话题下的精华回答
    3. 自动保存登陆cookie
  2. 进行了以下修改
    1. 转为使用正则匹配网页内容
    2. 直接在列表中读取用户答案,提速20倍
    3. 增加了检测『禁止转载』功能,如果用户钩选了『禁止转载』则助手将不再读取该答案
    4. 为了保证不漏答案,转为使用数据库记录用户与收藏夹内的答案列表,这样就不能记录收藏夹里答案的位置了,所以在导出收藏夹与用户答案时将会按照赞同顺序排序而不是按添加到收藏夹中的顺序排序
    5. 当网页打不开时会在程序运行完毕休息三秒之后再重新打开,以保护知乎服务器和降低打开失败的概率
    6. python脚本在Mac与Linux环境中也可以实现检查更新

#1.2版说明:

  • 对程序进行了一些微调
    • 修正了一个一直提示更新程序的bug
    • 根据@莫筱七的建议,当匹配网址不成功时程序不再直接退出,而是输出提示,待用户敲完回车确认后继续运行

#1.1版说明:

  • 加入了数据库大杀器,从此漏答是路人。。。

    • 其实还是会漏答,但是!每次运行,数据库都会把所有成功读取的答案保存下来,再运行时就只读取所有没读取成功的答案——也就是说,随着程序运行遍数的增加,漏答率将会以指数级下降:加入漏答率是30%的话,第一次是30%,第二次就只有9%(0.30.3),第三次再读取的漏答率就只有2.7%(0.30.3*0.3),这样的漏答率,基还是可以接受滴~
    • 所有漏掉的答案链接都在『未成功读取的页面列表.txt』里,可以借此判断漏答率~
    • 有了数据库之后的优点是程序只会往里面添答案,实现了答案的永久保存,缺点是所有答案都被定格在了存入库的那一刻,没法跟上时代的步伐——解决方案:制作电子书前可以把ZhihuDateBase.db删掉,程序在数据库中找不到数据就会在网上抓取最新答案了
  • 内置了一个cookie,在抓取个人回答或者公共收藏夹模式下登陆失败时自动调用这个cookie伪装登录,有效期一个月(zhihu.com设的),另外增加了私人收藏夹模式,模式选择界面里输入2进入

  • 感谢@林西豪 的捐赠和@李奥 的推荐,谢谢大家的认可!谢谢(∩_∩)

  • 欢迎在zhi.hu/0Jo4的评论串里提建议我会努力的


#1.0版说明

  • 把要读取的用户首页地址和收藏夹首页地址粘贴到ReadList.txt里,然后保存、双击ZhihuHelp开始运行就行

  • 开始运行前会先要求输入一个最大线程数,这个值越大读取的速度也就越快,但是出现无法读取答案的可能性也越大(线程设成最大值时我在10M网络环境下测试的结果是有三分之二的答案读取失败),默认是20,设成1的话基本可以保证每条回答都能抓取到,至于抓取速度嘛,抓@yolfilm的回答集锦大概要4000s。。。

  • 程序依照WTFPL协议发布,升级时360按惯例会拦截一下,不用管它,要不就得手工敲网址了

  • 还有三分钟到4月1号,就写到这儿吧

  • 1.0版,放出

  • 撒花~