* 分析需求
* ReadList
* urlInfo
* 将ReadList里的网址转换成一个一个的urlInfo
* 获取数据
* worker
* 处理数据
* contentParse
* 输出数据
* simpleFilter
* 辅助杂项
* login
* 登陆
* downloader
* 下载图片
* sql
* 数据库辅助操作
* 之前代码的核心是以urlInfo为中心。
* 首先读取ReadList里的设定,将之分解为单个的urlInfo,然后在每个urlInfo中添加了对应的worker,simpleFilter。通过worker获取urlInfo中的数据,分析并存入数据库中,再利用simpleFilter将数据从urlInfo中取出,放入contentPackage里。contentPackage由main类负责保管,它会储存所有内容并将内容交付给epubBuilder模块供生成电子书。
* epubBuilder模块是一个耦合度比较高的模块,负责将提取出的dict转换为html网页并压缩为zip文件。在下一阶段的开发中需要进行解耦处理。
- 电子书
- tools模块内为通用类库
- Debug
- 负责打印日志
- Path
- 负责进行常见文件系统操作
- 保存常用路径地址
- 路径地址最后一律没有'/'
- Debug