用Python写网络爬虫
-
第1章 网络爬虫简介
-
第2章 数据抓取
-
第3章 下载缓存
-
第4章 并发下载
-
第5章 动态内容
-
第6章 表单交互
-
第7章 验证码处理
-
第8章 Scrapy
-
第9章 总结
-
BeautifulSoup (Ch2)
-
lxml (Ch 2-9)
-
pymongo (Ch 3-5, 9)
-
PyQt / PySide (Ch 5)
-
ghost (Ch 5)
-
Selenium WebDriver (Ch 5, 9)
-
mechanize (Ch 6)
-
PIL / pillow (Ch 7)
-
Pytesseract (Ch 7)
-
scrapy (Ch 8)
-
portia (Ch 8)
-
scrapely (Ch 8)