微信公众号爬虫
Windows环境
python2 python3 BeautifulSoup selenium
Fiddler
微信电脑客户端
首先打开Fiddler,在电脑端微信上点开某公众号的历史纪录
在Fiddler上获取该页面的临时url
并利用crawl_wechat_copy.py(python2) (url通过bash输入:python .\crawl_wechat_copy.py "...")爬到该公众号所有文章的链接,并以txt文件形式存在当前目录
接下来再用 test_all.py(python3) ,读刚才爬到的链接文件,并利用beautifulsoup爬每个文章的内容(需要更改代码指定位置)
2018.7.2尝试 代码已经失效,但原理不变,根据网页检查的结果更改代码中的查询语句应该就可以使用