python Worm for PKU BBS
coding with python3...
using package :
BeautifulSoup
Requests
jieba
thulac
wordcloud
matlibplot
Desctiption :
mytest.py : 爬北大未名论坛的鹊桥板块的帖子并下载至content.txt
pic.py : 爬鹊桥板块的帖子的附件图片
processContent.py : 对内容进行分析处理,并将每一个征友者的特点放至Information文件夹
wordAnalysis.py:对content.txt进行词频分析并将主要结果放在dict.txt
wordPic.py : 对上述dict.txt得到的词频分析进行可视化绘制词云
hotspot.py : 爬取给定板块的热门帖子
Reference :