生成微博词云 - februarysea.com #17

februarysea · 2020-02-14T06:27:27Z

https://februarysea.com/2019/10/30/%E7%94%9F%E6%88%90%E5%BE%AE%E5%8D%9A%E8%AF%8D%E4%BA%91/

今天花了一天写了一个新浪微博的爬虫，爬取微博指定用户微博内容，然后生成词云，以@带带大师兄为例，这是带带大师兄微博的图云。具体实现思路是：手机端网页的微博内容比较容易获取，于是通过爬虫访问手机端微博网页m.weibo.com获取某人的微博信息，然后将微博信息构成一个字符串进行词语分割，最后用分割的词语生成词云。构建请求头：主要是为了微博把我们的爬虫识别为浏览器。 123456headers

februarysea added Gitalk b1efabaccf1b6289c21425298aea7ef2 labels Feb 14, 2020

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

生成微博词云 - februarysea.com #17

生成微博词云 - februarysea.com #17

februarysea commented Feb 14, 2020

生成微博词云 - februarysea.com #17

生成微博词云 - februarysea.com #17

Comments

februarysea commented Feb 14, 2020