Skip to content

Vongwinga/first-personal-work

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

first-personal-work

1.数据采集
利用上学期爬虫的基础,条件发射的想利用Jupyter Notebook来完成,由于运行作业的电脑上未安装相关插件,只能另寻出路,使用Pycharm来完成。
在编码前先是查询了爬取视频评论的相关资料,从优秀的人手上学习方法。了解后在Xpath和正则中选择了相对熟悉的正则,之后在PyCharm中进行所需库的导入。
跟上学期爬虫类似,在谷歌开发者工具的帮助下找到想要获取的内容,发现源代码格式。

2.数据分析与处理(词云图)
上学期爬虫习惯性保存为txt与csv的格式,这时候保存txt后需要转为json(题目所要求的格式),后来用天池做云图时都更正过来了,就删去该部分无用功代码。
发现词云图和上学期人工智能最后的可视化非常相像,随之想到的就是上学期沈老师提供的阿里云天池平台,然后我就发现了更优秀的东西...阿里云的师兄师姐们早就有了很多词云图的模板代码甚至是应用(包含过滤器)。 参考许多代码后尝试写出了最简单的方形模板。

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published