Skip to content

gaoxq/sinaVideo

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

项目的前期工作:
这次要获取微博中短视频的数据,使用微博中自带的过滤功能,只能获取视频的微博。不过无法得到视频的时间,不能得到短视频。
因此我们想到了下面的方法:
1. 首先在微博的搜索框中输入“短视频”,使用视频过滤功能。目前得到的都是时间比较短,大约在2分钟内的短视频微博。
2. 将此页面的url作为要抓取数据的首页,通过page=?设置后面要抓取数据的url。
3. 通过解析html页面,获得该页面所有微博的id。
4. 通过新浪api,得到每条微博的内容,评论,转发数,视频链接。


请先填写相关配置:在Config.properties里
client_ID :appkey                           
client_SERCRET :app_secret
redirect_URI : 回调地址

About

调用新浪api抓取短视频数据

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages