-
Notifications
You must be signed in to change notification settings - Fork 193
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
43.爬了知乎日报十多万条数据 #45
Comments
太强了!! |
it is good ! |
我很好奇的是这些api是怎么得到的 |
@mariotong 用Charles抓包拿到的 |
纯js实现吗 |
99.9%是js |
想知道楼主用了多长时间完成的 |
@eve0803 业余时间偶尔做做 大块时间的话主要集中在两个周末里面 |
实在是太厉害
2016-12-24 16:55 GMT+08:00 cc <notifications@github.com>:
… @eve0803 <https://github.com/eve0803> 业余时间偶尔做做 大块时间的话主要集中在两个周末里面
—
You are receiving this because you commented.
Reply to this email directly, view it on GitHub
<#45 (comment)>, or mute
the thread
<https://github.com/notifications/unsubscribe-auth/ABpGm5w4yLVTmTpYkkLy0UIGtOU61LH_ks5rLN4HgaJpZM4KfAwO>
.
|
真心厉害 |
楼主真厉害!我得好好学习一下,争取在两三个月左右学习明白。学习过程中,有问题再来请教! |
@Huihuawk 十分乐意提供帮助 有什么问题直接问我就行 |
安装的时候,会报一个关于node-gyp 的错,楼主知道是什么问题吗 |
@mariotong 你试试先全局单独装一下 node-gyp |
clone下来install后运行start报错Unhandled 'error' event 楼主知道怎么回事吗 |
@eve0803 你在这 https://github.com/ccforward/zhihu/issues/new 开个issue |
@eve0803 @ccforward Unhandled 'error' event 这个后来处理了吗?应该怎么弄? |
@aiuluna 我当时解决是因为数据库密码用户名的问题,因为我没有设置用户名密码,注释掉页面就可以打开了,但是打开页面下方的数据会加载不出来看了是读取不到api,这个当时还没有找到原因。。。。 |
@ccforward 我install完了之后运行npm run start 报找不到config模块的错 |
@yvonnegithub config.js.sample 重命名为 config.js config.js 是配置文件 在里面配置你自己的信息 |
@ccforward 也出现了Unhandled 'error' event的错误,这个要怎么解决啊? |
@yvonnegithub 你在这 https://github.com/ccforward/zhihu/issues/new 开个issue 放上截图 我来看下 |
学习了 |
一个Node.js的知乎日报爬虫
爬取了从 20150519 以来所有的文章、点赞数、评论数和部分评论内容
感觉数据挺多,简单的统计了下,还挺有趣的。
具体的数据统计和分析移步到我在知乎上的回答
线上地址
技术栈
Node.js + Vue.js + MongoDB
功能
爬虫任务
展示页面
统计入口页面
首页
顶部是每天最新数据,点赞大于 1000 的做了高亮标红处理
下面是历史每日数据
文章详情页 - 下面是2015年评论 TOP 1 的文章
文章的部分评论也爬了下来
在页面最底部点开
按日期查看每日历史文章
可以查看历史每一天的所有文章,主要用在统计页面上,后面做个日历入口方便跳转,链接如下:
http://zhihu.ccforward.net/#/date?dtime=20161001
PS: 知乎日报第一篇文章
The text was updated successfully, but these errors were encountered: