Skip to content

zinking/bbsparse

Repository files navigation

bbsparse

今日十大 - 校园里没有新鲜事

http://10.readmine.co

突然发现我居然连网站URL都写错了, 粗心如我。 这个网站继续运行在 10.readmine.co 上, 虽然实际上已经没多少人在看了。

算起来,这个网站前前后后运行了也要8年了。 一开始,运行在google app engine内嵌在校内网应用里, 在那个SNS还没那么流行的年代收获了一波流量。 然后就是谷歌的所有服务被墙, 那个时候我还在学校里, 并没有什么实际运营小众站点的经验, 因为被墙 10.appspot.com 实际上直接就夭折了。 我也没自己申请域名, 把10大好好做做好的打算, 于我自己而言,就是个方便地快速浏览所有高校的热点新闻的一种方式而已。

GAE被墙应该让这个站点中断了一年多。 某个工作后周末空闲的时候, 我又把这个玩具从故纸堆里翻出来,改吧改吧和GAE剥离放到自己的一个Linode上, 索性申请了个域名供自己娱乐,于是这样运行在readmine.co上多年。

当然,我并不是第一个产生这种想法的人。 东南大学有个同学通过谷歌的某项服务输出了一个高校BBS十大的RSS聚合, 不过他显然也没啥耐心做很多学校的十大头条RSS聚合, 也是跟我一样技术玩票的性质; 还有一个同学比较有耐心, 每天通过半自动的方式抓取和同步这些十大头条,显然没能持续坚持下来,见面聊到这个的时候我是心生敬意的。 后来在类似大众软件的论坛也见到过类似的功能聚合。 我没见到的实现了这种功能的站点可能就更多了。

技术上来讲,这就是现在常见的爬虫功能。 不过麻烦一点的是,每个学校都有一套自己的格式, 有一些学校内容的爬取甚至要深入阅读一些JS。 好在这些格式相对固定,基本没有变化。 8年了,对内容格式的变化,我只做过一次调整。 哈哈, 也有很多网站我懒得去更新了。因为内容看起来没什么营养, 我也懒得去更新了。 8年投入在这个站点上的技术时间应该没超过两个月, 算上一开始的时间应该没超过三个月。 8年从这个站点读到的各个高校的新闻值回票价。

感慨这些底层框架稳定的同时,这个站点其实也没啥人访问。 抓取的那么多学校里,大部分学校BBS十大已经断更。 只剩小百合, 饮水思源, 水木清华, 日月光华等屈指可数的几个BBS保持着活跃的更新, 其他BBS大约慢慢也步入了停更。 话题也没什么新意, 除了水木隔三差五的还有点儿新意, 其他的站点基本也名存实亡。很多年前, 不仅看文章, 很多作者的签名档都很让我长见识, 我特地收集了签名档放在首页公告。 可惜,这几年一个好玩的签名档都没看见了。 不过我还是隔三差五的上去看看, 万一我错过了点儿什么呢? 对吧

刚刚过去的大,目睹了所有的BBS被关闭,某一瞬间以为终于可以有理由关掉这个玩具了,因为真的猫都没有了。不过过了一个月,它们又一个接一个的续更了,虽然内容依然无趣。 那些当年BBS的大神作者们,你们都去哪儿了啊? 你们现在都跑到知乎去写文章了吗? 现在学校里的莘莘学子们,你们又在哪儿发言呢? 你们也跑到知乎去了吗?

-- 2017.12.3 有感而发

About

parsing bbs sites

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors