Skip to content

testcase_of_renrenParser

JackonYang edited this page Jan 13, 2013 · 3 revisions

关键在于适应各种人人页面。
难点在于不知道人人页面有多少种。

profile

页面分析

一个较为全面的items列表如下:
所在城市,生日,星座,家乡,等级,性别,生日,家乡,大学,高中,中专技校,初中,小学,公司,时间,QQ,MSN,手机号,个人网站

其中,
生日、星座和第二个生日重复,后者包括前两条信息。取第一个生日和星座,舍弃第二个生日信息。
公司后的时间,特指在公司的时间。
所在城市,参考价值不大。舍弃。

测试页面:

241331952(信息全部为单条,含完整公司信息),
230760442(学校信息2条),
239486743 (字段最完整,2条学校信息,含情感状态) 233330059(最少字段,且公司时间信息显示异常,源码处字段不完整) 227342030(大学 3条信息) 294126602(字段为空) 285060168 unavailable$ 223981104 timeline unavailable

测试方法

访问页面,人工校验。暂不实现单元测试的自动校验