mobility network

Wang Cheng-Jun edited this page Dec 19, 2016 · 2 revisions

计算传播学是计算社会科学的重要分支。它主要关注人类传播行为的可计算性基础,以传播网络分析、传播文本挖掘、数据科学等为主要分析工具,(以非介入地方式)大规模地收集并分析人类传播行为数据,挖掘人类传播行为背后的模式和法则,分析模式背后的生成机制与基本原理,可以被广泛地应用于数据新闻和计算广告等场景,注重编程训练、数学建模、可计算思维。

Clone this wiki locally

Table of Contents

引力模型

引力模型的提出最早可以追溯到Henry Carey在1858出版的《Principles of Social Science》一书。经典的引力模型与牛顿万有引力定律的形式非常类似,它假设两个地点之间的出行量与两地点的人口数成正比,与两地点之间距离的幂次(不一定是平方)成反比[1]

辐射模型

2012年Barabási小组提出一个名为辐射模型的出行分布预测模型[2],它的基本假设是出行者在选择目的地时,会选择距出行起点最近且比起点机会数多的一个地点出行(这里的机会数是按正比于地点人口数随机抽样的)。辐射模型的突出特点是不需要任何可调参数、仅输入各地点的人口分布数据就可以相当准确地预测城市间的人群移动量,克服了引力模型存在的缺陷。但是,辐射模型在运用于城市内人群移动量预测时结果却与实际有较大的偏差。

  • 造成辐射模型预测偏差的可能原因是:由于城市的聚集范围相对较小,出行者在选择目的地时不是仅仅考虑距离起点最近的高机会目的地,而是会综合衡量城市范围内所有潜在目的地的出行机会数。
    • 一般而言,对于具有相同机会数的目的地来说,出行者更倾向于选择近的目的地;
    • 而对于距离相近的目的地来说,机会数多的地点对出行者的吸引力更大。
换句话说,一个地点被出行者所感受的机会数是该地点的实际机会数按某种方式衰减后剩余的部分。在引力模型中是用一个幂律距离函数来描述这种衰减,但这一函数中不可避免的要引入可调参数。

人口权重机会模型(PWO)

是否存在更自然的、不依赖于具体参数的方式来描述这种机会衰减现象呢?

在最近的工作中[3]提出了一个新的衰减机制,认为目的地的机会数会按照起终点之间的人口总数加权衰减,即出行者选择一个目的地的概率正比于目的地的机会数,反比于出行者所在地点到目的地之间的人口总数(再减去一个有限尺度效应)。我们将这一模型命名为人口权重机会模型

由于地点机会数可以假设为正比于地点人口数,因此这个模型中所需要的输入数据仅仅是各地点的人口分布,与辐射模型一样是不需要任何可调参数的。

  1. 人口权重机会模型适合于在没有居民出行调查数据的情况下进行出行分布预测时使用(比如交评或预算有限的规划项目)。所需的基本输入数据有两类:一是城市人口分布,另一个是人均日出行次数。
  2. 其中,城市人口分布数据的最佳来源当然是人口普查数据,但这种数据其实在国内也不好获取。目前可行的办法是找替代数据。现在互联网社交签到数据很火,很多研究都用爬取的POI签到密度来近似人口密度,这样再有城市人口总量后,就可以得到近似的城市人口分布了。另外,如果有手机通讯记录数据也可以(当然手机数据在国内也不好拿到),处理方法与签到数据类似。
  3. 关于人均日出行次数,一般国内的城市大多在2.5次/人日左右,当然如果有历史调查的或类似城市的数据可以参考更好。如果没有可以做小样本的调查,几百人的抽样规模就足以得到准确的人均日出行次数了。
  4. 最后一个小提示,论文中的人口权重机会模型只是带起点出行约束的模型,不能保证终点出行约束。但用Furness方法等迭代技术很容易对模型结果进行双约束,具体方法可随便参考一本交通规划教材,大部分教材都有这方面的技术实现步骤。
  5. 这里pwo.zip是人口权重机会模型的C#程序代码以及示例数据。
闫小勇老师 email:kaiseryxy at 163 dot com.

:File:pwo.txt :File:popa.txt

  • [1] Ortúzar J D, Willumsen L G. Modelling transport. Wiley, 2001.
  • [2] Simini F, González M C, Maritan A, Barabási A-L. A universal model for mobility and migration patterns. Nature, 2012, 484: 96-100.
  • [3] Yan X-Y, Zhao C, Fan Y, Di Z, Wang W-X. Universal predictability of mobility patterns in cities. J R Soc Interface, 2014, 11: 0834

Data

http://mobilemining.clusterhack.net/info

  • Nokia Mobile Data Challenge 2012
  • Kaggle’s Accelerometer Biometric Competition
  • Microsoft Research’s GeoLife GPS Trajectories
  • Microsoft Research’s T-Drive Taxi Trajectories

参考文献

Banavar, J. R., Maritan, A., & Rinaldo, A. (1999). Size and form in efficient transportation networks. Nature, 399(6732), 130-132. [1]

Song, C., Qu, Z., Blumm, N., & Barabási, A. L. (2010). Limits of predictability in human mobility. Science, 327(5968), 1018-1021. [2]

Song, C., Koren, T., Wang, P., & Barabási, A. L. (2010). Modelling the scaling properties of human mobility. Nature Physics, 6(10), 818-823. [3]