基于大数据的人类移动特性研究
基于大数据的人类移动特性研究
众所周知,大数据来了,更多的是信息采集的问题比较多,我们现在基本上所能采集的交通数据的方方面面,比如说路面的传感器、线圈、雷达,以及视频的东西,这是一类,交管部门也好,交委或者其它的部门也好,他们都在建立一些系统,这里边少不了采集的传感器,这个投资在前10年是比较大的。第二个是利用车载GPS 。车载GPS 就是我们所说的移动信息的来源,它主要通过GPS 的连接数据来反推出交通的状况。现在做的多的是通过出租车的数据反馈出现在的实时交通路况,然后将信息进行发布。第三个是现在我讲的这个题目比较重点的方面,就是手机基站的数据。手机基站的数据有这么几个特点,第一个是精度低,手机基站的数据精度现在应该是最低的,它基本上是在一两百米以上,这看你布的基站的密度,跟在基站范围内个体的数量多少。但是它还有另外两个特征可以把这个问题弥补,第一个是基站范围广。因为我们现在每个人有一部手机,这是必要的,有两三部手机的人不在少数。这就体现了我们现在手机的普遍性,同时海量的个体数量,这个量是相当大的,比如说我们深圳市应该有2000万台的手机数量存在,这是手机基站数据。从手机基站数据来说,怎么跟我们交通结合起来,这是一个很小的点,各位领导讲得都很大,我就讲这么一点。
基于手机的大数据,其实可做的东西很多,比如说移动轨迹的地理可视化、旅游出行方式的研究、通讯工具的使用对出行的影响,包括城市内部宏观活动的特征结构。其实在这里边最核心的一个,还是最后两个,一是个体移动轨迹的预测,第二个是个体移动规律与模式的挖掘。其实我们现在来说,智能交通应该会慢慢迈向另外一个时代,我们说交通跟所有人的出行是相关的,我们原先采集信息是靠线圈以及其它的检测器采集的,这种采集是交通流采集,它并不是面对于个体或者是面对于其它的特征用户的智能采集,它是一种大范围采集,同时发给用户的也是宏观的交通的、路况的概念。那么在这里边,个体的服务慢慢地会成为交通的另外一个核心,也就是智能交通往下走的一个主要的方面会在哪儿呢?就是个性化服务。这种个性化服务的市场会越来越大,而且这种特征的个性化服务会必然导致另一个产业的形成。我们有这么多大数据,我们可以拿到这些手机数据的时候,这些数据是不是有效,或者是不是有用?同时这些数据在我们拿到以后,它里边是不是有一些规律可以挖掘,这是我们现在做的一个方面,我就这个问题给大家做一个汇报。
其实个体移动轨迹的预测方面,欧洲做了很多的研究,在他们做的研究里边,个体数据为人类动力学的行为模式提供了有力的研究数据。欧洲通过对10万个手机数据的旅行线路的统计和预测,同时也对1600万个手机数据进行分析,最后有一个结论,个体移动轨迹可预测。这一点很重要,当我们拿到移动的数据,也就是这个位置数据的时候,是不是我们拿这个数据可以做事?这就是它给出的结论,就是我们可以在93.6%的基础上,这个准确度是有了,这是第一个结论。
第二个结论,这些手机数据它的可预测已经经过证明了在这里面它的规律性是什么?这里面有4个结果,第一个是universal pattern of individual mobility。这里面体现的两个结果,一个是人去得越多的地方,越多的人会过去。第二个是长尾定律,人的活动范围很广,但是70%的活动范围是一个经常去的地方。这给数据挖掘给了一个基础,我们可以在一定的范围基础上预测出这个人的行为模式和他所到的方面。根据这个个人的行为特征,底下还有一个什么呢?我们在交通上要做的是两个,第一个是stay ,就是你在那里,比如说购物、吃饭,比如说其它方面的stay 。比如说在海岸城这个地方,聚集的人比较多,在里面可以购物、可以吃饭。另外一个是Pass-by ,我们在做研究的时候,我们交通小区的概念要建立起来的话,你要把这个交通郊区给它区分开。我们怎么区分Pass-by ,我们要建立一套机制。这是第二个模型,把Pass-by 和stay 区分出来,这样就对交通小区建立了一个聚类或者叫空间的约束性。在这个基础上,我们可以做一些更有用的工作。这个有用的工作是什么呢?就是空间的Land Use,这对我们的交通规划、城市规划是很有用,而且是很有必要的一个指标,也就是说从这里出发,我们可以做其它的指标分解的概念。所以说在这个上面来说,这是一系列的规律和模式的挖掘。
下面说说未来的趋势,我们在参与国家的十三五规划的时候,我们国家的科研导向慢慢的导向了基于LDS 这方面往智能交通的引领创新的研究。我们看这张图虽然简单,但是它表达了一个什么意思呢?我们现在可收集的数据相当多,但都是移动的,而且是跟个人相关的精细数据。精细化肯定是一个趋势,这是包括我们十三五要规划的东西,这个精细化的数据采集已经到来了。第二个,在精细化的数据采集的基础上要做什么?要做下面这几个,这里边我们可以看到它不仅仅跟交通相关,而且
跟人的出行的方方面面都相关,包括宏观的交通规划方面的影响,到人出行的规律性,到它的这种服务特征的影响。同时还有功功安全。这个反过来讲也需要一些法规方面的问题和其它方面的问题。这就是从未来的移动互联网形成的一种新的趋势。
(看图)这是我们目前的一个成果,这是我们拿到的一些数据,这里边蓝色的区域表示密度会慢慢变低,红的表示密度会高,这是早高峰的数据。在这里边有些连接线和区域约束,这就表达了它能生成交通吸引和交通关联性的概念,这是它的一个方向的趋势分析。这是我们做的比较细节化的一些研究,给大家进行一下汇报。