首页 >
内容详细
北大AI课程 Lesson 9 — 滴滴叶杰平:智能交通和交通大数据
打印 分享 来源:  | 日期: 2017年10月20日
叶杰平

滴滴的社会价值

2012年滴滴成立了,当时是出租车业务,14年建立了专车业务,15年快车和顺风车公交车也上线了,所有滴滴的用户都亲身经历了共享经济在出行上的便利发展。当滴滴谈到人工智能时,首先会关注样本数据量。滴滴有多少呢?滴滴现在每天订单超过2000万单。所以这个样本量就是一天2000万,称得上是海量数据,现在这个平台上有4亿用户,这就是滴滴的数据价值。

 

另一方面作为一站式、多元的出行平台,滴滴能够提供多元化的出行工具,连接司机和乘客。从社会价值来看,有了滴滴之后,北京的小汽车的使用率提高了12%,另外滴滴填补了很多空点,能够在更多地方解决出行的问题。然后也增加了更多就业机会,通过顺风车实现拼车出行,减少了环境污染。

 

滴滴的大数据价值

滴滴平台目前做很多的预测和模型,每天处理的数据是2000TB,这是个天文数字。包括,路径规划是90亿,定位数据是130亿。

 

滴滴在人工智能先行的工作就是有效利用数据,即从海量的交通数据里面找出有用的信息来改变大家的出行,提高出行效率,改善出行体验和安全性。

 

 

AI核心——滴滴大脑

实时地把整个城市的交通数据整合到一起,实时地做智能的决策,这是滴滴大脑的核心。包含6个部分:ETA,智能分单,拼车,供需预测,运力调度和热力图。

 

ETA:预估从A到B大概需要多少时间,预估时间是非常重要的,比如你想6:40从家里来这个教室,你得大概预估一下多久能打到车,然后司机过来接你大概需要几分钟,然后你从你家到这里大概需要几分钟,如果能有个预估的话,你就能更精准地做决策。预估时间应该根据历史和实时的一些特征来预测,这是一个机器学习问题。

 

智能分单:就是一个乘客发单,然后做智能搜索,搜索最近的一个司机来接你。所以分单简单来说就是乘客搜索司机,这个问题挑战性非常大,滴滴需要做实时的匹配。

 

用户地点预测这个极大地提高了用户出行体验。你可以想象打开APP,它会猜你去哪,不需要输入目的地,点一下发单就可以了。其实滴滴APP的首页已经用了非常多的大数据和人工智能,除了预估目的地,还有路径规划,预估时间,预估价钱等等,你可能没有感知,这个首屏其实已经有非常多的算法,这里面至少有好几十个算法。

 

派单匹配度:就是这个乘客和这个司机匹配度高还是低。最早期的时候滴滴用的是直线距离,因为当时的很多基础功能还不完善。后来滴滴应该用路面距离,司机实际开过来的距离应该作为一个匹配度。所以从15年开始,路径规划比较完善了,滴滴就开始用路面距离。滴滴会先预估出来哪一条路径是最合理的,然后让司机去接乘客。但这个其实还不是最合理的,最合理的应该是时间,比如同样的两公里有情况一和情况二两种选择,比如情况二需要十分钟,情况一的距离可能是类似的,但是时间可能只需要五分钟,因为它的路况更好。最合理的应该是用时间来衡量。派单里面滴滴讲到怎么去评估两个匹配的好坏,需要两个核心的算法,一个是路径规划,另外一个是ETA。

 

分单:滴滴跟传统的搜索不一样,滴滴是实时的搜索,每两秒钟做预测,这里牵涉到非常多的地图的应用,比如说路径规划,ETA。因为其实滴滴不知道哪个司机离你最近,所以滴滴一般是找到你周围的所有的司机来做匹配,然后做路径规划和ETA。而且这是非拼车的方式,如果你是拼车单,那你们俩还要做匹配,复杂度就成了N的平方。所以这个复杂度特别高,而且要保证实时实施。但是更有效的分单还需要考虑未来,找到未来一段时间收益最大化的最优解。最近滴滴上线了一套算法,用了增强学习。这个就涉及到供需预测,你需要知道比如说在未来半个小时,北京所有的区域大概有多少订单,哪个区域订单比较多,等等。这个就需要供需预测,这个对滴滴来说是非常重要的事情。去年滴滴举办了第一届算法大赛,主题就是供需预测,预测每一个区域大概会有多少个需求,多少个司机。滴滴现在的预测精度达到85%。

供需的不平衡,很多情况下打不到车的问题是供需不平衡。有些区域车的空闲运力比较多,有些区域表示车比较少。怎么解决这个问题?滴滴第一个方法是做预测,刚才讲过了,滴滴如果能提前预测,比如说未来半个小时各个地方供需的情况,如果能预测到这个区域缺10辆车,滴滴提前把它调过去,这是最理想的。另外一种方式就是拼车。比如说现在有100人在这个地方发单,滴滴只有50辆车,那最理想的情况是每两个人拼到一块,如果他们的路径类似。

 

用户的体验滴滴建立一个机器学习模型,根据历史上发生的大量的拼车单,分析哪一些是乘客投诉说体验很差的,哪一些是大家说好的,然后滴滴找出特征来。滴滴需要找出一些重要的特征,能够刻画这个体验。比如说这两单拼成了,滴滴大概能预测一下这个体验好还是坏,如果预估体验不好的话,滴滴就不让他们拼车成功。这背后其实是路径规划,相似性,以及体验的预测。

 

司乘判责:就是当司机乘客发生不愉快的时候,比如乘客取消,应该判谁的责任。乘客取消其实不一定是乘客的责任,有时候是司机的,有时候确实是乘客取消。这种场景下这种订单取消行为,比如说乘客取消的,滴滴要判断一下司机有没有责任,乘客有没有责任,做一个自动的判责。滴滴做了一套判责系统,去年12月上线,这一系统会自动判断司机和乘客有没有责任。

 

滴滴的未来价值

用滴滴的数据来控制红绿灯。大家知道红绿灯控制的目的是提高效率但其实大部分情况下红绿灯控制是不合理的,稍微优化一下可能潜力是巨大的。现有红绿灯控制系统不实时,也不精准。但滴滴的数据是非常实时,非常精准,就是说滴滴大概知道东南西北当时的流量大概多少,通过滴滴数据能够比较精准地预测出来当时的流量,然后用来控制红绿灯。这个在济南的经十路已经上线一个多月,数据显示,经十路早晚高峰期的交通延误时间均下降了超过10%。所以可以看出滴滴的数据潜力还是巨大的,在红绿灯控制方面,在客户体验方面,在分单效率方面,等等,都有非常大的发挥的空间。

返回列表