做一个帅气的卡友很累,这点我真的深有体会。
今年双11,菜鸟网络的物流订单系统一共产生了4.67亿包裹,统计后的结论是4.67亿包裹运送距离叠加起来共计可以绕地球1100万圈。数据发布后,很多人来问,1100万圈是怎么算出来的?
大数据的魅力在于,让一切难以计算的计算变得简单。1100万圈是对4.67亿个包裹运输距离叠加出来的数据,但绝不简简单单是这样。因为大量的商品还没有走完它们的路径,算法考虑了很多因素:收发地距离和物流路径结合、预估包裹的发货地等。具体细节不便公开,而且经过无数次的调整,原则是尽算法范畴的所有能力去接近和预测每一个包裹所走的路径。
咨询了一下菜鸟网络的数据工程师,他给出了算法的5个核心维度。
● 基础数据-物流订单数据
这个过程涉及大量的数据清洗,首先从庞大的交易订单中清洗出4.67亿个物流订单,并知道卖家是谁、买家要求把货送到哪里。
● 发货地址数据预处理
通常情况下载卖家发货之前是不知道商品的发货地址;利用大规模的历史发货数据,结合双11前与卖家的沟通,通过大数据挖掘算法构建了卖家的发货地识别模型,能够提取判断卖家的发货地,模型的准确度在99%以上。
● 收货地数据预处理
利用地址解析模型通过几十亿条记录的实时计算,对买家填写的送货地址进行解析、纠错、补全等,能够判断买家收货的国家、城市、县区、街道或乡镇、小区等信息。
● 物流路由数据预处理
做物流的人都知道,地球上两点间的地理距离绝不等于物流距离。因此在计算的时候需要综合3000多家物流合作伙伴的网点、车辆、分拨、仓储等信息,建立了物流轨迹识别模型,清晰的知道商品从卖家仓库到送达消费手中经历的完整路线。
● 商品经历里程计算模型
利用输入的物流订单数据、发货地址预处理结果数据、收货地址预处理结果数据、物流轨迹数据处理结果,利用大数据强大的计算能力,很快的计算出所有商品的物流轨迹;结合地理位置服务产品(如高德地图)的距离数据, 只需要等待几分钟,就可知道双11包裹要经历的所有里程。
以上是我们计算所用到的5个核心维度参考数据,剩下的就是根据我们事先设定的计算模型去跑系统了。算出最终的数字,只花了几分钟的时间。
● 我们为什么要做这样的计算?
当然不是为了炫耀我们的包裹量以及工作量有多大,基于对全球物流企业及物流人员的调度,我们希望找出更优化的配送路径和时间段。通过合理安排时间,调配集货资源,最后可以从整体资源上,缩短1100万圈的距离。
● 大数据计算会泄漏隐私吗?
用户所有的原始信息都会先经过加密转换;计算的都是群体数据,并不会看到单个个人数据。
总体上,包裹距离的计算一定还有待精细的地方,不过,确实是一个非常有益的尝试,也是为电商物流基础数据建设作出的一点努力,以后我们还会继续做下去啦!
● 相关阅读:
注:本文内容转载自其它媒体,转载请尊重版权保留出处,一切法律责任自负。卡车之家登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,也不代表本网对其真实性负责。您若对该稿件内容有任何疑问或质疑,请即与卡车之家联系,本网将迅速给您回应并做处理。
申通加拿大门店运营 跨境寄递一单到底
11月20日消息,从申通官网获悉,申通快递加拿大各旗舰店已正式试运营.目前,加拿大申通共有万锦旗舰店、北约克旗舰店等五家门店,所有门店均接受货物揽... 2015年11月20日