激流按2020年9月,人物杂志的文章《外卖骑手,困在系统里》探讨了平台算法系统对外卖骑手劳动过程近乎苛刻的控制以及这种控制所引发的各种问题。作者长期、详实的调查让许多读者感受到了外卖骑手的切肤之痛,轰动一时。潮涌般的舆论谴责下,美团和饿了么两大垄断平台不得不做出响应,通过修改调度系统给骑手留出几分钟弹性时间。然而一切并没有实质性的改变,这宣告了“算法系统压迫论”的破产。激流网有幸访谈了一位配送平台的算法工程师,为我们详细剖析算法控制配送员劳动过程的逻辑以及问题的症结所在。垄断资本通过自己雇佣的程序员将自己对于效益的价值追求注入配送算法系统。我们需要明白真正的矛盾不存在于程序员和骑手之间,而是产生于垄断资本与骑手之间。

程序员不懂骑手的痛?——专访平台算法工程师-激流网

揭开算法的面纱——控制配送员的三个系统

激流网:平台的配送算法程序主要包括哪些呢?

红红:美团、饿了么、达达、闪送等各个平台大同小异,从行业内这几年各家分享的算法工作来看,主要应该包括三个系统,分别是送达时间预估系统,预估骑手订单的配送时间;智能派单系统,决定把哪个订单分给哪个骑手;定价系统,计算每个单应该给骑手多少劳动报酬。

向底线试探——配送时间预估系统

程序员不懂骑手的痛?——专访平台算法工程师-激流网

激流网:送达时间预估系统是怎么工作的呢?

红红: 我们站在一个用户视角去看,在外卖平台下订单,系统会给他呈现或者说承诺一个送达时间。这个时间+N分钟,往往就是外卖骑手的考核时间。例如一个用户12:00在平台下单,系统预估送达时间在12:30,最后订单派给骑手时,考核时间可能就是12:38,也就是在30分钟基础上增加了8分钟。晚于这个时间送达的话,就会扣一半的钱。

激流网:这个时间是怎么估计出来的呢?

红红:就是通过所谓的人工智能大数据,用户在平台下单时候,系统还没有给骑手派单,这时订单是哪个骑手送根本没有能够确定呢。所以估计什么时候送达,完全就是根据历史的统计情况,不管加上多少人工智能术语,本质上还是基于统计学习的,即历史的统计,无非再加上实时的一些情况做修正比如有没有下雨啊之类的。

激流网:为什么系统每次都会基于历史统计的时间预估地更短呢?这是人为设定的吗?

红红:预估系统只是忠实的按照历史状况去预估,都是某种意义上基于历史的统计,历史上这段路程上的每次配送都会成为未来预估时间的大数据的一部分。例如一段路正常行驶要30分钟送达,如果系统要求骑手跑得更快例如给骑手一些奖励让骑手25分钟送达,而骑手通过各种逆行最终确实按25分钟这个时间送达了,那么系统里就会有一次这段路程25分钟能送达的数据样本,下一次再预估的时候,预估的时长就会倾向于更短更接近25分钟而不再是原来的30分钟。

激流网:那一些特殊情况,比如午高峰、下雨等会不会给骑手多留出时间来呢?

红红:一般意义上会多留出时间的。但有时不一定,也可能会更短。配送时间预估系统里都有时间调整的设计,就是系统为了自己的目标,在预估出来的送达时间的基础上再进行调整。比如午高峰,我们都知道这个时间点外卖很容易超时,也有朋友因为配送时间长放弃点外卖而直接去附近店里吃了,所以说午高峰外卖的配送时长是平台的核心竞争力。那么系统会倾向把时间在预估出来的送达时间基础上再减短一点点,也就是向负向去补时,从而试试看骑手能不能在这个更短的时间内送达,如果平均意义上都能按时送达了,那系统积累了更快的送达样本,下一次预估送达时间的时候,就会预估得更快了。

谁掌控谁得利——派单系统

激流网:派单系统是怎么工作的呢?

红红:派单系统就是决定把哪个订单派给哪一个骑手的系统。如果从早期就开始跑外卖的人会知道,外卖系统前后经历了好几次变动。比较早的时候是抢单,后来开始试验派单,一开始骑手也可以关闭派单,开着派单时每天能拒绝的次数有个上限。到现在变成全派单了,骑手再也不能关闭派单,但骑手遇到不满意的单可以无限拒绝,看起来平台给了骑手更大的自由,但其实我们都要清楚平台拿到了越来越多的分配权管控权。

激流网:平台更多的管控权如何实现呢?

红红:每个骑手在拒绝系统派单的时候,都会看到提示是这会降低后面接单权重。也就是说系统在给骑手派单的时候,会估计骑手有多大可能性接受这个订单,多大可能性拒绝这个订单,拒绝多了,后续同等条件下系统给骑手派单的可能性就降低。

程序员不懂骑手的痛?——专访平台算法工程师-激流网

激流网:除了拒单之外,系统派单还要考虑哪些因素呢?

红红:系统给骑手派单时,确实要考虑骑手身上已经有的订单,和新派的订单之间的适合程度,新派的订单本身能不能按时送达,骑手身上已有的订单会不会因此超时,都是要考虑到的。从平台的角度,就是在这个订单不超时的约束下,能够让骑手派送的效率越来越高,从而越来越赚钱。平台确实在尽可能的预估更准确订单配送的每一个环节,因为这样才能更高效地从骑手、从用户身上赚钱,那预估不准的环节里预估不准的成本呢,在现在阶段就让外卖骑手去承担了,因为商家出餐时间预估不准,骑手拿到餐晚个几分钟,就得逆行拼命跑单保证最后不超时。

激流网:当一个骑手同时送多个单,骑手会不会更赚钱?

红红:短期骑手更赚钱,但长期其实平台会更赚钱。派单的时候,系统还常常倾向于把两个或三个相近的订单合并在一起派给骑手,两个订单,原先每单可能5元钱,合在一起9.5元,确实骑手看起来有点收益短时间能送更多顺路的订单,但是收益更多的还是平台,平台正是通过这个方式来逐渐降低了每一单的配送成本。

激流网:那最近几年,各家配送平台的调度系统主要在升级哪些功能呢,对骑手来说这意味着什么呢?

红红:平台的调度系统确实在做更全面的优化,计算的能力更高,更好的应对各种场景。如果我们从算法的角度看就是在突破过去的一些约束,比如过去可能是按照商圈做调度,现在能做到按城市做调度,过去可能要分成专送和众包分别调度,而现在能统一调度。这种统一调度可以应对一些突发情况,比如平台具备了专送与众包骑手之间的订单调整的能力,遇到众包骑手罢工,平台可以轻易将众包的订单转发给专送骑手。所以骑手别无出路,只有越来越大的联合。

榨干油水——定价系统

激流网:定价系统是如何运转的呢?

红红:两类骑手的劳动报酬计算方式并不一样,专送骑手每单价格基本固定或者分段固定单价,按订单数量结算工资的,而众包骑手则是每一单都有标价,单单结算。

激流网:为什么会这样呢?

红红:众包骑手从设立之初,对平台的目的就是用尽可能低的成本,去达成专送的配送体验。所以众包骑手的成本是在持续被优化的。

激流网:系统是如何对众包骑手的订单价格进行优化呢?

红红:整个定价系统,开始时是有个初步的基础定价或者说规则定价的。我们往往也能看到这种规则,比如按照订单配送的距离,还有订单在商家那边难不难取,到用户那边难不难送等等,根据这些因素,来决定一个订单的价格,这个价格对所有骑手都是一样的。当然这个规则过几个月也是会变化的,比如平台要是这段时间想要降单价,那么总的预算就会变少,分到每一个单上的价格就相应会少了。

程序员不懂骑手的痛?——专访平台算法工程师-激流网

激流网:除了规则定价,还有其他的定价策略吗?

红红:规则定价是最基础的,在这上面会有根据订单顺路的程度进行的顺路单减价,或者像上面提的订单打包的减价。当然平台也会在午晚高峰和下雨天有加价的补贴。

激流网:决定是否加价和减价背后的因素是什么呢?

红红:也是动态的根据实时周边的骑手情况来决策的。比如这个地区骑手人数多,系统估计出来加很少的钱就会有骑手来接起这个订单,那么系统就不会加更多的钱。所以其实是系统对骑手的情况做预估,并根据预估的情况来实时的做调整,与骑手做博弈。

谁说程序员不懂骑手的痛

激流网:今年9月份刷屏的一篇《外卖骑手,困在系统里》文章中提及,加强程序员的培训和价值导向对于解决外卖员的困境很重要,您如何看待这种观点呢?

红红:程序员也是打工人啊,因为供需的关系可能程序员目前稀缺所以工资暂时高一些,但在资本的眼里都一样的都是被压榨的对象。外卖骑手跑的越快提高了平台的配送效率,却造成了自己和自己的同伴们后续越来越辛苦配送时长被一再压榨。程序员代码写得越智能越好维护,也造成了自己后续不得不更多时间加班为资本的各种目标去做算法尝试及自己被越能加班的年轻劳动力取代。我们其实都能够看到我们自身都是在某种规则里,外卖平台给骑手定义的是普通、青铜、白银、黄金、钻石、王者;互联网公司给程序员定义的是工程师、资深工程师、技术专家、资深技术专家、研究员。但站在全体去看,在这个定义好的规则下,能够成为王者骑手或者资深专家的永远只会是比例很少的人,不管我们其他人多么努力。而资本在这整个规则下才是稳赚不赔的。所以,也许我们都应该问一问,规则究竟应该由谁来定?

为了避免失联请加+激流网小编微信号wind_1917 

程序员不懂骑手的痛?——专访平台算法工程师-激流网(采写:小皮。本文为激流网首发,如有转载,请注明出处。责任编辑:郭琦)