导读:13年以后,以外卖、网约车、房产销售为主的O2O平台,极大的改变了社会的运行模式。相比前一代互联网公司,这一代互联网公司都面临着人与人的线下交互,因此在体验、治理上也带来了新的挑战。在滴滴,经过多年的耕耘,我们探索了一套功能强大的治理算法系统,围绕司乘体验提升的核心目标进行了全方位的探索和落地。
1. 业务背景介绍 治理要解决的问题,是降低和解决因平台原因、司乘预期原因、司乘个人问题所带来的各种行程纠纷,包括但不限于取消纠纷、费用异常、服务问题等。整体的解决方案如下:
其中,按照治理对象,分成订单维度治理、人维度治理。
考虑到体验异常相关因素较多,相对比较高频,订单维度治理的应用相对更广,挑战也更大。本文讨论的治理算法主要针对该部分。
2. 治理算法挑战
治理算法,作为O2O背景下新的算法方向,有如下的挑战。
首先,在业务上的复杂性很高。如第一章所示,在订单的全生命周期中、多个策略节点都需要算法能力建设;
另外,在滴滴的业务场景中,涉及到十个左右的品类,数十个业务场景,极端情况下需要维护近百个模型。另外,在技术上也有很大的挑战:
第一个挑战是高质量样本少。场景、品类、策略节点多,即使在当前有一定的标注人力的情况下,在每个场景的高质量样本都很有限。另外,如何将标注数据,跟线上人工判责的数据进行有效融合,也是很大的挑战。
第二个挑战是可解释性要求高。因为判责结果直接跟司乘体验相关,所以对可解释性有很强的诉求。但是机器学习模型本质上是相关性的学习,大量弱特征的引入在提升模型效果的同时,就会削弱可解释性。如何在效果和司乘感知上做平衡,需要持续思考。
第三个挑战则是多模态特征。通过完备的场景还原能力来做干预、判责等,需要用到订单、时空、司乘统计特征之外,也要参考司乘的沟通信息(比如司乘是否指路)、协商投诉文本(各自的表述)、以及桔视特征(比如多人分段上下车等)。是否能高效、综合的利用更多的多媒体信息,对工程、算法而言都是巨大的挑战。
3.
治理算法框架 宏观上看,以司乘费用纠纷处理为例,治理算法框架如下:
业务层:为了解决在订单生命周期中可能会出现的行程纠纷,提升服务体验。依托策略模型能力,设计了一系列的产品解决方案。从订单治理维度看主要包括以下三部分:
系统层:为了支持多品类、多场景的治理业务,系统上的沉淀如下:
本文的余下部分,将重点介绍上图的模型层、特征层部分。其中第四章重点介绍模型层,介绍我们在样本、模型上做的探索;第五章重点介绍特征层,我们在多模态的特征、流式特征上的思考。
4. 模型探索 在模型上,我们贴合业务场景与产品方案,围绕治理链路节点构建了大体量的业务模型,体系化地搭建起平台对异常订单的场景还原与识别能力。同时,进一步深耕模型算法技术,通过先进性的模型技术攻坚,推进工业界的模型技术应用与落地。比较典型的有:通过小样本学习技术,在较短时间周期内获取充足高质量标注样本;使用多任务学习技术,实现业务上相关监督信息的充分融合利用;元能力建模方案,将对目标(判责结果)建模的方式,转换成对过程(判责元能力)建模的方式,提升了机器模型的可解释性。
▍ 4.1 小样本学习**
在治理领域的很多场景,都会遇到高质量标注样本少的问题。全部人工标注的话,又会伴随着标注周期长与人力成本高的问题。比如在费用判责模型构建中,精准的人工判责样本非常稀缺,且很容易随着sop的变化而失效。所以在一定的时间窗口中,高效的利用样本,成为业务的一大挑战。
在学术界,小样本学习的常用方案主要有以下几类。
在治理场景中,我们主要使用了如下的几种方法。
方法一:在样本利用的探索上,我们基于自学习算法,在有限高质量样本量的约束下,最大化提升了模型的效果。
算法流程如下图所示:
一般情况下,司乘判责模型的单次迭代需要5k~1w的专家标注样本,这些样本的获取是昂贵且长周期的。通过自学习算法,样本量被扩充后,模型的AUC提升了0.4pp,相同准确率下召回也提升了2pp。
未来工作展望上,我们会进一步尝试引入自学习与主动学习相结合的标注方案,更为高效的使用判责专家提供的标注数据和标注能力。
方法二:滴滴网约车业务包括快车、拼车、优享、专车、企业级等多品类业务线。因为快车单量大,样本充足,模型算法的一期落地主要是快车品类。多品类业务线的模型接入就给迁移学习方案的落地提供了较为充分的空间。 迁移学习主要解决的问题是:数据采集成本和标注成本高,较短时间周期内大规模数据集的建构比较困难。迁移学习不要求训练集和测试集数据必须是独立同分布的,可以降低对目标域内的训练数据量和训练时间的需求。当前主要的技术落地算法是基于模型的迁移。即基于快车品类训练的模型,快速fine-tuning在其他多品类应用场景中。
方法三:模型视角的小样本学习探索,主要是多任务学习在治理算法场景的落地,这部分会在4.2章节详细阐述。
▍ 4.2 多任务学习
近两年工业界关于多任务学习模型的应用和工作,主要落地在推荐场景,如广告曝光到点击到转化过程中的CTR预估任务和CVR预估任务。当前比较先进的模型结构有ESMM、ESM2、MMOE等。对比业界的多任务学习落地方案和治理算法的应用场景,治理算法上也有多任务学习较为成功的落地。
从上图可以看出,广告的曝光->点击->转化流程与滴滴平台的大盘订单->投诉->有责的订单状态流转,恰恰都符合贝叶斯公式。都可以通过多任务之间的关系来建模出新的损失函数并适配新的模型结构设计。
绕路拦截模型结构:
如上图所示,以费用纠纷治理场景的绕路拦截模型为例,具体介绍一下我们多任务模型的优化点。
实验结果证明,多任务学习的方式能够有效地学习到投诉任务的特点,更好地辅助有责任务的学习,效果远优于单任务的模型。通过辅助任务的引入缓解了标注样本较少的问题,在策略生效点ESMM新模型的召回提升较为显著:相比线上的xgb模型,准确率提升0.6pp,召回率显著提升4.2pp;相比硬共享的多任务学习准确率提升0.2pp,召回率提升1.1pp。后续的A/B实验中取得了不错的线上业务效果。
未来工作展望上,我们会继续引入ESM2的结构,基于产品流程建模,进一步优化线上多任务学习模型的效果。
▍ 4.3 建模目标的演进
治理业务对机器判责能力一直有可解释性的诉求。所以机器学习可解释性的技术探索是相对比较重要的一环。然而当前业界对于可解释性的一些尝试还处于比较初期的阶段,较难在工业界落地。
为了弥补这个问题,当前主要考虑的有两种解法:一是考虑规则,结合LIME、SHAP之类的可解释性框架,引入一部分可解释性;二是将对目标(判责结果)建模的方式,转换成对过程(判责元能力)建模的方式。因为后者更符合业务的诉求,当前治理算法主要在尝试后者。将建模目标从判责结果,演进拆分为判责过程中的判责元能力构建,进一步推理出判责根因与判责结果,具体的落地方案如下图所示。
通过以上对判责内在逻辑的拆解:原始特征->判责特征(即判责元能力)->根因->结果有无责,完成了对判责元能力的建模,进一步构建了判责能力的可解释性。
5. 特征探索 治理业务对机器模型的一个较强诉求是场景还原能力,本质上,无论是纠纷干预、还是纠纷判责,都是通过完备特征的引入,来提升场景还原能力,从而进行订单的决策。在特征的引入上,我们经历了三个阶段:
▍ 5.1 初始阶段
在方向前期,相对基建能力不完备,引入的特征主要是三个维度:业务基础特征、时空特征、司乘统计特征等。其中前面两个部分是跟订单的业务流相关联的,大约300维,主要包含订单基本信息、时间/位置/距离、导航类、沟通交流类等。司乘统计特征大约1000维,我们建设了司乘各一个大宽表,包含司乘在完单、评价、习惯等全维度的统计特征,以及公司特征平台获取到的基础统计特征。 取消业务特征
费用业务特征
▍ 5.2 多模态特征大规模应用
在滴滴平台上,滴滴智能安全车载设备桔视已经覆盖超过50%的网约车订单,另外每个司机的手机都在进行全程的行程中录音,再配合全流程的轨迹信息,整体在场景还原上提供了非常丰富的多媒体能力。而多模态特征的应用,有通过端到端的框架联合训练、以及通过设计两阶段模型来应用的两种方案。
多模态特征表
▍ 5.3 流式特征探索 在特征形态上,我们基于线上的流式数据,如行程中的轨迹流、录音流、视频流等数据做了一些流式语义特征的挖掘。这里主要介绍轨迹流相关的技术方案。
轨迹信息的提取和利用对于纠纷治理业务有较大的价值,而目前对于轨迹信息的处理局限于提取距离差、速度等简单特征,信息损失大,故需探索轨迹的价值。
技术选型主要分为两大类:无监督(自监督)的表示学习方案和有监督的子网络嵌入方式。我们的实验探索主要基于后者展开。
有监督的子网络嵌入方案的建模流程如下。序列模型部分,我们主要尝试了主流的LSTM模型,整体模型AUC效果上:Bi-LSTM > Vanilla-LSTM > Stacked-LSTM。
6. 总结
治理算法是一个全新的领域,是随着O2O平台兴起以来,在线上线下治理、管控需求下新起的一个策略算法方向。在过去的几年,团队在NPS、CPO等公司核心关注的体验指标上,都取得了很好的业务收益;在技术体系上也有了相对深入的积累。
随着桔视的铺装,以及社会、公众对网约车平台服务的期待,在司乘体验提升上也还有非常大的持续优化的空间,在样本、模型、特征等领域仍然有巨大的挑战,我们团队也将在这些方向上持续探索。
本文由哈喽比特于3年以前收录,如有侵权请联系我们。
文章来源:https://mp.weixin.qq.com/s/1Qx33x7UpYY1waeDsmaE-Q
京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。
日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。
据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。
今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。
日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。
近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。
据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。
9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...
9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。
据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。
特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。
据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。
近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。
据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。
9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。
《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。
近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。
社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”
2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。
罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。