【原标题】蚂蚁金服:双十一背后,人工智能怎样“精打细算”
导语:蚂蚁金服智能服务平台负责人黎勇,来为我们讲解,双十一蚂蚁金服背后的人工智能。
双十一,狂欢节。一夜之间,淘宝、天猫用户消费千亿,峰值在线人数每秒数千万,峰值交易每秒数万笔。用户的每次购买都牵动商户从备货、调度、仓储、物流到售后的每根神经。
而人工智能已经成为超高负载请求背后”看不见的手“。仅在客服一项,2015年双十一当天淘宝+天猫全站通过自助服务共解答用户疑问超过500W,将蚂蚁金服客服效率提升了20倍。
今年双十一,我们邀请了蚂蚁金服智能服务平台负责人黎勇,来为我们讲解:
双十一的蚂蚁金服面临哪些挑战
人工智能将在双十一的哪些环节发挥作用
人工智能部门的研发成果如何与阿里产品结合,为超大规模的用户群服务
蚂蚁金服现有主要智能服务在实践中的特点和难点
黎勇简介:
现任蚂蚁金服智能服务平台负责人。
2015年加入蚂蚁金服,主要负责智能服务、智能运营、运营基础相关技术产品的规划和落地。
曾就职于ask.com公司任资深研发经理,长期从事搜索相关技术的研发管理,拥有丰富的关于数据、搜索、个性化、流量相关的产品与技术研发管理经验。
以下是本次公开课的分享内容,雷锋网(公众号:雷锋网)整理。
一、蚂蚁金服人工智能部门全览
简单介绍一下蚂蚁金服人工智能部门和它承担的作用
蚂蚁人工智能部的领军人是漆远,是麻省理工媒体实验室博士,普渡大学计算机系终身教授,担任过机器学习权威杂志Journal of Machine Learning Research的执行编辑和全球机器学习顶级会议ICML的领域主席,获得过微软牛顿研究奖和美国科学基金NSF Career奖。
由于人工智能基于多个学科,所以这个团队的人才多来自大公司和高校,其中还不乏从硅谷回来的,在人工智能领域有多年研发经验,是一个非常专业、精英的团队。
(很抱歉,我们目前还无法透露关于这个团队的规模和具体架构)。
这个团队对公司各事业群的产品及平台提供了人工智能支持,支撑了各项业务,比如风险控制、信贷决策、保险定价、服务推荐、客户服务等。
人工智能技术与蚂蚁金服的前端、中台和后台有哪些结合点?
最成熟、也是最典型的研发,是智能客服,上线后刨去成本,给公司节省了一亿元。这主要指的是人力成本。就在几个小时前,我们智能客服的自助服务率又刷新了纪录,达到了99%。这个一会儿具体谈到智能客服时会详细说。
再举一个退货运费险的例子。这是大家最熟悉的保险,有人会问,买了这个保险,买家频繁随意退货,保险公司不会亏大发了么?但其实,每个人买这个保险,价格都是不一样的,也就是大家常说的千人千面。
这背后,是支付宝的人工智能综合计算了每个订单的退货概率,考虑了消费者的性别,购物习惯,购物品类,所选店铺等等因素,比如女剁主更容易退货,服装类目退货概率比饮料类目更高,人工智能学习大量模型,大量规律,保险公司参考了人工智能的判断,定制了每个人的运费险保额。
再举一个例子。蚂蚁金服与保险公司合作的“航空退票险”上线之后赔付率一度高达190%,保险公司面临巨大的亏损压力。而通过引入机器学习技术,大数据技术建模优化后,有效地降低赔付率,并成功扭亏为盈,满足了保险公司的核保要求。
人工智能在金融上的几个重点应用方向,我们在客服这块已经有比较高的整合度。我们目前阶段的研究/工程重点是什么?
在金融生活领域,我们打造了人工智能平台,并且将人工智能应用于各种服务场景中,比如风险控制、信贷决策、保险定价、服务推荐、客户服务等。通过运用人工智能的力量,我们极大地扩大了我们的服务范围、降低了风险、提升了用户体验、削减了成本。
当我们讲到普惠金融时,很大的难点是如何能利用有限的人力财力去为尽可能广、尽可能多的用户提供尽可能深度和个性化的金融服务。蚂蚁金服的愿景是,未来十年要能够为全球超过20亿的用户提供普惠的金融生活服务,只有发挥机器的智能才能解决这种规模下的普惠难题。
当我们谈到机器智能时,机器是不是真正具备智能,有一、两个非常基本的测试,它能否通过图灵测试,或者费根鲍姆测试。我们希望未来能够打造出金融生活领域的机器专家,你跟机器对话,你感受不到它是机器,而是感觉就像是银行的金融服务顾问一样专业和贴心。
双十一期间,蚂蚁金服得应对哪些挑战?
双十一历经八年,现在已经常态化了。大家最关心的支付保障能力,也不是一个大问题了。
今年双十一,支付宝核心交易、支付、会员、账务等核心数据链全都运行在蚂蚁自主研发的数据库Oceanbase上,蚂蚁自主研发的弹性架构,能够利用全国多个城市的云计算资源,轻松hold住了今年12万笔/秒的支付峰值,这个新纪录,是去年峰值的1.4倍。
针对全球收全球付,针对时差的问题,集团大促有两部分,以中国和东南亚为主的买家在天猫淘宝上购买从北京时11日0点开始;其他国家地区为主的买家在Aliexpress上购买以美国西岸时间11日0点开始。
境外银行和支付渠道虽然分布广,但经历大促较少,抵御大促突发高峰的能力有限。为此今年国际支付通过系统优化,在支付宝系统内建立强大的蓄洪缓冲队列能力,结合用户体验等,做到尽可能削峰填谷保护国际发卡行和渠道。在大促之前也对重点渠道和发卡行进行了线上真实容量摸底演练。
今年双十一,蚂蚁平台数据技术事业群all in双十一技术保障的同学不到30人,要知道,我们做技术的团队有3000多人。
从2010年开始,我们给自己定的目标是每年专门针对双十一保障的投入成本比前一年要降30~50%左右,到2019年,我们不再花一分钱投入到双十一的技术保障上。
在支付保障一块,往年这方面的压力可以大到什么程度?
三四年前,每逢双十一大促,我们还要举全公司70~80%的技术同学all in到技术保障中。比如2010年大促当天,几百号技术同学(现在这个数字已经上升到3000多人)全部坐在电脑前,紧盯电脑看系统,有问题立马就要应急,不行就重启机器,容量不行就加机器,我们笑称这是“人肉云计算”。
临近凌晨,大家都以为终于扛过去了,结果又给我们来一个下马威,最后一个小时高峰突然出现,数据出现了容量问题,那时距离11.12日还有半小时,怎么办?当时幸好设计账务架构的时候,给自己留了一个降级的能力,我们停止了在同一个库上的会计系统,而会计和账务是通过一部消息进行同步的,会计系统是我们内部做对账使用的,停止会计系统在可控的时间内对业务是没有影响的,因为后续还可以通过可靠消息进行恢复,所以临时做了个决定就把这个系统给杀掉了,然后腾出50%容量就过去了。这才最终让那天有惊无险安然度过。
蚂蚁有哪些能力是对中小商户,或者外部企业输出的?
目前最成熟的输出是为我们的生态合作伙伴输出智能客服技术,降低他们的成本。
另外,今年8月10日,蚂蚁金服开放平台正式上线,开放了12个分类能力给到合作伙伴,覆盖商业经营全流程,包括蚂蚁金服最基础的支付能力,独家的数据、安全、信用、理财、融资能力,以及开店、营销、会员、社交、协同、公共服务等能力。
二、业界顶级的智能客服是怎么炼成的?
蚂蚁的智能服务平台部所开展的业务和它服务的产品
金融级产品在高可用性、以及资金安全上有非常严格的要求,蚂蚁金服金融业务的快速发展,对客服响应能力和应急能力提出了非常大的挑战。
蚂蚁金服智能服务平台核心目标是在保证业务快速发展的同时,给用户提供体验更好、服务质量更优的客户服务保障体系。
智能服务整体架构包含七个主要部分:我的客服(自助)、95188(热线)、服务大厅(在线)、服务工作台、运营工作台、社会化资源平台、舆情监控平台。目前蚂蚁金服智能机器人(我的客服)应用已经承接了日常90%的服务诉求,服务满意度接近人工服务满意度。
相比于市面上的智能客服,蚂蚁金服自研的智能客服技术有哪些特点
在2015年双十一当天全站求助通过自助服务共解答用户疑问超过500W,自助占比高达94%,整体接通率超过99%,将蚂蚁金服客服效率提升了20倍。
我们在业界是处于绝对领先水平的。我们可以量化一下来看效率的提升,按照人工处理的真实数据来估算,1个服务小二每天大概能处理100~150通用户求助,按照150通来估算,500万的求助量需要3.3万服务人员才能较好承接。而我们通过智能客服机器人能够给用户带去随身随地可触达的服务体验,服务满意度已经接近人工服务满意度。
蚂蚁金服的业务,会导致我们为旗下产品做智能客服,有什么样的特点和难点?
要理解这个问题,首先我们要了解蚂蚁金服的业务背景,可能在大家的印象里会把蚂蚁金服和支付宝打等号,实际上蚂蚁金服目前已经覆盖从支付、小微贷款、理财、保险、信用、银行、口碑等多元化的生活与金融服务,服务领域的多元化和复杂性,对客户系统的智能化、易用性、高效性带来了很大挑战。
我们不可能为每个业务单元都搭建独立的系统,因此在产品架构的平台化和扩展性上需要一开始就做到充分考虑。目前我们已经能做到一个新业务服务系统在一周之内快速上线。
跟市面上提供的智能客服技术,我们自己研发的智能客服技术主要有3个差异点:
1)基于大规模机器学习的智能化技术:
深度神经网络(DNN)被应用于实体提取、语言理解和对话状态跟踪,用来更好的理解用户意图。智能IVR采用了国际领先的基于深度学习的语音识别和对话技术,改变传统热线CC系统的菜单式引导模式,让用户直接通过对话语音描述需要求助的问题,理解用户语义进行精准的用户引导。用户画像和行为分析能够根据用户的不同状况,准确分析用户问题的复杂度和紧急程度,智能化引导用户进入最合适的渠道进行问题处理。例如对于涉及到安全、欺诈类的问题第一时间自动切换到VIP人工服务,最大化程度给用户提供安全保障。
2)完整的体系化行业解决方案:
智能客服系统并不是一个简单的自助机器人,它的背后是一个完整的工程体系。我们提供了包括我的客服(自助)、95188(热线)、服务大厅(在线)、服务工作台、运营工作台、社会化资源平台、舆情监控平台等七个主要系统的完整解决方案
3)基于蚂蚁金融云的企业级SAAS服务:
我们已经在服务赋能生态的目标上走出了坚实的一步,把蚂蚁金服自身业务沉淀的智能服务整体解决方案在蚂蚁金融云上打造了SAAS化的蚂蚁云客服产品,对外赋能合作商户、合作机构等生态合作伙伴。
怎样提升智能客服的问答准确率?
1)机器学习算法的大量应用:深度神经网络(DNN)被应用于实体提取、语言理解和对话状态跟踪,用来更好的理解用户意图。例如在用户进入我的客服首页时,会主动猜测用户问题,提前预判并引导用户更高效解决问题,给予用户关怀式的主动服务。
2)智能IVR技术突破:智能IVR采用了国际领先的基于深度学习的语音识别和对话技术,改变传统热线CC系统的菜单式引导模式,让用户直接通过对话语音描述需要求助的问题,理解用户语义进行精准的用户引导。用户画像和行为分析能够根据用户的不同状况,准确分析用户问题的复杂度和紧急程度,智能化引导用户进入最合适的渠道进行问题处理。例如对于涉及到安全、欺诈类的问题第一时间自动切换到VIP人工服务,最大化程度给用户提供安全保障。
3)知识库闭环运营:我们有比较完整的知识库闭环运营体系,能够根据线上用户反馈从客服对话记录中挖掘用户问题,生产和优化更加贴合用户真实诉求的知识库。
怎么把智能客服上的应用成果变成通用化的服务能力?
这是个非常好的问题。我们是用产品化的方式来支撑业务发展,以智能客服机器人为例,在做客服机器人的过程中,沉淀了机器人平台这个核心产品,包括对话管理、查询处理、知识库管理、用户画像、语音处理、语义理解、分发引擎、策略引擎、智能IVR、智能质检等一系列核心产品模块。
本身这个机器人平台具备很好的业务扩展性,在智能客服领域,我们在领域建模使用的是客户服务相关的知识。在口碑业务上只需要准备好跟生活服务相关的领域知识作为机器人的知识内容,它就是一个口碑生活助手。
当然,要做一个好的虚拟机器人助手,还需要与业务内容结合做更多后续的针对性调优和定制,这部分内容也是很关键的。
精彩问答节选
就构建智能客服机器人系统而言,请问最大的难点在那里?对现在的智能机器人客服平台打几分。
智能客服机器人系统最大的难点,从我的理解来看,包括两个方面:
1)智能化能力:客服机器人需要接近甚至超越客服小二的服务水平和能力,离不开对数据的理解和分析应用,这个过程中需要在数据计算能力,数据应用能力,人工智能算法上面都需要有全面的突破。目前我们的智能化水平我也只能达到70分,还有很大的优化和提升空间。
2)平台化能力:一个好的机器人平台,从我的理解来看,必须具备良好的扩展性。能够面对新的业务,快速的输出到新业务线,赋能新业务快速创新。而这个能力恰恰是中台能力的一个充分体现。
这也是我们未来输出赋能生态伙伴的强大基础,只有平台化做的足够好,才有可能变成一个好的云服务,满意不同类型,不同规模生态伙伴的服务诉求。也能够提供给我们的ISV,定制化适合不同企业的服务产品
我们如何做到新业务服务系统一周内能上线?
这其实有一个前提条件。底层平台确实已经做到了与具体业务知识的解耦,也就是我们说的平台化/产品化的方式来做技术产品。前提就是对应业务线的知识已经整理清晰,我们只需要把对应的知识库通过平台来导入,再结合通用的聊天,百科,天气,等等其他通用知识类的能力,可以在一周之内实现新业务客服机器人的上线。
当然,正如我刚才提到的,如果要做到90分以上优秀的效果,是需要较长时间的知识积累和持续优化的,这是一个必须的过程。
现在蚂蚁金服的客服场景,是不是有别于淘宝的客服场景?前者更多的是类似于理财产品推销员;后者更多是我们传统意义上理解的淘宝小二;如果有不同,两者在阿里体系中的区别以及协同合作的地方在哪呢?
你的理解是正确的,就是两者面向的群体和业务内容是有区别的。蚂蚁金服智能客服聚焦在金融相关的服务能力优化上,也包括你提到的未来可能的保险顾问,理财顾问等等。
在此基础上,我们希望能够沉淀完善针对不同金融行业的企业级解决方案,整体输出赋能我们的生态合作伙伴,这个是跟我们的金融云和开放平台的战略也是紧密结合的。
你们的对话系统,是直接用深度学习来做决策判断,即跳过了传统对话系统中对“对话状态”的认为定义?如果是这样,那么你们的对话系统的输出空间是什么呢?(i.e. action space)
深度学习算法的应用,在我们的智能客服里面还没有达到您所提到的这种直接跳过对话状态定义的能力。
目前我们的机器人平台是一个比较完整的工程体系。
仍然会整合不同的处理策略,有很多可以“人为定义”的业务知识,依然是用精准模板的方式来解决的。你可以理解对话管理的策略是一个链路式的能力,可以根据具体的业务场景来定制策略。可以定制不同的模块插件化接入。
对于新增加一个领域,比如 “询问某个【具体保险产品】的【收益率】” 这样一个需求,假设这个领域事先没有做过,你们现在的系统能够多快支持? 特别当这种需求比较杂乱而且量很大的时候,没有一个统一的框架,你们的系统怎么应付?
这个有挑战性的。我们正在做的尝试,正是您所提到的这种模糊性,或者说是新业务知识的快速学习能力。我们人工智能团队,也就是漆远博士团队正在做这方面的研究和应用。下次如果有可能,可以邀请漆远博士跟大家做一个更深入的交流。
本文转自雷锋网,如需转载请至雷锋网官网申请授权。
本文作者:吴德新
来源:雷锋网