邓洲:人工智能的昨天、今天和明天

科技工作者之家  |   2018-07-07 20:24

人工智能是信息时代和新科技革命浪潮中尖端技术的代表。一年多前,谷歌公司的AlphaGo取得了与国际围棋大师李世石比赛的胜利,随后又化名Master在网络平台上横扫中日韩棋坛,取得60连胜的辉煌战绩。具有“深度学习”功能的计算机能够在迄今最复杂棋类游戏上战胜人类,而在更多的工业和商业领域,人工智能的研发和产业化不断推进,人工智能的美好时代已经到了剧幕拉开的前夕。

d28a75.jpg

从20世纪中期发明需要人类指导才能运行的计算机算起,科学家用了半个多世纪的时间让计算机具有自主学习能力,这一飞跃不仅仅是计算机科学和产业的里程碑,也将对各行各业和人类社会产生巨大影响。AlphaGo的成功,意味着计算机在“智力”上超过人类是早晚的事情,而这一转折点正在逼近,同时也表明了人工智能进入以“深度学习”为代表的新发展阶段。从某种意义上讲,计算机已经发展到能够自行编程执行新任务的阶段,未来的人工智能将主动适应人,用人类与生俱来的语言、动作、情感与人类互动交流。

这一变化正在全球掀起巨浪,引发投资热潮,还会在未来彻底改变人类的生产和生活。

派别之争

人工智能(AI)并非新鲜事物,最近两年引起如此广泛的关注,主要原因是采用新技术路线的人工智能突破了传统发展路线的约束,将人工智能的性能和商业化应用推向新的阶段。所谓新的技术路线,就是采用“深度学习”,让电脑像人脑一样运转,让机器像人一样思考。这不仅仅是一项技术能力,在人工智能研究的早期,这种思路并没有得到广泛的认可。

  1950年,“人工智能之父”图灵发表论文《计算机器与智能》,对人工智能做了开创性的构思。但是,图灵并没有给出一条人工智能研究的具体路线。在他之后,对人工智能的研究分化为两大派别:一是强调思路模拟的控制派;二是强调自我意识的仿生派。控制派的观点是,人工智能必须依托于逻辑系统,计算机和机器的每一个判断、动作都基于强有力的逻辑关系,是对预设的准确反馈;仿生派则不然,强调形成类似于人脑的神经网络,靠“人工”神经网络形成意识自行思考。简单而言,控制派认为人工智能就如同一个专家会议,希望通过完美无缺的逻辑来实现思考;而仿生派认为人工智能就是人脑,人脑怎样思考,计算机就怎么思考

由于维纳、明斯基、麦卡锡、香农等一批声名显赫的学者偏向控制理论,维纳的《控制论》可谓20世纪最重要的学术著作之一,在人工智能被提出近半个世纪的时间里,仿生派都没有得到很好的发展,在20世纪后半叶研制的人工智能实验机器几乎全部采用控制派的理论。

仿生派的起源其实并不晚,甚至早于图灵人工智能概念的提出。可惜的是,在相当长一段时间里,神经科学和计算机科学并没有很好结合,两者各有成就,但仿生派始终不敌控制派。直到20世纪80年代,仿生派才进入一个繁荣时期,其中的代表是1982年霍普菲尔德提出了递归神经网络,1986年鲁姆哈特和麦克莱兰提出了具有里程碑意义的BP神经网络。在20世纪90年代,互联网兴起和普及,大批计算机科学家投入具有巨大市场和经济效益的互联网相关研究中,无论是控制派还是仿生派取得的成就都被互联网的高速发展所掩盖,当然,互联网作为新的信息技术手段也对人工智能的进步提供了全新的平台。2006年,杰弗里•辛顿提出了反向传播算法和对比散度算法,即“深度学习”,突破了明斯基在半个世纪前提出的神经网络存在的局限。2012年,斯坦福大学和谷歌秘密X实验室用1000台计算机构建了全球最大的电子模拟神经网络,该网络拥有10亿个连接的人工神经网络“谷歌大脑”。实验人员向神经网络展示1000万张从YouTube上随机提取的图像,最后系统在没有任何外界干预的情况下,认识到“猫”是什么并成功分辨出猫的照片,准确率超过80%,这一事件为人工智能发展翻开崭新一页,标志着以“深度学习”为代表的人工智能进入应用阶段。

可以说,20世纪80年代以前,控制派一直处于上风,仿生派自出现之后一直受到排挤和掩盖,直到21世纪初才有引人瞩目的应用成果。同时,控制派主张的思路模拟的缺陷和局限性开始暴露出来。应该说,人工智能在近几年的大发展主要是由以“深度学习”为代表的仿生派推动的。当然,这也并不意味着所有的科学家都看好“深度学习”。就如同在控制派风头正旺时还有一群仿生派科学家默默研发一样,目前也还有一大批科学家继续尝试用逻辑推导的方法提高机器的智慧水平。例如,IBM一直保留采用控制理论开展人工智能研发的沃森团队,谷歌也组建了一个尝试使用非深度学习技术提高计算机智力水平的小组。现在的科学家已经不像前辈那么坚守门户之见了,仿生派和控制派开始合作,共同目标是尽快迎接人工智能时代的到来,至于采用什么样的方法,融合各家之长的方法是最好的。

像人类一样学习和思考

要真正理解时下的流行词“机器学习”“神经网络”“深度学习”的原理,需要高深的生物学、数学和电子信息方面的知识,但是,我们仍然可以通过简单的方法来了解基本情况。人工智能就是要让机器具有人脑一样的智慧,机器学习让机器像人一样学习以获得智慧,人工神经网络模拟人脑神经满足机器像人一样学习的硬件条件,“深度学习”则是迄今效果最好的学习方法。

我们抛开繁杂的生物学和数学概念,以一个最简单的对苹果还是梨的判断,来说明神经网络和“深度学习”是如何展开的。颜色、形状和气味是判断一个水果是苹果或者是梨所需要的最基本特征,当这些信息通过传感器进入人工智能系统,电脑根据以往的经验,在区分苹果和梨上,形状的信息最为重要,赋予更高的权重。如果信息表现为红色、圆形、苹果味,最后的结果就是苹果。这个过程看起来非常简单,但是,对于一个未加训练的人工神经网络来说,发生错误是难免的。例如,并不是所有的苹果都是红色,有的苹果是黄色,和梨的颜色非常接近;有的梨形状和苹果也很接近;嫁接的新品种苹果梨到底算苹果还是梨等问题,都会影响人工智能的判断。还有一个更为关键的问题是,电脑最初又是如何知道从形状、颜色和气味去判断一个物体是苹果还是梨。这些对于人脑看似简单的问题,在人工智能发展过程中都是一个个巨大的挑战。

整个过程可以概括为三个步骤:知道苹果或例的特征项(形状、颜色、气味)、了解对象的特征表现、判断是苹果还是梨。很显然,计算机最擅长的是最后一个步骤,如果有人帮助输入了对象的形状、颜色和气味信息就能给出判断结果。这样的做法似乎很可笑,但并非完全无用。信息管理和数据挖掘中经常会使用到这种方式,前提是由信息管理专业的人士手工或使用软件将数据挖掘的材料准备好,这就如同由人来帮助计算机判断水果形状、颜色和味道,实际上,是由人工来弥补传统计算机的局限性。当人工智能的应用范围扩大,越来越多需要借助人工智能帮助的人员也并非都是信息管理专业的人士,初级的神经网络(或者说初级的计算机系统)已经跟不上形势和需要了。

2006年,辛顿提出深度信念网络将人工智能研究和应用又向前推动一大步。计算机的硬件技术飞速发展,也使得构建大规模的人工神经网络成为可能,云计算、大数据、高速互联网等技术的出现和运用进一步提高了人工神经网络的性能。至此,计算机已经具备初步的学习和思考能力,虽然单单从一次学习看与人脑还有巨大的差距,但是,不要忽略了计算机的强大的运算能力。谷歌公司宣称,AlphaGo是通过自我对弈的方式不断提高棋艺水平,这与人类棋手的训练过程是一样的。不同的是,AlphaGo只需要一秒钟就能完成数局对弈,而且对手(其实就是AlphaGo自己)总是高手。在与欧洲冠军樊麾比赛前,AlphaGo完成了3000万次训练,而与李世石比赛前,自我对弈的训练已经超过1亿次,这样的训练速度和强度是人类棋手望尘莫及的。速度优势(赛前的“深度学习”训练)和正确的方法(和人类棋手一样的下棋方法)是AlphaGo取得胜利的两大保障。

会学习的机器能有多智能

这么多科学家的努力、巨额的研发经费投入,结果就是具备一个三岁小孩就能够熟练掌握的技能——把苹果和梨区分开来,这是不是有点得不偿失?千万不能低估这看似简单的一步,要知道,在人不介入的情况下,使机器准确区分苹果和梨,几代科学家已经为之奋斗了半个多世纪且到目前为止也不能做到100%准确。但是,计算机在运算速度上具有远超过人类的优势,且这种优势不断扩大,其“学习”的速度也是惊人的,这使得现在人工智能在多个领域进入应用阶段。

——图像和语音识别

在语音识别上,中国企业一招领先。2014年,百度对外发布了其基于“深度学习”的语音识别系统“Deep Speech”。该系统能够模仿人类大脑新皮层中的神经活动,通过“深度学习”识别出数字形式的声音、图片等数据。实际应用发现,在车内、人群等噪音环境下,Deep Speech系统的出错率比谷歌Speech API、Wit.AI、微软Bing Speech、苹果Dictation低10%多。为了开发Deep Speech,曾在谷歌开发全球最大电子模拟神经网络的吴恩达教授领导的百度团队收集了9600人的7000个小时的语音,并人为加入15种类型的噪音,将语音样本数据扩充到10万个小时,然后让Deep Speech在噪音环境下学习识别语音,这个过程就是“深度学习”的过程。

在国际上,IBM、谷歌、微软等公司都在开展“深度学习”下的语音和图像识别研究,且都在近年来取得飞速发展。2014年,谷歌的Google Net团队采用“深度学习”技术在计算机视觉挑战比赛中刷新了分类和侦测的记录,且比此前的记录提高了2倍多,该技术正在被应用于谷歌的自动驾驶系统中,帮助计算机和人类驾驶员标注和预警道路上的危险情况。2015年,谷歌在其Google Photos中嵌入了Google Cloud Vision API,能够对字符、人脸、地标、Logo等做相当精确的识别。通过这个系统,机器识图能力大大提升。以前,计算机只能帮助使用者筛选照片,现在只要输入相应的类别就能够挑选照片。2015年,微软宣布其图像识别系统的错误率仅为4.94%,这不仅打破此前百度创造的5.98%和谷歌6.66%的记录,甚至低于人类在归类识别时的5.1%的错误率。

为了推动“深度学习”在语言识别上的应用,互联网巨头在近两年都开源了“深度学习”工具包,吸引更多人在自己的平台上开展语音识别的研发。2015年,谷歌开源了具有图片搜索功能的Tensor Flow机器学习系统,随后,微软在2016年也开源了用于语音识别的“深度学习”工具包CNTK。开源思想能够建立更大的平台,这有助于形成更大的学习数据库,以及开发更多的应用产品。

——科学研究

2012年,希顿领导的一个团队在德国著名制药企业默克举办的鉴别可能导致新药分子的比赛中胜出。希顿团队的方法,是采用“深度学习”将目标对准那些最有可能与靶标绑定的分子。最终,默克公司采用了希顿团队的方法,将新药研发成功率提高了15个百分点。

麻省理工学院正在利用“深度学习”技术分析大脑切片的三维图像。过去,图像识别是依靠在校研究生和本科生完成,这非常花费时间,且经常出现错误,甚至遗漏掉最有研究价值的图像,这对研究工作的进行是致命的。运用“深度学习”技术,研究人员找到更好的办法对三维图像做标注和计数,大大减少了人工工作量,同时提高了准确度。

——预测分析

“深度学习”的一个有意思的应用是预测分析。与传统的逻辑推导不同,通过“深度学习”的预测分析结果令人惊讶但异常准确。例如,2006年,美国田纳西州孟菲斯市警察局启动“蓝色粉碎”行动。由于采用IBM 的神经网络技术预测犯罪发生的时间和地点,大大提高了警力配置的效率,到2011年,孟菲斯市财产犯罪下降了26.2%,暴力犯罪下降了23.6%,凶杀案则下降了40%以上,五年多里,有近2万宗罪行未能够实施。

谷歌在2008年推出的“谷歌流感趋势”系统,通过对流感相关关键词的搜索开展数据挖掘和“深度学习”,创建了流感趋势地图,目前已经能够支持25个国家的流感趋势预测,成为多个国家疾病防控部门的重要参考。2014年巴西世界杯期间,各方人士都在预测比赛结果,在小组赛后的15场淘汰赛中,微软利用“深度学习”的方法预测,结果全部准确无误,而谷歌的预测也猜中了其中14场比赛结果。

是盛宴,也是豪赌

随着人工智能在各个领域的产业化商业化应用取得显著成效,支持人工智能技术和产业化的发展几乎成为所有有能力的国家重点扶持的技术和产业。虽然人工智能尚没有进入真正的商业应用阶段,但是,没有哪个国家轻视它的发展前景,纷纷在重要领域加强资助,提前布局。

发达国家政府增强对人工智能的重视程度,主要表现在几个方面:一是加大资金投入,设立专项资金支持人工智能技术开发和商业化应用;二是设立专门机构统筹各种资源扶持人工智能发展;三是制定顶层设计,颁布相关专项战略规划,提出发展目标;四是完善法律体系,保护相关各方利益;五是依托载体促进人工智能应用,目前,机器人仍然是人工智能最重要的载体。当然,各个国家根据自身定位和优势禀赋也有所侧重点。例如,美国秉持领先全球技术和预防被潜在竞争对手超越的理念,更加注重人工智能基础技术的研发,以及在军事等高端应用上对全球的引领;日本注重将人工智能与机器人产业相结合,继续巩固全球机器人强国的地位;德国将人工智能纳入到“工业4.0”框架中,通过人工智能进一步提升德国制造业的智能化水平;英国则更加注重相关人才的培育。

在人工智能的盛宴中,中国没有掉队。2017年3月,“人工智能”首次出现在政府工作报告中,仅仅四个月后,国务院印发《新一代人工智能发展规划》,提出了六方面的重点任务和一系列保障措施,规划到2020年人工智能总体技术和应用与世界先进水平同步,人工智能核心产业规模超过1500亿元,带动相关产业规模超过1万亿元;到2030年,中国人工智能理论、技术与应用总体达到世界领先水平。

资本对前景已经明确但市场尚未形成、竞争格局尚未确定的产业充满兴趣。近些年,在产业和企业层面,各跨国公司都在加速布局人工智能以抢占未来竞争制高点。2017年以来,在人工智能领域,谷歌推出Gradient Ventures风险投资项目,Basis Ventures投资了1.36亿美元,AI公司融资1.02亿美元,微软风投成立了自己的人工智能基金,丰田则为人工智能投资1亿美元。

每一次技术革命都会为赶超者带来“弯道超车”的历史机遇,但是,如果把握不好,将再一次陷入跟随的漩涡。经过几十年在计算机和相关领域的努力追赶,中国已经具备发展人工智能研发和产业的基础和条件,近年来在人工智能的基础研发、产业化上都取得令人瞩目的成就,进入世界先进行列,与发达国家的分工和竞争关系,正在由“跟跑者”角色向“并跑者”和“领跑者”的角色转变。

百度从2012年开始在搜索引擎使用“深度学习”技术,在最近的两年半的时间里,百度在人工智能方面的投入高达200亿元,为了在无人驾驶领域上率先布局,百度成立了智能驾驶事业群组(IDG)。目前,百度在中国北京和美国硅谷有三个深度实验室,从事全球领先的技术研发,致力于运用大规模“深度学习”技术,通过数十亿的连接构建全球最先进的语音系统训练网络。腾讯在2012年成立的优图实验室主要从事人工智能在图像相关领域的应用开发。2016年,腾讯将人工智能提升为企业核心战略,并成立人工智能实验室。在最近两年时间,腾讯在全球投资布局人工智能产业,如特斯拉、Diffbot、iCarbonX,等等。阿里巴巴将人工智能发展定位于“云服务”,突出自身优势的同时也避开与竞争对手的正面较量。早在2012年,阿里巴巴就开始汇集一批来自全球的科学家团队,从事人工智能领域的技术研发和储备。到2015年,其人工智能应用产品陆续上市,但大多围绕其“阿里云”平台提供服务。2017年初,联想成立人工智能实验室,并计划在未来四年在人工智能、物联网和大数据方面投资超过12亿美元。至2021年,联想集团每年研发开支将约为15亿美元,上述款项将占总研发预算的20%以上。

必须注意的是,目前,人工智能很大程度上还只是一个技术工具,甚至只是一个概念,并非具体的成熟产品,因此,对于国内外投资者和从业公司而言,人工智能与其说是一场盛宴不如说一次豪赌。在资本簇拥下,各大公司频繁翻新投资记录,带来包括人才在内各种发展要素价格的全面上涨,一些初创公司没有产品、没有收入、甚至没有技术,仅凭一个概念就能够被估值几亿甚至十几亿。人工智能很有可能会引发一次席卷全球的投资泡沫。例如,国内人工智能企业已经超过1000家,并且其中有一半已经获得投资,估值超过10亿元人民币的举不胜举,在大浪淘沙中,很多企业将在未来一两年甚至更短的时间内退出市场。

豪赌不仅反映在资本上,也反映在人力资源上。人工智能的开发和应用对资本品没有过高的需求,模拟人脑的“深度学习”网络已经不像十年前那么难以获得,云计算的出现使得很多公司甚至不需要自己的硬件设施,相比较,人才显得格外重要。为了获得领先技术能力,各个公司在人才引进上的预算几乎不设上限,纷纷花巨资吸引世界顶尖的人才入驻,这使得人工智能行业成为全球离职率最高和薪酬提高最快的行业。

根据相关调研报告,2016年,中国人工智能业内平均员工离职率高达44%,离职的员工一些是被其他公司以更高薪酬挖走,也有相当大比重是离职创业,成立新的公司,然后吸引新的投资,再在人才市场创造新的岗位。

并不是只有顶尖的人工智能专家才参与其中,中级和初级技术人员,甚至跟人工智能不怎么相关的人也不愿在浪潮中落伍。越来越多的大学开始教授人工智能相关的课程,而课程老师来自计算机、数学、管理工程学,甚至哲学、经济学、文学和艺术背景;书店里人工智能专业和非专业点的书籍在近两年出版了几百本,所有的信息都让人感到,如果你不懂人工智能还不愿意去学习的话,很快将被人工智能替代而失去工作。中国语音识别企业科大讯飞仅仅半年就从外部引进人才3500名,其中,各行业关键人才接近100名,在校招方面共引入600多名优秀的大学生,这600多名优秀的大学生是在接受了5万多份简历(均来自“985”“211”高校),由此可见人力资源市场对人工智能的趋之若鹜。

2017年7月,全球最大的职场社交平台领英(LinkedIn)发布了首份《全球AI领域人才报告》。报告称,过去3年,仅通过领英平台发布的AI职位,就从2014年的5万飙升至2016年的44万,增长近8倍。

随着人工智能发展进入“深度学习”的新阶段,在社会生产生活各方面的应用已经可以预见,任何国家、企业和个人都不愿意在这一场还没有开始的比赛中输在起跑线上,都要在人工智能的盛宴中抢到一个好的座次、位次,从国家、到企业再到个人,都在围绕人工智能展开一场豪赌。

路口的选择

无论是神经网络还是“深度学习”,对人工智能的研究注定是个成本高昂的事情,短期内的经济回报可能并不显著,只有富有远见且资源丰富的国家、跨国公司和科研机构才能够承担得起。人工智能必定将在未来改变我们的生产和生活,而在这之前需要持续的投入和不断的尝试。人工智能能够多快和多好地真正服务于人类,在很大程度上取决于实验和试点应用的范围和程度,就如同“深度学习”自身一样,学习越多、掌握越多、能力也就越强。

我们正处在人工智能大发展的路口,选择哪条道路是第二个需要考虑的问题,第一个更重要的决定是必须进行选择,谁也不知道人工智能商业应用还有多久会爆发,但发达国家和跨国公司已经在积极准备,我们也必须认真选择。

中国是一个劳动力大国,一个引起广泛担忧的问题是,人工智能的出现会不会抢走人的饭碗,造成大面积的失业问题。

这其实是一个老生常谈的问题,在人类工业化的进程中,几乎每一次技术突破、新事物的出现都会引起对就业的惶惶不安。人工智能的出现也不例外,据花旗银行和牛津大学估计,未来几年,机器人和人工智能等技术可能会在全球范围内替代数以百万计的工作岗位,经合组织国家中57%的就业机会都会面临人工智能的挑战。但实际上,人类从来没有被自己创造的机器替代过,以前没有,现在没有,今后也不会有。被新机器替代工作岗位的人总会在新机器创造的新岗位上找到工作,人工智能惟一特殊性是,从前机器替代的主要是人类的体力劳动,而现在将替代脑力劳动。

当然,不会减少工作岗位并不意味着不会对就业产生影响。正如以前机器最先替代了最危险、最繁重、工人最不愿意从事的岗位一样,人工智能最早填补的还是人类脑力劳动者不太愿意从事或难以胜任的岗位。但是,随着人工智能技术进步和应用普及,对一些技术含量较低、时效性较强的脑力工作者自然会形成挑战。例如,在2016年里约奥运会期间,今日头条的写稿机器人“张小明”同学通过对接奥组委的数据库信息,实时撰写新闻稿件,以几乎同步于电视直播的速度发稿,6天共生成简讯和资讯200余篇。而腾讯的写稿机器人,在半年时间里创作出30万篇内容产品,字数超600万字。可以预见,翻译、记者、司机、保安、客服、家政、会计等职业在未来均存在被人工智能取代的可能性。无需过分担忧,这一过程不是明天就会发生,和机器替代体力劳动一样,人工智能替代脑力劳动岗位会经历较长的时间。虽然信息化加快技术进步和传播步伐,但是,人类自身学习和进步的速度也在加快,我们需要的不是担忧会丢掉工作,而是调整教育结构,发现新的岗位,为人工智能时代的到来做好准备。

还有一个很有意思的现象是,国内外对人工智能投入巨大且掌握领先技术的大多数是互联网公司。IBM最早入局,但现在并没有站在人工智能的领军位置,这不得不让人联想到柯达公司最终葬送在自己发明的数码摄影技术上。中国情况也是如此,以百度、腾讯、阿里巴巴为代表的互联网公司对人工智能的发展最为热衷,虽然联想、海尔、长虹等企业也在人工智能上投入巨大,但似乎没有掌握国内人工智能发展的主导权。

人工智能作为未来的一种通用技术,本身应用的领域是有限的。就如同互联网自身并不会产生太大价值,但与企业经营、产品销售、娱乐游戏相结合却产生巨大社会和经济效益并最终改变我们的生产生活。人工智能最终也需要嫁接于特定的产品和业态上,否则,只会是一些科学游戏。从发达国家及其跨国公司已经浮出水面的人工智能战略可以看出,很多国家都会在人工智能的具体应用上有所侧重,例如,日本就非常强调人工智能与自身优势机器人产业的融合。

中国是全球制造中心,虽然制造业的比重不断下降,但客观上讲,制造业仍然是中国最有国际竞争力的产业部门。相比较,发达国家的优势产业部门是服务业,人工智能的研发和应用聚焦于互联网是能够实现强强联合。而中国如果也仿效发达国家将人工智能的投资重点放在服务业上,一方面会引起和发达国家跨国公司的正面竞争,同时,可能还会失去在优势制造业领域率先发展人工智能应用的战略先机。当然,这并不意味着我们不需要在图像、语音识别等领域上发展人工智能,只是我们需要慎重选择人工智能发展的重点领域和方向,在新一轮的国际分工格局中有自己的特色和特点,而不是再一次被锁定在低端环节。(本文作者系中国社会科学院工业经济研究所副研究员)

来源:财新周刊网

作者:邓洲

运营编辑:宫奥博

相关推荐 换一换