“96%的高级IT专业人士相信,人工智能(AI)应用将促进生产力和企业效益的提升,几乎同等数量的受访者(95%)表示需要进一步投资升级他们的IT基础设施,以支持他们应用AI。”在近日举行的“大数据下的人工智能高峰论坛”上,希捷科技公布了以上的最新调研数据。
在海量数据的支持下,伴随着算法的不断增强,人工智能的应用正在某些领域萌芽、成熟。然而,业内人士关注的是,市场感受到了来自大数据和人工智能的蓬勃活力,但也不应忽视其发展中仍存在的挑战与问题。
数据即基础
谈到基础设施,传统的观念中人们会想到水、电、煤气、铁路、公路和机场等。然而,对未来社会而言基础设施是什么?中国软件行业协会常务副秘书长陈宝国认为,“是数据”。
IDC、希捷科技曾发布了《数据时代2025》白皮书。报告显示,到2025年全球数据总量将达到163ZB。这意味着,2025年数据总量将比2016全球产生的数据总量增长10倍多。其中属于数据分析的数据总量相比2016年将增加50倍,达到5.2ZB(十万亿亿字节);属于认知系统的数据总量将达到100倍之多。爆炸性增长的数据推动着新技术的萌发、壮大。人工智能便是其中最具代表性的科技之一。
然而,如此多的数据从何而来?据希捷科技全球副总裁暨中国区总裁孙丹介绍,2007年之后数据每年以翻两倍的速度在增长,此时的大部分数据都是个人产生的。但这并非数据增长的全局,数据未来的爆炸性增长将来自物联网、来自工业智能化的生产性数据和物体产生的数据。
陈宝国介绍称,未来增长的数据“不仅是人类生活数据的积聚,更重要的是工业和自动化的数据”。他指出,到2050年,整体来讲全球有10万亿传感器布置到全球社会生活各个领域,有20万亿美元产业规模,将产生10万亿美元的智能软件市场规模。
不仅如此,未来数据将会成为重要资源和战略资产,对数据资源的获取、占有、控制、分配和使用的能力成为一个国家和地区经济发展水平和竞争能力的重要标志。而数据安全也将成为国家安全的重要组成部分。
在IDC的预测中,到2025年,全球三分之二的金融公司将整合第三方认知数据。但孙丹认为,这是一个十分保守的估计,“我觉得100%都会整合,不整合一定会落后”。
奶粉与婴儿
“人工智能如果是一个婴儿的话,数据其实是奶粉,孩子吃得越多,长得越大;奶粉的质量越好,孩子智力水平就越好。所以数据越大,数据质量越好,人工智能所达到的水平就越高。”谈到人工智能与大数据的关系时,希捷科技中国区总裁孙丹用了一个形象的比喻。
事实上,如今为市场所关注的人工智能技术并非今日才产生。自1956年斯坦福大学计算机科学家约翰·麦卡锡(John McCarthy)在达特茅斯会议上首次提出“人工智能”概念至今,已有60余年的历史。而诸如麻省理工学院人工智能实验室、斯坦福人工智能实验室等科研机构也早已开展人工智能研究多年。然而,人工智能技术受到如此广泛的关注却是近几年的事。
这一科技名词之所以如此博人眼球,离不开AlphaGo大战围棋冠军等事件的影响,但从根本上是由于海量数据的产生,为人工智能的茁壮成长提供了充足的养料,推动这一技术逐步走向市场、落地应用。
孙丹回忆,20年前IBM公司就曾提出智慧地球,然而多年过去却只是实现了数字化,迟迟未能实现智慧化。如今,人工智能可以落地,是随着智能手机的出现,让数据量每年以翻两倍速度增长,为推动算法的精进和人工智能的研究提供了源泉。在人工智能的发展中,高质量的数据越多,算法越精炼,才能令三者的发展形成相互推动的良性循环。
“吃奶粉还不一定让孩子成长,还需要我们按时喂他,同时需要他有良好的消化系统,所以大数据需要加上很好的算法和计算力,才能产生智能。”中科院计算所计算机体系结构国家重点实验室研究员及博士生导师、国家超算济南中心主任张云泉解释称。
此外,大数据的暴增仍有诸多挑战需要面对,如何有效使用大数据便是其中的一大难点。
“未来我们会有163ZB数据,但是真正存下来的数据只有1%,问题就来了,99%是无效数据,哪些是有效数据?”在孙丹看来,这将是未来所有企业都面临的一大挑战。
相伴相生
安防、金融、智能家居、无人驾驶……如今人们已越来越多地感受到生活和工作为人工智能所影响,而未来人工智能将继续向我们生活、工作的方方面面渗透。
有数据显示,到2019年,40%的数字化转型项目将使用AI服务;到2021年,75%的商用企业级应用将使用AI,超过50%的消费者将享受机器人客服的服务,50%的新型机器人将采用AI。
在大数据与AI积极互动推动应用落地层面,张云泉十分关注AI在医疗领域的突破。他关注到,在糖尿病、肺癌、皮肤癌等涉及图像类的诊断中,如果能够积累足够的高质量的图像数据,人工智能诊断的水平可以达到中上等专业水平,作为医生的助手在一般的医院中应用。
“这对于未来提高就诊效率和提高诊断准确率,降低医生工作劳动强度很有效,毕竟医生看片子每天看的数量是有限的。”张云泉说。
在这类诊断中,医生所关注的图像中所反映的细节,正好是算法所擅长的,它可以非常精准地诊断病人的患病程度,甚至可以开出处方。
尽管有些领域,相关应用正日趋成熟,但人们应当看到的是,人工智能的发展仍处于婴儿期。目前,人工智能尚不能完成人的推理、演绎,其能力更多停留在学习、归纳层面。
“既然是归纳,可能它做不到窥一斑而知全豹,能做到的是可以孜孜不倦地学习和获得,你要想学习就需要学习的素材,数据的重要性就体现出来了,也就是说需要更多的奶粉。”百度公司主任系统架构师、百度系统部技术委员会主席崔永新解释道。