机器学习:人工智能的三种设计模式

科技工作者之家  |   2018-09-05 00:00

在人类社会发展的进程中,工具、技术一直都是非常重要的推动力。尤其是在18世纪中叶进入工业文明时代以来,在工业革命、技术革新的推动下,社会发生了巨大的变革,机器生产代替了手工劳动,手工业逐渐消失,大批种类繁多的自动化机器不断出现。这种现象在计算机出现之后变得更加严重。

1946年,第一台计算机诞生,自此,计算机在人类的生产、生活中扮演的角色越来越多。起初,计算机只是单纯地帮助人类解决计算难题,后来随着计算机技术的发展和互联网的出现,计算机不仅为人类提供了搜索、储存、游戏、娱乐、控制等服务,还催生了很多工种,如软件工程师、计算机系统工程师等,提供了诸多就业岗位。

现如今,人工智能也面临着与计算机相似的境况,在其引导下的人类发展方向也有了诸多可能。目前,谷歌、英特尔、联想等公司在人工智能产品开发方面取得了很多成就,在这些成就的影响下,未来,人工智能的设计模式有三种,如图所示。

“训练数据”模式

目前,有监督的机器学习领域是人工智能技术应用最为广泛的领域,有监督就代表算法需要通过学习从训练数据中获得,这与人类的间接学习方法有很大的不同。

在这种情况下,机器学习算法的效果如何,在很大程度上取决于训练数据的质量和数量。训练数据的搜集是一项非常具有挑战性的工作,即便是诸如谷歌这样的大公司也不得不小心谨慎,谷歌每年在搜集整理训练数据方面需要耗费的时间和精力都非常大。

但显然,训练数据的搜集和整理工作是一项“无底洞”。例如,Facebook推出一个新表情,为了了解这个新表情的使用情境,机器学习算法需要大量的例子。所以,在机器学习算法中,搜集训练数据需要大量的人工劳动。

“人工参与的循环链”模式

自计算机出现之后,借助计算机,很多问题都能得到快速解决。但是,又有很多看似简单的问题而计算机却难以提出解决方案,例如,如何使用计算机引导类人机器人走路的问题。在人工智能领域,也有一些类似的问题存在,例如,针对某个问题,人工智能算法预测的精确度能够达到80%,却难以提升到90%。

但机器学习算法有一个很大的优点,就是对其优劣势非常清楚。对于不能做出精确判断的问题,机器学习算法能清楚地告知工程师,由工程师予以解决。在这种情况下,形成了一种“人工参与的循环链”模式,其具体内容是对于某个问题,当机器难以解决时,可以交由人类解决。

在以前,我们总认为这种“人工参与的循环链”模式只是一种美好的想象而已,与现实有很大的差距,但事实上,这种模式的发展速度非常快,超乎人类想象,其典型产品有Facebook M等。

Facebook研发了一款人工智能助手服务,名为M,它能够听懂人类发出的语言指令,并根据指令去完成某些工作,如帮主人订花、购买商品、安排约会等。而对于一些复杂的、难以完成的指令,M则交由人类自行解决。

自动驾驶与ATM(自动取款机)也是如此。到目前为止,自动驾驶难以脱离人工控制,虽然自动驾驶能够实现自动泊车,能在好的路况条件下实现自动驾驶,但是遇到复杂的路况条件,就必须人工操控。ATM的自助存取款服务也有一定的限制,只能处理完整的、清晰的、整额的钞票,对于那些有污渍、破损、零散的钞票还需要到人工柜台上进行处理。这些例子都表明,机器能够帮助人类解决一些问题,但仍有很多问题需要人类自行解决。

从这个角度来看,该设计模式与“训练数据”的设计模式有很大不同,只是用机器学习算法对部分工作进行了替换,使工作效率得以有效提升。该设计模式可能会缩小企业的用工数量,但也有可能创造出很多新的就业岗位。

主动学习模式

主动学习模式是训练数据模式和人工参与的循环链模式的结合。人工参与的循环链模式收集了很多训练数据,这些数据能反馈到机器学习算法中使其性能得以有效提升。对于那些机器学习算法不能解决的复杂问题,人类对该问题的解决方法和思路能给机器提供学习机会。这也就意味着,人类在解决机器不能解决的问题时培养了一批“对手”,同时,这些“对手”实力的增强也在很大程度上减轻了人类的工作负担,并使工作效率得以有效提升。

在过去,机器学习算法之所以迟迟得不到有效应用,是因为场景不同,所需要的机器算法也不同,机器学习算法是需要定制的,这需要一大笔费用。受高成本的影响,只有大公司才有能力引进机器学习模式,使用机器学习算法。

但是,现如今,随着计算能耗的持续降低和机器学习算法产品的增多,机器学习算法的应用成本正在逐渐降低。例如,在2015年,仅一年的时间就有4家企业发布了云机器学习平台,给众多小企业使用机器学习提供了机会。总之,随着机器学习应用门槛的降低,机器学习的应用范围正在迅速扩展。

中华机械网