“机器视觉一旦普及,就会产生大量的机器人和人工智能设备的爆发。这和寒武纪生命大爆发是一样的。我们认为,现在,就是机器人的寒武纪时代。”
张晓林
中国科学院上海微系统与信息技术研究所研究员
大家好,我是张晓林。我主要研究仿生视觉。在我的研究生涯中,有一半时间在研究机器人,另外一半时间在研究医疗中的神经学,特别是视觉方面的神经学。我们将机器人和视觉神经学结合在一起,就变成了仿生眼。今天我分享的主题是《赋机器人予视觉》,其中还会讲到一个子课题——视觉是大脑形成的关键。
我们首先来讲视觉。在五亿多年前的寒武纪时代,一个小虫的脑袋上长了一个感光细胞,感光细胞慢慢变成了眼睛,对光产生了反应。换言之,视觉的诞生导致了寒武纪生命大爆发,一时间地球上出现了大量新生命。
因为有了视觉,大脑才能不断地发展。通常我们会讲,有了眼睛就会有好的大脑,有了好的大脑就会有更好的眼睛。所以,眼睛和智慧是相辅相成的。视觉处理几乎需要用到人类的整个大脑,大脑近乎所有的部分都与视觉有关。
接下来,我们看一下自然界中顶级的四种眼睛,分别是蜘蛛眼、复眼、鹰眼和人眼。在生物进化的时侯,生物的功能常常会在大概几百万年内突然达到顶级,在这之后暂时不会发生变化。因为生物的进化过程很快,我们很难找到进化途中的生物,只能找到最佳状态时的生物。
蜘蛛眼(左上)、复眼(右上)、鹰眼(左下)和人眼(右下)
为什么这四种眼睛是集中了四种顶级配置的眼睛呢?
比如,蜘蛛有8只眼睛,前后各有4只,它能够看见360度的景象。这种眼睛代表了蜘蛛的智能,它已经无法再往上发展了。
其次,所有的昆虫都在使用复眼。昆虫在使用复眼的时候,比较容易理解和处理收到的信息。所以,像昆虫这种大脑比较单纯的动物就喜欢使用复眼。复眼在小型的昆虫上是视觉效果最好。特别是蜻蜓,它有25000多只小眼。虽然复眼的使用效果很好,但复眼也只能发展到昆虫阶段。
经过不断地进化,高等动物,特别是脊椎动物,使用的是配置更高的眼睛。在会飞行的动物的眼睛中,鹰眼是最高级的眼睛。鹰眼的特点就是看得远,它能够在千米高空看到地面的蛇和老鼠等。
而我们人类可以通过眼睛暗送秋波,以目传情,因为人的大脑最聪明。眼睛可以做很多事情,或者可以发现很多细节的东西。
双眼可动为什么这么重要
我们主要研究人的眼睛,已经研究了20多年,人眼的数据比较充足,对人眼的研究也比较多。所以我们做仿生眼也是从人眼开始研究,但人眼也是最难研究的。
仿生人眼是机器视觉的极致
高等动物的视觉有两个特点。首先,高等动物都拥有双眼。大家可以看到几乎所有的高等动物,即脊椎动物的眼睛都是两只,看不到第三只眼,二郎神这种生物其实是不存在的。其次,这两只眼睛都是可以动的,没有高等动物的眼睛是不动的。
为什么会有这种情况呢?这是因为双眼能形成立体视觉,左右两只眼睛通过三角算法就可以测距离。而如果要看得远、看得广,双眼就必须可以动。
看得远、看得广是双眼可动的第一个特点。比如,如果大家要用同样能力的相机看远处,就必须用望远镜头。望远镜头的摄像角比较窄,必须要移动才能看到各个地方。
双眼可动的第二个特点,就是要看得清、跟得上。如果下图中的这条大鱼要抓小红鱼,它的眼睛就要紧跟着小红鱼,保证视线在小红鱼身上不动。这样大鱼的双眼获取的图像就会很清楚,不会模糊。同时,大鱼要时刻跟踪小红鱼,因为不知道这条小鱼要往哪儿跑。如果一旦让它离开视线,看不见它,它可能会突然咬大鱼一口,所以大鱼的视线要一直跟着它。这就是视觉的一个必然。
既要看得广又要看得远,既要看得清又要跟得上
现在我们做的绝大部分的人工机器视觉都是固定的,比如多目、单目。我们研究制作的仿生眼的主要特点就是可动。
来源:中科院物理所
原文链接:http://mp.weixin.qq.com/s?__biz=MzAwNTA5NTYxOA==&mid=2651012400&idx=3&sn=50c2a378010c46b9fd39d944ebbcf9c1
版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。
电话:(010)86409582
邮箱:kejie@scimall.org.cn