科幻电影中,经常有各种高智能机器人的形象,或萌或暖或身手矫健或残忍邪恶,但是真的做成这样的机器人,还有很多问题,比如机器人该如何分辨感知眼前的一切,能否像人类一样通过眼睛分辨不同的物体?
用眼睛看世界,听起来很简单,实际上是亿万年进化的结果。人类视觉的形成需要有完整的视觉分析器,视网膜接受光的刺激,将光信号转变成生物电信号,通过视神经传递到大脑,结合人的经验和意识等构成视觉,进一步在大脑中形成形状、颜色等概念。
如何让机器人看到这世界,这就得靠科学家帮助它们“进化”了。在图像识别技术诞生之前,摄像头拍摄到的画面对于计算机而言就是一堆数字,无法和具体事物形成关联,相当于只有眼睛没有大脑。图像识别技术让计算机能够提取图像的特征,将元素剥离出来。每个图像都有它的特征,如字母A有个尖,P有个圈、而Y的中心有个锐角等。图像识别系统通过分析这些特征,从而判断图像的含义。相机的人脸识别就是在分析我们的面部特征。
此外,时下最热门的自动驾驶也运用了图像识别技术:摄像头捕捉道路的画面,图像识别剥离出车辆、行人和指示牌等。但不同于照相机,自动驾驶时任何细小的差错都能酿成大祸,因此自动驾驶的汽车必须做到“眼观六路、耳听八方”,光有图像识别是远远不够的。
图像识别技术不是很成熟了么,为什么奥迪还有大费周章地加一堆传感器呢?举一个直观的例子——保护色。大自然中很多动物都具有保护色,它们的肤色与周围环境很接近,不细看根本发现不了,“保护色”极有可能引发交通事故。举个例子,一辆白色的拖挂车正在横穿道路,此时天空中正好有一片云,在图像识别系统“眼中”,它就像黄土里的蜥蜴一样,计算机会认为前方是空旷的。
因此,奥迪A7自动驾驶概念车装配了图像识别系统、激光扫描仪、雷达等装置,让汽车观察到一个完整的世界。图像识别系统让汽车看到障碍物,包括行人、其他车辆、路牌等,并结合数据库和算法对障碍物进行分类分析。工程师提前“教育”行车电脑,红色圆圈的是路标,两条腿走路的是行人,方块的是货车……凡此种种,汽车对周遭的环境就有了基本的判断。
前文已经提到,图像识别也有失误的时候,但汽车可不能乱撞,这时就需要激光扫描仪。简单来说,激光扫描仪不断向外界发射光束,碰到障碍物时光束就会被反射,接收到反射信号就知道前方有障碍物。奥迪在车身前后各布置了一个激光扫描仪,以此识别中远距离(80-150米)的障碍物,结合图像识别系统,蜥蜴可就无处藏身了。
但激光扫描仪也有“失明”的时候,当障碍物较近时,光束反射的时间极短,这就没法判断距离了。此时,奥迪汽车四周的超声波雷达就起到了重要作用,雷达是“第三只眼”。超声波雷达的原理与激光扫描仪类似,探头发射超声波,接收器接收反射信号,通过测量反射时间就知道障碍物的距离。一般而言,超声波的测距范围在5米以内,与激光扫描仪形成互补。
为方便大家理解,我们不妨把汽车观察世界比作一场考试,图像识别系统的工作就是写完整张试卷,激光扫描仪负责第一次检查,雷达则是“double check”。实际运用时,它们之间的配合要复杂得多。总之,自动驾驶的奥迪A7概念车凭借这一套“多位一体”的探测系统观察到了一个完整的世界。至此,奥迪的工程师给了A7概念车一对火眼金睛:图像识别+激光扫描仪+雷达=“火眼金睛”。你以为这就结束了么?No!No!
No!婴儿刚出生时对什么都很好奇,滚烫的开水都敢摸,因为他们不能将“开水”和“疼痛”联系起来,他们缺乏生活经验。这就像此刻的奥迪A7概念车,它看到了每一个障碍物,但它仍缺乏“思考能力”。它还需要一个大脑——快速控制原型(Rapid prototyping controller):“火眼金睛”+快速控制原型=自动驾驶。
快速控制原型调用了庞大的数据库和人工智能算法,这就是工程师赋予A7概念车的“人生经验”和“思考能力”。遇到行人要躲避、前方堵车要停车、有限速标志要减速,这些普通驾驶员都掌握的技能其实是工程师长期研发的结果,自动驾驶可是一个涉及多领域的交叉学科哦。
2015年5月,奥迪A7自动驾驶概念车鲁班和孔明在上海拥堵城市道路环境下完成了道路试驾。奥迪针对中国路况做了人性化的优化:1)中国版自动驾驶的跟车距离更短,加塞伤不起(>﹏<。)~2)变线时,车辆还会提前贴近分道线,给后车一定暗(yā)示(lì),再打转向灯变线。奥迪攻城狮说我们要做中国特色的自动驾驶 Y(^_^)Y。我们习惯了用眼睛看世界,没想到机器人看世界是这么复杂的一件事,攻城狮辛苦啦!