当然,你可以开发一种系统,识别出各种各样的苹果,无论从什么角度、在什么场景下、是否被咬过,是在运动还是处于静止。然而,这样的系统无法识别出橙子。此外,系统也无法告诉你,苹果是什么,苹果有多大,以及苹果有什么用途。
问题在于,即使是最优秀的硬件和软件,在没有操作系统的情况下也无法带来太大的用途。
对我们来说,这就是人脑其他部分的功能:长期和短期记忆,来自其他知觉、注意力和认知能力的输入,以及通过与世界数万亿次互动获得的丰富经验。
这正是计算机科学的前沿,也是通用人工智能探索的领域。我们正在关注这一领域。通过计算机科学家、工程师、心理学家、神经科学家,以及哲学家的共同努力,我们可以了解人类心灵工作的方式,以及未来如何模拟人脑。
这并不意味着,我们正走入死胡同。计算机视觉的未来在于,将强大的专用系统集成至更通用的系统。后一类系统专注于更复杂的概念,包括环境、注意力和意图。
即使是最初级的计算机视觉也非常有用。这样的功能可以集成在我们的相机中,识别人脸和笑容;集成在无人驾驶汽车中,识别交通信号和行人;集成在工厂机器人中,监控问题并识别人类的同事。计算机视觉实现类似人脑的功能还有很长的路要走。不过考虑到当前需要解决的问题,让计算机具备视觉本身就非常有趣。