增强现实正在改变视觉本身。增强现实眼镜等可穿戴硬件将加速这一转变,使计算机能够对我们遇到的一切进行建模和解释。在获得 Snap 的 AR 眼镜的早期使用权后,Modem 与创意工作室 oio 合作探索这种新的观看方式 — — 制作一个界面原型,让我们通过简单地注视与世界互动。
视觉可能是人类与环境建立联系的最重要方式。它是我们如何形成我们所居住的世界的心智模型,我们如何在物理空间中定位自己,以及我们如何吸收多种信息。虽然视觉的生物学基础并没有随着时间的推移发生太大变化 — — 我们基本上拥有与以往相同的眼睛 — — 新技术有望彻底改变它,放大和扩展我们的视觉,同时彻底改变它的目的。
相机,比任何其他技术都更能继续重塑视觉。自相机出现以来,这一过程就一直在进行,但在数字时代加速了。在其历史的大部分时间里,相机都采用安装或手持设备的形式,使人们能够捕捉、保存图像并将其分发给更广泛的受众。随着相机在 20 世纪激增,并最终融入智能手机,世界变得越来越饱和,这些相机产生的静态和动态图像。最终,摄影与其所反映的现实一样成为我们环境的一个特征。
相机最近的轨迹表明它是视觉进化的中间阶段,从生物过程过渡到机械过程。传统的方形相机作为数字界面上的图标经久不衰,但硬件本身即使不是完全隐形,也变得更加微妙。当今世界到处都是这样的相机,它们不断地自动记录人类永远看不到的大量视觉数据。
正如本尼迪克特·埃文斯 (Benedict Evans)所说,这是一个“从可以拍照的装有摄像头的计算机到可以看东西的眼睛的计算机”(from computers with cameras attached that can take pictures to computers with eyes that can see)的转变。这种计算机视觉捕获的图像不是供人类观看的,而是作为纯数据,以算法作为目标受众。正如埃文斯解释的那样,通用组件通常比专用组件更适合解决问题。计算机视觉非常灵活,能够解决各种各样的问题 — — 就像人类视觉一直以来所做的那样。埃文斯写道,随着收集和处理视觉数据的工具不断改进,许多看起来不像视觉问题的问题会变成视觉问题。
一种新的视觉
计算机仍然存在是为了服务于人类的目的,就像一个世纪前的摄影一样,计算机视觉最终是一种帮助我们看得更清楚的方法:人类和计算机一起观察世界并分担解释和与之交互的责任。
增强现实(AR)已成为计算机视觉最引人注目的应用之一,使用户自己的视野框定了计算机的视角,并确定了机器所看到的内容。通过AR,视觉本身获得了新意义,将感官输入同时路由到大脑和计算机中作为数字处理数据 — — 人工智能与真正智能并行工作。同时,物理环境成为用户界面,在一个新层次的数字信息下被包裹着。看不仅是收集关于世界信息的方式,也是对这个世界进行操作的方式。
随着愿景的发展,支持它的工具也在发展。如今,AR 最常见的体验方式是通过智能手机摄像头,但新兴形式的可穿戴硬件,尤其是眼镜,有望让用户和计算机看到的内容更加一致。AR 眼镜很可能成为协作人机视觉的物质象征 — — 身体与技术不断变化的关系的陈述,以及超人类主义日益增长的文化意义的有形标志。
事实上,最近 AR 眼镜的风格未来主义表明主流文化终于准备好拥抱 AR 本身。当谷歌眼镜于 2013 年首次出现时,它未能获得广泛关注,甚至遭到嘲笑;近十年后,可穿戴技术不再是硅谷早期采用者的深奥装束,而是日常生活中数字化注入的一种表达。如果我们对现实的普通体验已经在很大程度上受到数字技术的影响,多亏了无处不在的智能手机,我们不妨简化这种体验。借助 AR,相机镜头成为我们与环境的主要接口。我们将简单地看而不是敲击,而看将是一种行动形式。
AR代表了一种感官范式转变,但也是直观的。在2011年的一个演讲中,凯文·斯拉文(Kevin Slavin)描述了发射理论(emission theory),这是一种错误的信念(常常被孩子们持有),即视觉涉及从眼睛向外发射光束来“描绘世界”的想法。这个想法颠倒了视觉的现实,即光线从外部环境进入眼睛产生视觉效果。通过AR,在某种程度上,发射理论的一个版本最终成为真实。或者至少如斯拉文所述,具有向外投影视野存在将与以其自己方式描绘世界的AR相得益彰。
进入镜像世界
一种新的视野需要一种新的世界来观察。为使 AR 发挥作用 — — 使视觉向外而非向内发射 — — 必须将物理环境重新创建为机器可读数据,以对应并响应人类注视。
与虚拟现实不同,虚拟现实让用户沉浸在一个与物理现实分离的综合人工环境中,AR 必须忠实地再现我们的现实,为在其之上分层附加信息创造基础。构建数字镜像世界涉及来自相机和视觉传感器的大量数据输入,包括 AR 眼镜本身 — — 与谷歌的车辆无休止地拖网搜索世界街道以收集构成谷歌地图街景功能的 2200 亿张图像的努力不相上下。当用户最终戴上他们的 AR 眼镜时,数字世界必须已经构建好,并准备好与之交互。
增强现实(AR)的逻辑与魔幻现实主义相似:它是对世界的真实再现,同时也可以融入奇幻元素,从而增强了现实本身的效果。走进AR介导的镜像世界可能类似于爱丽丝穿过刘易斯·卡罗尔《爱丽丝漫游奇境记》续集中镜子里面的旅程,一个替代性现实将日常生活转化为更加神奇 — 在那里稍微不同的逻辑和感官体验占主导地位。但无论这个替代性现实有多么神奇,它也必须保持与原始现实密切映射。
从魔法到实用
到目前为止,AR 最突出的用途确实是魔幻现实主义的脉络:游戏、娱乐和其他技术能力的有趣展示,例如 2016 年红极一时的 Pokémon GO,或 Magic Leap 的鲸鱼飞溅而过学校体育馆的地板。
这些异想天开的展示是这项技术的绝佳营销方式,但如果 AR 要成为一种日常工具 — — 另一种生活操作系统 — — 它可能必须服务于更实用的用例。换句话说,AR 可能必须变得更加平凡,支持更多普通的任务。
要让 AR 变得真正有用,它需要精心改进的界面,帮助用户理解他们新的、计算机增强的视觉。人类习惯于旧的观看方式 — — 那种仅仅收集信息的方式,而不是操纵被观看对象的方式。必须开发一系列基于视觉的交互性,从扫视到注视,至少与智能手机的触摸灵敏度一样细致和直观。愿景不仅与我们所看到的有关,还与我们如何看待它有关。
和智能手机一样,AR 有望重塑我们的感知世界,这将越来越多地对应于代表它的数字镜像世界。我们周围的物理对象 — — 家具、食物、店面,甚至人和宠物 — — 将成为离散的数字信息访问点。通过这种方式,日常生活将呈现更多电子游戏中已经存在的品质。
增强现实技术的最佳应用将会让我们沉浸在一个混合环境中,结合了身体经验的直观熟悉感和互联网信息的丰富性。像Snap公司的AR眼镜这样由社交网络支持的硬件,将综合我们的社交图谱和偏好与实时位置数据相结合,为我们提供具有上下文相关性的推荐服务。凯文·凯利预测:“最终,我们将能够像搜索文本一样搜索物理空间 — — ‘找到所有公园长椅面向河流日出方向的地方’”(eventually we’ll be able to search physical space as we might search a text — ‘find me all the places where a park bench faces sunrise along a river.’)。而且仅仅通过看着某个区域就可以对其进行操作,使用“如果这个那么那个”的触发器来控制设备开关或者播放音乐等功能。例如:看一眼灯就可以打开它、盯着早餐碗就可以在Spotify上播放早晨歌曲列表、或者注视时钟以显示即将到来的日历事件。
设计感知
充分发挥 AR 的潜力需要微妙的平衡。人类的视觉和其他感知已经发展出复杂的机制来过滤信息并防止我们被环境淹没。今天,数字技术经常利用那些尚未适应前所未有的信息洪流的心理机制。
AR 的设计将至关重要。通过正确的用户体验和用户界面,增强现实可以无缝地整合我们的物理和数字生活,作为日常活动的背景支持,同时减少信息过载。但设计不当的 AR 版本也可能适得其反,通过放大环境噪音的冲击,使信息过载变得更糟。
在他的演讲中,斯拉文描述了如何将单个数据点的焦点放在一起可能会削弱人们对现实的感知而不是增强它。 “现实是……我们周围的整个世界,而不仅仅是我们面前的那件事,”斯拉文说道。 而且已经有很多东西可以吸引我们注意力了。 他解释说,最好的AR版本不会增加这种过剩:“[我们需要]发明新方法来看待事物,而不是新东西来观察。” 不管它采取什么形式以及计算机在其中扮演什么角色,视觉并没有停止进化。