原标题:AR眼镜真要给力这三大难题不容易解决
沉浸感的基础
如果并不太了解AR 技术的动态,人们很容易会对AR 眼镜的效果有过度的幻想,以为只要一戴上它,立刻就会进入一个现实和虚拟交织的,沉浸感超强的世界,但事实上却并不是如此。
现实是,即使是AR 眼镜的代表产品HoloLens,它最大的问题之一就是可视范围实在是太小了。仅仅34 度的可视范围,用体验过的人的话来说,这就好比在眼前放了一个十多寸的小屏幕一样。虚拟增强的那些东西,只有在这个范围里我们才能够看到。这样一来,沉浸感当然就大打折扣了。
我们不能因此指责微软和HoloLens 达不到自己的期望,因为它作为一种便携式的设备,电池性能始终有限。如果采用了太大的可视范围,那续航就会成为很严重的问题。
在这个电池技术久久未能得到突破的时代,很多时候续航和体验都是一个很矛盾,需要去平衡和妥协的问题。尽管市面上已经有一款名为Meta 2 的AR 眼镜达到了90 度的惊人可视范围,但代价是它用起来非常不便,需要用智能手机作为图像投影的载体。HoloLens 的一切硬件都是围绕着打造稳定的AR 体验而设计的,而Meta 2 的这种方案虽能实现宽广的可视角度和更高的分辨率,但追踪延迟很大,即使只是轻微的头部活动都会导致让人困扰的图像晃动。所以,Meta 2 也不是一个理想的解决方案。
当然了,技术总归是在不断进步中的,现在也确实有些公司宣称他们使用更稳健的方案,实现了达50 度可视范围的AR 眼镜。虽说50 度对打造沉浸式体验来说还远远不够,要知道VR 那边HTC Vive 的可视角度都达到了110 度,还是有明显的黑边,但不管怎么样,我们是能看到希望的。只不过从50 度到110 度,不知道要等多久就是了。 实时的物体识别
构建一个具有沉浸感的世界,VR 或许相对会简单一点,因为它和现实世界的联系非常少,只要一戴上VR 眼镜,周边环境的一切很大程度上就不再和你有关(当然你得保证别被什么东西绊倒)。
然而AR 却不太一样,因为它需要实现的是虚拟和现实的互动。传统的AR 技术要让虚拟景象出现在指定的位置,要么依靠定位系统,要么依靠制定的标志物。更简单粗暴一点的,直接把虚拟图像“按”在屏幕上就好了。然而这些实现手段,没有一个能称得上“沉浸感”的。
要让AR 系统产生的虚拟景象更加真实可信,最好的办法是让虚拟景象和现实环境来一个互动,比如让虚拟的小人在真实的桌子上跑起来,翻越各种碗碟杯盘。但是要实现这一点,你首先得让系统知道那儿有一张桌子,桌子上有这些那些东西。
然而事情并没有那么简单,因为要做到更加逼真,系统不应该仅仅局限于只是识别到物体的形状而已。我们拿一个杯子来举例,系统认知到杯子是一个和桌子平面区别开来的物体只是第一步。它还需要知道杯子顶部有开口,虚拟物体可以进入其中,或者用来盛放东西。系统还要知道杯子很轻,易碎,这样小人才不会尝试拿火箭筒来轰它。
这种认知对计算机来说其实非常困难,因为“杯子”这种东西有成百上千种形状、尺寸、颜色和材质。要让计算机每一次都能对它进行准确的分类和定义,这要比想象中更难。要写一个算法让系统能够认出所有情况下的杯子,而不是将它误认为是圆柱体的小山,这可没有想象中容易,不如说几乎是不可能的事情,没有开发者拥有这种程度的精力。
不过现在已经有了新的解决方案,那就是人工智能和深度学习。在这一点上微软已经走到了前头,它已经确认新一代的HoloLens 将搭载一个专属芯片,完全为人工智能设计。这个芯片将被用来处理HoloLens 上所有和机器学习相关的任务,从而减少处理器负载,加快速度,优化效能。简单来说,新HoloLens 上的人工智能特性将会更加强大。
拥有了深度学习能力,人们就能够让系统去进行训练,通过神经网络来不断学习去识别各种各样的物体,从而准确给它们定义。随着时间的推移,AR 眼镜就会变得越来越聪明,能够识别并分类的东西越来越多。这样一来,虚拟的人物、动物就能够辨认那些现实中的物体,或是为现实中的物体加上虚拟的特效,比如给实体杯子加入虚拟的水。这样一来,虚拟和现实的融合才是非常真实可信的。 自适应设计
我们都知道显示器尺寸多种多样,不同的屏幕大小,同一个网页的排列布局好像都有些不太一样。这对我们来说似乎是再常见不过的事情,但开发者却花了很多年的时间才创造出了一套能够适应不同屏幕尺寸的网页设计规范。其实,AR 也一样。
AR 体验看似和自适应无关,但其实后者对前者来说十分重要。尤其是在游玩AR 游戏时,有一样东西是经常会有变化的,那就是玩家的房间大小。
没错,不同的玩家其房间大小都是不一样的。如果说只是普通的AR 体验,比如看个视频,玩个桌面游戏的,那还不要紧,但如果你玩的是更大型的作品,比如敌人出现在四周等待着你去消灭的那种游戏,自适应就至关重要了。简单来说,敌人如何好似真的就在你房间中,不会穿过墙壁和床铺?这个处理不好,那违和感可就大了。
所以很多时候你都需要在游玩之前,让系统“了解”整个房间的样子,然后才能够进行适应。但是这个过程并不是自动的,而且你因此也没法在家里从一个房间玩到另一个房间。
还有一点:假设上一节里所说的实时物体识别得到实现,那么虚拟的东西又该如何去利用那些它识别出的现实物体?
可以说,自适应设计很可能是这三个难题中最不容易解决的一个。好在人们已经开始尝试着先在纸面上解决问题了,所以我们未来也会迎来这个问题解决的一天。