第3章虚拟现实关键技术 虚拟现实技术中的关键技术包括立体显示技术、环境建模技术、声音合成技术和人机交互技术。 3.1立体显示技术 虽然研究者总是力争使虚拟现实系统能为使用者提供多种维度的感知,满足人体听、看、触等多方位的感官体验,但谁也无法否认,其中视觉占有突出重要的地位。这首先是因为视觉信息的获取是人类感知外部世界的最重要的感知通道。据统计,人类从外部世界获取的信息中,超过80%的部分来自视觉。其次,视觉信息所携带的信息量远远大于其他感觉,如听觉、触觉等所携带的信息量。因此,立体视频显示技术成为虚拟现实技术的最重要的支撑技术。 本节首先介绍几种立体视觉产生机理,然后重点介绍其中的双目立体视觉,以及与之相关的立体显示技术。 3.1.1立体视觉产生机理 人类之所以能产生立体视觉,是因为人的视觉系统具有对景物的深度感知能力,即能够对景物至人眼之间的相对距离进行估计。产生立体视觉的机理非常复杂,包括心理成因和生理成因等多种因素。其中被研究最多的是双目立体视觉,即通过左右两只眼睛采集到的不同视角的图像,在大脑中合成产生立体感。常见的立体电影,就是利用双目立体视觉的原理制成的。 除了双目视觉能产生立体感以外,单眼也能产生一定的立体感。当我们闭上一只眼睛,仅用另外一只眼睛看世界时,也能轻易地辨别出景物的相对深度。如果注意到这种情况,就会体会到单眼产生的立体感。这说明立体感的产生绝不仅仅是左右视点合成那么简单,而是有着复杂的生理和心理的成因。现代心理学认为至少有十种要素与立体视觉感知有关,其中涉及生理机能的有以下4种。 (1) 双目视差,双目立体视觉。人的两只眼睛位于同一水平线上且具有同样的方向,在观看三维景物时,会在两只眼睛的视网膜上分别产生两幅关于同一景物的透视投影二维平面图。由于左右两只眼睛之间存在间距,因此这两幅投射在视网膜上的图像之间具有视点差异,即视差。在大脑中对这相互之间具有视差的、分别属于左右视点的两幅投影图像进行合成的过程中,就产生了立体感。 (2) 焦距调节。眼睛的晶状体相当于一个透镜,它具有根据景物远近而自动调节焦距的功能。当观看近处的物体时,睫状肌收缩,使焦距缩短; 当观看远方的景物时,睫状肌舒张,使焦距变长。焦距的变化使人们可以看清楚远近不同的景物和同一景物的不同部位。在调焦过程中,睫状肌的运动信息反馈给大脑,从而产生立体感。这种立体感的建立对于单目视觉也是有效的。 (3) 运动视差。这是由观察者与景物发生相对运动所产生的。这种相对运动相当于人眼这个透视系统的视点发生了连续的变化,从而可以从各个方向观看同一物体,在计算机视觉中可以利用这一特性对物体进行三维建模,而在人脑中的效果就是产生了立体感。 (4) 双眼会聚。如果通过晶状体中心点,沿着人眼的观看方向画一条直线,这条直线就叫作视轴。当人眼观看无限远的景物时,两只眼睛的视轴是平行的。而当人眼观看近处的物体时,通过人眼相关肌肉自适应地牵引眼球转动,会将两只眼睛的视轴会聚到一点,否则会产生重影,这时两视轴的夹角称为会聚角。会聚角随观看景物的远近而变化,同时相关肌肉的活动反馈到人脑时就会产生深度感。 在以上所讨论的4种立体感知的生理机能中,利用双目视差可以很容易地通过左右图像模拟人眼的行为使人产生立体感,利用运动视差可以通过观察连续的图像序列产生立体感。然而,焦距调节和双眼会聚则必须要求被观看的景物具有物理的景深,因此难以被利用在虚拟现实显示技术中产生立体感。与此相对的是,以下将要讨论的与心理机能有关的立体感,可以在观看单幅静止画面时产生。 与立体视觉感知有关的心理学因素有以下6种。 (1) 透视投影。由于透视投影具有近大远小的特点,因此同样大小的物体,当观看距离不同时,在视网膜上的成像大小也不相同。距离观察者越远的物体,在视网膜上的成像越小。更一般的说法是,距离镜头越远的物体,在二维投影平面上的成像越小。而人在观看景物时,大脑会下意识地根据视网膜成像大小判断物体的相对深度。另外对于某些已知属性,如在物理世界中,已知道路的两边是平行的,而在透视投影之后原本平行的两条直线相交了,这也可以对人脑产生深度暗示。正是基于透视投影的原理,当人们在观看一幅如图3.1所示的图像时,能产生一定的立体感。 图3.1线性透视产生的立体感 (2) 视野范围。心理学研究发现,视觉上的立体感与画面的大小有关,画面越大,则立体感越强。这是因为人眼有一个很宽的视野范围,水平方向的夹角大约为±220°,垂直方向的夹角为±130°,呈椭圆形。如果画面足够大,充满整个视野,则此时可以产生最强烈的立体感。而对于通常的显示方式,画面显示范围远小于整个视野,因而立体感不强。根据这个原理制成的大屏幕立体投影或洞穴式显示系统,能产生强烈的立体感,被许多虚拟现实显示系统所采用。另外,在虚拟现实系统中被广泛采用的头戴式显示器,将左右两幅图像分别显示在两个超微显示屏上,通过一组精密的光学透镜放大后呈现在观看者眼中,从而产生大屏幕立体图像的显示效果。 (3) 大气散射。大气中由于存在一定程度的微小颗粒,对光线传播具有散射和衰减的作用,这些微小颗粒包括尘埃、水汽、烟雾等。景物距离观察者越远,则空气介质对景物光强的衰减作用越明显,而大气散射光强度越大,这也可以对观察者产生心理上的深度暗示,如图3.2所示。这种情况只能适用于室外场景。 图3.2空气透视带来的深度暗示 (4) 相互遮挡。当景物相互遮挡时,也会产生深度暗示,如图3.3所示。 图3.3相互遮挡产生立体感 (5) 光和阴影。阴影及影子对深度感也是心理学上重要的暗示。 (6) 站位视点。心理学暗示所产生的立体感一般用于平面显示技术之中,例如三维街头地画,也叫地面立体画,就是将画作展示于地上,或直接以地面为载体进行绘画创作,以求得立体的艺术效果。地面立体画的画面构成以欣赏者的视点为视觉原点,用肉眼从其他角度进行观看画面则是拉伸变形的,而站在最初设计的最佳视点使用相机进行观看可以达到最佳的立体效果,具有强烈的视觉震撼力,如图3.4所示。 图3.4利用站位视点创作的立体画 照片中的两个人好像在通过一个惊险的独木桥,其实这个独木桥是画出来的。 3.1.2双目立体视觉 双目视差是最重要的一条产生立体视觉的线索。当人们观看外部事物时,首先通过眼睛接收光所携带的物体信息,然后将信息传输到大脑,通过神经中枢对其进行处理,形成最终的视觉效果。人类视觉成像系统包括眼睛和视觉神经。人眼的结构如图3.5所示。 图3.5人眼的结构 人眼就像照相机的镜头一样,外界光线从瞳孔进入,然后通过晶状体在视网膜上成像。视网膜相当于照相机的感光底片或数字照相机中的图像传感器。光信号在视网膜上被转换、过滤和编码,被转换成生物电信号,然后通过视神经系统传输给大脑,产生视觉刺激。 图3.6双眼视差的形成 人眼之所以能产生具有立体感的视觉刺激,是因为两只眼睛在水平方向上相隔一定的距离。成年人的瞳孔间距为53~73mm,平均间距为65mm,所以当双眼观察同一物体时是具有细微的差别的,这就是“双眼视差”。在双眼观察同一物体时,左眼看到的物像左边的部分会多一些,右眼看到的物像右边的部分会多一些,如图3.6所示。大脑的视觉中枢对分别来自双眼的视觉信号进行分析,从而察觉出物体与自己相隔的距离,产生远近的感觉,即深度感知,这就是形成双眼立体视觉的原因。 3.1.3三维显示器的立体感 三维显示屏幕之所以能够使观众产生立体视觉效果,就是因为它能够通过人为制造出视差从而使观众产生深度感, 图3.7三维显示屏幕示意图 如图3.7所示,通过这种人为制造的双眼视差可以在观看三维显示屏时产生向前或者向后的深度感。 为了解释这种立体感的原理,首先假设屏幕上显示了3个点: A、B、C,并且每个点都同时具有左、右两个图像对,分别为Al和Ar,Bl和Br,Cl和Cr。其中Al、Bl和Cl由左视点画面显示,而Ar、Br和Cr则由右视点画面显示。并且假设当观众在观看屏幕时,通过一种特殊的眼睛(如偏振眼睛或开关眼睛)使得他的左眼只能看到左视点画面显示的点的成像Al、Bl和Cl,而他的右眼只能看到右视点画面显示的点的成像Ar、Br和Cr。 此时,按照这3个图像对所分别具有的视差,可以分为3种情况。 (1) 左右像点重叠,视差为零。例如,图中的A点的两个成像Al和 Ar恰好在屏幕上重合,此时双眼看到的正好是同一个图像点,大脑会判断点A的位置处在与屏幕水平面重合的A′处。 (2) 左像点显示在左,右像点显示在右,视差为正值。例如图中的B点,其在左右两个视图中的像点之间具有一个大于零的视差,此时观众的大脑视觉中枢就会分析融合两眼图像形成B点的空间图像,并判断B点的位置处在屏幕水平面后方的 B′处。 (3) 左像点显示在右,右像点显示在左,视差为负值。例如图中的C点,此时观众的大脑视觉中枢就会判断C点的位置处在屏幕水平面前方的 C′处。 三维显示屏幕就是这样利用人眼的双眼视差使得A、B、C三点产生深度感,也就是立体感。 我们把显示器屏幕上的一对图像对之间的像素差称为水平视差,如图中B点所示,当左眼看到的图像Bl位于屏幕左侧,右眼看到的图像Br位于屏幕右侧时,这一对图像对之间的水平视差被称为正视差; 相反,如图中C点所示,当左眼看到的图像Cl位于屏幕右侧,而右眼看到的图像Cr位于屏幕左侧时,这一对图像对之间的水平视差就被称为负视差; 而如图中A点所示,当左眼看到的图像Al与右眼看到的图像Ar重合时,这一对图像对之间的水平视差为0,称之为零视差。 立体显示器之所以能让观众产生立体感,是因为它显示的是符合双眼视觉特征的具有水平视差的两幅图像,即三维片源,并且设法让左右两眼都只能看到其对应的画面。这两幅对应于人眼左右视点的图像对,叫作立体图像对,通常使用两台模拟人眼视觉机制的摄像机共同拍摄制作而成,或是使用计算机图像生成技术按照要求制作而成。使用立体摄像机拍摄三维片源时,两台相同的摄像机会保持固定的距离和夹角关系,两个镜头的间距通常采用人眼平均间距65mm。而使用计算机图像生成软件制作的立体影像,通常会先建立一幅单眼视图,如左眼视图,然后按照透视投影原理生成右眼视图。 普通的平面二维显示器无法实现三维视觉效果,是因为这种显示器显示的是单通道的图像,即它所显示的图像是从单一视点拍摄的,而没有被分为左、右视点图像。这样左右眼看到了完全相同的画面,所有图像上的点在人的双眼看来水平视差一直处于零视差,所以看到的永远只是一个没有立体深度感的平面。 由以上理论分析可以知道,在屏幕上实现三维立体显示,有3个条件是必须具备的。 (1) 需要左眼和右眼两路影像。 (2) 两路影像是不同的,并且具有正确的视差。 (3) 左右眼的两路影像要完全分离,左影像进左眼,右影像进右眼。 3.1.4正交偏振三维显示系统 图3.8中的正交偏振三维显示系统由立体显示屏和配套的偏振眼睛组成,是一种常见的左右视点图像分离机制。通过正交偏振三维显示系统,观众的左眼只能观看左图像,右眼只能观看右图像,从而产生水平视差。 图3.8正交偏振三维显示系统的基本结构 正交偏振三维显示器显示的是搭载了视频画面信号的偏振光。配套的偏振眼镜左右眼镜片的偏振方向互相垂直成90°夹角,并且分别与该配套液晶显示器出射偏振光的偏振方向垂直和平行。而系统实现三维显示效果的TN副屏是一层功能独立的液晶副屏,它贴附在液晶显示器前端,也就是出射偏振图像一侧,TN副屏在三维显示系统中主要是作为开关面板工作。 正交偏振三维显示系统实现三维效果的工作过程有两个阶段。先假设TFTLCD前端出射的偏振光初始偏振方向为0°,配套偏振眼镜的左眼镜片偏振方向为0°,右眼为 90°。 在第一阶段,不对TN副屏施加电压。此时TN副屏内的液晶分子由于连续弹性体理论和液晶分子的黏滞性呈现自然扭转90°状态。由于液晶的光波导效应,由TFTLCD前端出射的搭载了图像信息的偏振光在透过TN副屏时,其偏振方向会随着液晶分子的连续扭转而偏转90°。所以,当它透过TN副屏后偏振方向从0°变为90°,刚好与配套的偏振眼镜右眼镜片偏振方向平行,而与左眼垂直,因此只能透过右眼镜片被右眼接收。 在第二阶段,对TN副屏施加驱动电压,此时TN副屏内的液晶分子由于液晶的电光效应会沿电场方向排列,液晶的光波导效应消失,由TFTLCD前端出射的偏振光在透过TN副屏时,其偏振方向不会发生任何改变。所以,当它透过TN副屏后偏振方向依然为初始方向 0°,刚好与配套的偏振眼镜左眼镜片偏振方向平行,而与右眼垂直,因此只能透过左眼镜片被右眼接收。 由于TN副屏的这种开关作用成功地分离出了两路偏振方向互相垂直的偏振光,每一路偏振光恰好只能通过一只偏振眼镜的镜片被一只眼睛接收。这时,只需要准备稍有不同且具有正确双眼视差的两路影像片源,左眼画面搭载于进入左眼的0°偏振光,同时右眼画面搭载于进入右眼的90°偏振光。这样,观众的右眼就只能观察到右眼画面而左眼只能观察到左眼画面,通过大脑皮层中枢神经系统的分析和融合作用,就能产生三维立体视觉效果。 3.2环境建模技术 虚拟环境建模的目的在于获取实际三维环境的三维数据,进而通过实时绘制、立体显示等技术,建立相应的虚拟环境模型,这是虚拟现实系统的核心内容。在虚拟现实系统中,常见的环境建模技术有三维视觉建模和三维听觉建模,其中三维视觉建模最重要。三维视觉建模包括几何建模、物理建模、行为建模等。 3.2.1几何建模 几何建模是描述物体几何信息的建模方法,它是一种通过计算机表示、控制、分析和输出几何实体的技术。 要表现三维物体,最基本的是绘制出三维物体的轮廓,利用点和线来构建整个三维物体的外边界。描述三维物体最普遍的方式是使用一组多边形网格来近似描述物体的表面。对于具有复杂表面的物体,可以通过将曲面分成无数个细小的多边形来近似逼近。每个多边形由至少3个顶点确定,对于复杂的物体表面,顶点的个数决定了建模的精确度。 几何建模过程如下。 首先测量物体的表面形状,即获取所有顶点集合的三维坐标,存储在计算机中。这个顶点集合可以无限近似地描述该物体的几何形状,即顶点的个数越多,则根据这些顶点的三维坐标就能够更精确地描述这个物体的表面形状。 然后是渲染,即在计算机上绘制三维模型的表面形状。有了关于物体表面顶点集合的三维数据,就可以用三角形的面片将这些三维顶点拟合成完整的物体表面。一般物体表面是复杂的曲面形状,而三角形面片的拟合表面是分片连续的近似曲面,顶点个数越多,每个三角形面片的面积越小,则拟合表面与真实曲面的拟合程度越高。在计算机图形显示系统中,逐个绘制每一个面片,从而形成一个物体的完整的表面。到这一步时显示的物体表面是没有颜色和纹理的。 第三步是表面材质,即通过贴图的方式给上一步绘制的物体表面添加颜色和纹理,并赋予不同的材质属性,如光滑度、反射率、透射率等。按照材质属性的不同,物体表面在光照环境下,可以显示为不同的光泽。 3.2.2物理建模 物理建模是参照研究对象的运动过程、结构大小、形状及状态等特点,通过数学建模,以一种理想化和高度抽象化的方式描述物体物理特性的过程。物理建模涉及物体的物理属性,包括重力、惯性、表面硬度、柔软度和变形模式等。例如,用户用虚拟手握住一个球,如果建立了该球的物理模型,用户就能够真实地感觉到该球的重量、硬软程度等。 粒子系统是虚拟现实系统中一种典型的物理建模系统,用于动态的、运动的物体建模,如描述火焰、水流、雨雪、旋风、喷泉等现象。粒子系统通常用简单的元素完成复杂运动的建模。粒子系统由大量的称为粒子的简单元素构成,每个粒子具有位置、速度、颜色和生命期等属性,这些属性可以根据动力学计算和随机过程得到。在虚拟显示中,粒子系统常用于物理建模过程。 3.2.3运动建模 运动建模是关于对象的碰撞、扭曲、表面变形等方面的建模技术,表现的是虚拟对象在虚拟世界中的动态特性。其中,碰撞检测经常用来检测对象甲是否与对象乙相互作用。另外,两辆汽车碰撞之前的外形模型与发生碰撞后的模型是很不一样的,这是因为构成汽车的各个部件由于碰撞的作用,发生了扭曲和表面形变。 在虚拟现实系统中,人体是一个典型的非刚体,人体建模必须考虑到人体动态特性的表现。每个人的走路姿态、身体的弯曲度、四肢运动和面部表情都有各自的特点,而且即使是同一个人,在不同环境下也会表现为不同的动态特性。 3.3声音合成技术 听觉信息是人类仅次于视觉信息的第二传感通道,是增强人在虚拟现实中的浸没感和交互性的重要途径。声音合成技术是虚拟现实系统中的关键技术。 3.3.1三维虚拟声音 三维虚拟声音在虚拟现实中的作用,是为了增强用户在虚拟世界中的沉浸感,使用户体验视觉感受、听觉感受带来的双重信息享受。 三维虚拟声音与通常所说的立体声不同。立体声通常来自对于真实世界音频信号的记录,通过设置两个声道或多个声道,使听者体会到身临其境的感觉。而三维虚拟声音的声音信号是用计算机技术模拟生成的,而且各个声源模拟在真实世界中的位置,从而使听者可以感知到来自四面八方的声音,并且准确地分辨出各个声源的方向、位置和距离。 例如,对于一个虚拟现实的射击游戏,作为游戏中的一个玩家,当听到了敌人的射击枪声时,你可以像在现实世界中一样,能够及时准确地分辨出枪声的来源方位,如果敌人在你背后你也可以分辨出来。所以,三维虚拟声音非常符合人们在真实环境中的听觉习惯。 三维虚拟声音主要的特征有全向三维定位特征和实时跟踪特性。全向三维定位特性是指在三维虚拟空间中把实际声音信号定位到特定虚拟声源的能力,它能使用户准确地判断出声源的位置。例如在虚拟射击游戏中,玩家可以根据所听到的枪声,准确判断出枪手的方位,然后通过肉眼搜索目标位置。这就是声学信号的全向定位特性。 三维实时跟踪特性是指在三维虚拟空间中实时跟踪虚拟声源位置变化或景象变化的能力。一种情况是当虚拟发声物体移动位置,或周边景物发生变化时,用户的听觉感受应随之改变。另外一种情况是声源位置和周边景物没有发生变化,但是用户的姿态发生了变化,比如用户的头部转动时,这时虚拟声源相对于用户头部的位置发生了变化,所以用户的听觉感受也应该发生变化,从而使用户感受到声源位置的固定性。三维虚拟声音系统必须具备这样的实时变化能力,否则所看到的景象与听到的声音就会相互矛盾,削弱游戏的沉浸感。 3.3.2三维虚拟声音的建模方法 为了建立具有真实感的三维虚拟声音,一般从最简单的单耳声源开始,然后通过专门的三维虚拟声音系统的处理,生成分离的左右信号,分别传入听者的左右耳朵。按照声音传播的声学模型,为左右信号人为设置不同的滤波作用,从而使听者感受到虚拟声源的方位。 所谓声学模型,就是对从声源发出的声波是如何传输到人耳中的过程的描述。声波在空气中的传输过程中,会受到距离衰减、介质吸收,以及障碍物的反射和折射等作用,从而产生不同的衰减和延迟,另外由于反射物的作用还会产生信号的多径效应,这等效于一个系统传递函数。听者接收到的是声音信号相当于原始声音经过这个传输系统滤波之后的输出。由于左右两耳的位置不同,两只耳朵所听到的是同一个声音经过两个不同的传输路径所到达的信号,表现为具有不同的多径、延迟、相位差和衰减,当这种差异被大脑中的听觉中枢处理后,就能感受到声源的方位。 目前常用的听觉模型包括头部传递函数和房间声学模型。头部传递函数描述的是声波从声源处到鼓膜处的传输过程,它主要表现为人的头、躯干和外耳构成的复杂外形对声波产生的散射、折射和吸收作用。这个变换函数称为头部传递函数(HeadRelated Transfer Function,HRTF)。由于每个人的头、耳的大小和形状各不相同,所以HRTF也因人而异。HRTF受到很多因素的影响,一种是与方向有关的因素,包括躯体影响、肩膀反射等,还有一种是与方向无关的因素,包括耳腔共振以及耳道与鼓膜的阻抗,示例如图3.9所示。 图3.9人耳的听觉模型 房间声学模型描述的是声波经过多重路径传输的过程。在房间内,由于受到墙壁等障碍物的多重反射,同一个声音信号在到达人耳之前沿着不同路径传输,因而人耳接收到的是具有不同的延迟和衰减的信号的叠加,这叫作多径效应。在虚拟声音系统中,一般只要模拟第一多径和第二多径就可以达到真实的听觉效果。 3.3.3语音的合成 语音合成技术是指用人工的方法生成语音的技术。一般用户对于语音的要求是可懂、清晰、自然、具有表现力。 语音合成技术主要是把计算机内的文本转换成连续自然的语声流。使用这种方法,应该事先建立语音参数数据库、发音规则库等。需要输出语音时,系统先合成语音单元,再按照语音学规则连接成自然的语流。 3.4人机交互技术 虚拟现实中的人机交互包括数字头盔、数字手套等复杂的传感器设备,以及三维交互技术、语音识别等人机交互手段。一个理想的虚拟现实系统应支持视觉、听觉、触觉、嗅觉、味觉、方向感等多种通道的交互方式,如图3.10所示。 图3.10虚拟现实中的人机交互技术 3.4.1视觉通道 视觉通道是当前VR系统中研究最多的领域。虚拟环境产生器通过视觉通道产生以用户本人为视点的包括各种景物和运动目标的视景,人通过头盔显示器(HMD)等立体显示设备进行观察。 同时,虚拟现实系统视觉通道接受用户指令,并产生相应的动作。基于计算机视觉的手势识别是一种典型的利用视觉通道的交互技术。VR系统通过摄像机拍摄用户所处的场景,并用计算机识别用户的手势。 3.4.2听觉通道 听觉通道为用户提供三维立体音响。研究表明,人类有15%的信息量是通过听觉获得的。在VR系统中加入三维虚拟声音,可以增强用户在虚拟环境中的沉浸感和交互性。 同时,VR系统也可以通过听觉通道接收用户用语音发出的指令,并产生相应的动作。这种交互技术的基础是语音识别和自然语言理解技术。语音识别是指将人说话的语音信号转换为文字信息。语音识别的过程分为参数提取、参数模式建立、模式识别等。语音识别的结果是生成文字信息,但除非这些文字信息是预先约定好的短指令,否则并不一定能为VR系统所理解。要让计算机真正理解用户所说话的含义,还需要借助自然语言理解技术。 3.4.3力触觉通道 虚拟现实中的力触觉通道交互系统就是触觉与力反馈系统。在虚拟环境中,人们若要感觉到虚拟物体的接触,需要在手套内层安装一些可以振动的触点模拟触觉。力触觉交互是操作者通过交互设备向虚拟环境输入力或运动信号, 虚拟环境以力或触觉信号的形式反馈给操作者的过程。 力触觉通道作用于人体的两类感受器: 位于皮肤真皮层和表皮层的触觉感受器,相应诱发的感受称为触觉反馈; 位于关节和韧带内的感受器,相应诱发的感受称为力觉反馈。力触觉交互系统由操作者、力触觉设备、力触觉生成算法三部分组成。力触觉生成算法是计算和生成人与虚拟物体交互力的过程,是力触觉人机交互技术的关键。由于人的触觉相当敏感,一般精度的装置根本无法满足要求,所以触觉与力反馈的研究相当困难。 力触觉交互系统的典型应用如碰撞检测,实时检测虚拟工具与虚拟环境中的其他物体是否产生接触,并对工具与物体之间的接触点位置、接触方向、接触面积、穿透深度和穿透体积等参数进行检测计算,为后续碰撞响应计算提高准确的接触状态信息。基于碰撞检测的结果,计算工具和被操作物体之间的作用力通常采用两类方法: 基于几何的方法和基于物理的方法。前者中的交互力主要考虑物体和交互工具的几何外形和物体之间相对嵌入深度或嵌入体积的影响; 后者包括弹簧质量模型、有限元模型等。当交互的形式涉及物体的内部结构(如切割、钻削)时,基于几何的力计算很难做出令人满意的逼真效果,在这样的情形下,必须考虑物理建模。 由于力触觉硬件设备的技术进步以及新型掌上移动和穿戴式交互应用的发展需求,力触觉生成方法正在经历4 个发展阶段: 力觉生成、触觉生成、力触觉融合和穿戴式力触觉融合。 习题 1. 虚拟现实技术中的关键技术有哪些? 2. 与立体视觉感知有关的心理学因素有哪些? 3. 简述双目立体视觉的产生机理。 4. 三维视觉建模包括哪些部分? 5. 三维虚拟声音主要的特征是什么?