立体电视完全替代2D高清晰度电视不会在近年发生。对于立体电视业务的开展,ITU-R预测有线付费电视运营商与无线广播电视运营商会有不同的商业模式,因此所倾向的系统方案会有不同。目前,有线付费电视运营商预计将倾向于第1代Level 2级别系统,而无线广播电视运营商将会倾向于第1代Level 4级别系统。
有线付费电视运营商采用第1代Level 2级别系统,只需要利用新的传输带宽增设新的频道,可以不改变网络架构以及更换现有机顶盒。立体电视业务的开展不影响原有2D电视业务,并可以在未来升级到第1代Level 3级别系统,提高立体电视的图像质量。
无线广播电视运营商只有有限的空中频率资源,通常2D电视业务已经占用已有频率,因此寻找新的频率采用第1代Level 2级别系统开展立体电视业务有困难。无线广播电视运营商可以采用第1代Level 4级别系统,开展兼容2D电视业务的立体电视业务。传统2D电视用户可以在第1代Level 4级别系统中收看一路2D画面,立体电视用户需要购买新的终端及显示设备。
以下对第1代立体电视系统的主要环节进行介绍,包括立体视频采集与生成、节目制作、编码与传输、立体显示等。
3.1 立体视频采集与生成
立体视频通常采用两台单镜头摄像机或一台双镜头摄像机进行采集。人双眼瞳距大约6.5厘米,因此为获得符合人眼观看习惯的立体视频,两台摄像机镜头轴线的最佳距离也应为6.5厘米。但专业摄像机的镜头通常较大,此时可采用交叉支架将两台摄像机垂直放置,并在镜头前端放置半反射镜把光线分别反射、透射给两台摄像机。目前,国内外都有多种3D支架可供选择。3D支架分为机械型、电动伺服型以及自动跟踪型,可满足不同的拍摄需要。Sony公司推出了一款专为立体视频拍摄而设计的摄像机HDC-P1。HDC-P1拥有小型机身,便于在各类支架上安装设置。调整摄像机间距可获得不同的立体效果。例如,拍摄远距离景物时为加强立体效果可加大间距,需要减弱立体感时则缩小间距。某些时候,还可附加深度探测器辅助拍摄。深度探测器采用激光或红外光线进行探测,试图给出拍摄场景的深度信息。但由于精度、反射、物体透明性等方面的因素,获取的深度信息通常存在误差。此外,还可采用摄像机阵列采集多个角度的立体视频。
立体视频生成的方式主要有两类:一类是采用计算机生成,根据计算机图形学原理,通过对物体、场景进行三维建模,计算机可根据需要渲染出一个或多个角度的立体视频;另一类生成方式是2D视频到立体视频的转换,转换的大致过程是将图像中的物体进行分割,为每个物体设置深度信息,并对转换后的空白区域进行填充,其中深度信息可以利用2D视频进行估计。目前,高精度自动2D视频到立体视频转换还有技术难点,还需进一步研究。
3.2 节目制作
节目制作涉及到立体视频的剪辑、校正、特效添加等环节。由于最终要呈现出立体的效果,各环节的操作相对传统2D视频都有不同。在剪辑环节,某些情况下立体视频剪辑后需要进行左右画面位置的对齐。画面对齐可以借助拍摄时的同步信号以及伴音等信息来实现。在校正环节,立体视频拍摄时由于摄像机配置等原因通常会有拍摄误差,误差大于一定程度将会带来立体效果丢失或视觉疲劳,因此在视频处理阶段需要对这些误差进行校正。这些校正包括色彩校正、梯形校正、旋转校正等。在字幕等字符和图形的加入环节,需要采用负视差加入字符和图形,即将字幕浮动到屏幕的最前方。立体画面的切换要考虑到视觉感受。传统2D视频可以通过镜头快速切换达到视觉冲击的效果,但在立体视频中这会带来人眼的频繁调焦,从而产生视觉疲劳。因此在节目制作中,立体画面的转换和过渡要柔和。总之,立体电视节目的制作要保证高视频质量,从而将视觉疲劳程度降到最低。
3.3 编码与传输
视频编码的作用在于去除视频数据的各类冗余以便于传输和存储。采用不同信号格式的立体电视系统需采用不同的信源编码方案。对于第2节所述的第1代Level 1和Level 2级别立体电视系统,其视频信号可看作一路传统2D电视信号,因此可采用MPEG-2或H.264/AVC标准进行编码。第1代Level 3级别立体电视信号是在第1代Level 2信号的基础上迭加增强信号而形成。如果把增强信号看作分辨率增强层,则与可伸缩视频编码的概念吻合,所以可采用H.264 SVC标准进行编码。编码第1代Level 4级别立体电视信号可采用MPEG-2 Multiview Profile或H.264 MVC标准。编码的基本思路是,对左视(或右视)画面进行传统编码,而右视(或左视)画面可以进行视间预测提高编码效率。编码立体电视信号的指导原则是编码后的数据适合各类信道传输,这包括满足码率、容错性能、时延等方面的要求。
立体电视节目可以在DVB等网络架构下以广播的形式传输,也可以在IP网络下以流媒体的形式传输。为人所熟知的数字电视广播系统包括,DVB-C/S/T,ATSC,ISDB-C/S/T,地面国标等。立体电视节目经编码复用后可以在以上系统中广播播出,在实际应用中需要注意特定传输信道对码率的要求。互联网的快速发展推动了VoIP、IPTV等应用的产生。立体电视节目也可以在IP网络中以单播、组播、P2P等形式传输。目前在IP网络环境下所采用的传输协议主要是RTP/UDP/IP,将来会过渡到RTP/DCCP/IP,后者会提供更好的网络拥塞控制机制。关于立体电视传输技术的进一步信息可参考文献。
3.4 立体显示
目前,进入可用阶段的立体显示技术主要分为两类,分别为stereoscopic显示技术以及autostereoscopic显示技术。Stereoscopic显示技术需要观看者佩戴眼镜,主要包括偏振光和主动快门式显示方式。Autostereoscopic显示技术不需要观看者佩戴眼镜,其基本原理是通过视差屏障(parallex barrier)、透镜(lenticular lens)等机制将左右眼的画面分别传送到观看者的左右眼。Autostereoscopic显示技术的最大优势是让观看者摆脱了眼镜的束缚,但是在分辨率、可视角度和可视距离等方面还存在不足,而且目前价格昂贵,很难进入家庭。偏振方式stereoscopic显示技术利用了光线有振动方向的原理。例如:显示时左右画面分别经过横向偏振和纵向偏振,以水平偏振光和垂直偏振光的方式显示出来,观看者配戴相应的偏振眼镜,左右镜片的偏振方向与左右画面的偏振方向相同,这样不合偏振方向的画面会被镜片过滤掉,左右眼分别看到相应的左右画面。由于在任一时刻要同时显示两路画面,通常两路画面在垂直方向的分辨率都要减半,这导致每路画面亮度降低。Sony公司推出的24和42英寸3D监视器采用了偏振技术。目前,影院所采用的投影式偏振3D系统即基于以上原理。
主动快门式stereoscopic显示技术是通过提高画面刷新率来实现。显示时左右画面交替进行显示,同时信号发射器同步控制快门式3D眼镜的左右镜片开关,使左右双眼能够在正确的时刻看到相应的画面。主动快门式stereoscopic显示技术能够保持画面的原始分辨率,让观看者享受到全高清立体效果。该种显示方式视觉效果出色,因此被很多厂商采用。目前,各公司推出的家用立体电视主要采用了主动快门式显示技术。