一、视频编码MPEG4、H263和H264
1. MPEG4与MPEG1、MPEG2的比较
MPEG 系列标准的基本参数 | ||||
标准 |
幅面 |
帧率 |
带宽 |
应用领域 |
MPEG-1 |
352x24 或 320x240 |
24-30 fps |
1.5 Mbps |
Video CD, CD-ROM |
MPEG-2 |
720x24 或 640x480 |
24-30 fps |
4-8 Mbps |
DTV,HDTV,DVD-Video |
MPEG-4 |
34x48 ~ 4096x4096 |
1-30+fps |
10Kbps~10Mbps |
互联网及无线传输,交互式电视 |
从上表可以看出,MPEG1和MPEG2主要应用于固定媒体,比如 VCD 和 DVD ,而对于网络传输,MPEG4具有无可比拟的优势。
2. H.263、H.264系列标准介绍
H.263是国际电联ITU-T的一个标准草案,是为低码流通信而设计的。但实际上这个标准可用在很宽的码流范围,而非只用于低码流应用,它在许多应用中可以认为被用于取代H.261。H.263的编码算法与H.261一样,但做了一些改善和改变,以提高性能和纠错能力。H.263标准在低码率下能够提供比H.261更好的图像效果,两者的区别有:(1)H.263的运动补偿使用半象素精度,而H.261则用全象素精度和循环滤波;(2)数据流层次结构的某些部分在H.263中是可选的,使得编解码可以配置成更低的数据率或更好的纠错能力;(3)H.263 包含四个可协商的选项以改善性能;(4)H.263采用无限制的运动向量以及基于语法的算术编码;(5)采用事先预测和与MPEG中的P-B帧一样的帧预测方法;(6)H.263支持5种分辨率,即除了支持H.261中所支持的QCIF和CIF外,还支持SQCIF、4CIF和16CIF,SQCIF相当于QCIF一半的分辨率,而4CIF和16CIF分别为CIF的4倍和16倍。H.263已经基本上取代了H.261。
H.264是ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家组)的联合视频组(JVT:joint video team)开发的一个新的数字视频编码标准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。
H.264和以前的标准一样,也是DPCM加变换编码的混合编码模式。但它采用“回归基本”的简洁设计,不用众多的选项,获得比H.263++好得多的压缩性能;加强了对各种信道的适应能力,采用“网络友好”的结构和语法,有利于对误码和丢包的处理;应用目标范围较宽,以满足不同速率、不同解析度以及不同传输(存储)场合的需求。
在技术上,H.264标准中有多个闪光之处,如统一的VLC符号编码,高精度、多模式的位移估计,基于4×4块的整数变换、分层的编码语法等。这些措施使得H.264算法具有很的高编码效率,在相同的重建图像质量下,能够比H.263节约50%左右的码率。H.264的码流结构网络适应性强,增加了差错恢复能力,能够很好地适应IP和无线网络的应用。
3.为什么使用 H264标准用作视频压缩
分层设计
视频编码层具有高效的视频内容表示功能;
网络提取层将网络中所需要的数据进行打包和传送;
高精度、多模式运动设计
支持1/4或1/8像素精度的运动矢量;
多模式的灵活和细致的划分,大提高了运动估计的精确程度;
帧内预测功能
在空间域进行预测编码算法,以便取得更有效的压缩:
4×4块的整数变换
由于用二变换块的尺寸缩小,运动物体的划分更精确,这样,不但变换计算量比较小,而且在运动物体边缘处的衔接误疾差也大为减小:
为了提高码率控制的能力,量化步长的变化的幅度控制在125%左右,而不是以不变的增幅变化。为了强调彩色的逼真性,对色度系数采用了较小量化步长;
统一的VLC
为快速再同步而经过优化的,可以有效防止误码。
4.视频压缩算法的发展方向
随着网络技术的不断发展,MPEG4的应用也越来越普遍,H264已经无可争议地成为了视频产品压缩算法的发展方向。
二、音频编码G.723.1
1.国际电信联盟G系列典型语音压缩标准的参数比较
算法 |
类型 |
码率(kbit/s) |
算法延时(ms) |
G.711 |
A-Law / μ -Law |
64 |
0 |
G.722 |
SB-ADPCM |
64/56/48 |
0 |
G.723.1 |
MP-MLQ/ACELP |
6.3/5.3 |
37.5 |
G.726 |
ADPCM |
16/24/32/40 |
0 |
G.727 |
Embedded ADPCM |
16/24/32/40 |
0 |
G.728 |
LD-CELP |
16 |
< 2 |
G.729 |
CS-ACELP |
8 |
15 |
2. G.723.1 压缩后的语音质量
在国际标准中,统一使用 MOS(Mean Opinion Score)方法评价语音压缩后的质量。在MOS方法中,电话语音质量的标准定为4分。也就是说,如果一种算法将语音压缩后,MOS 值能达到4分,即说明其语音质量和电话质量等同,用户无法分辨出其中的区别。
对于DX4000系统,G.723.1压缩后语音质量的MOS评测值是3.98(Source: DSP Group Inc., http://www.dspg.com ),即非常接近电话质量。
3.为什么使用G.723.1标准用作音频压缩
压缩率高:G.723.1算法将语音压缩到6.3Kbps,在同类压缩算法中压缩率是最高的。
语音质量好:G.723.1算法压缩后的语音质量MOS值为3.98分,对于一般没有受过专门训练的耳朵,已经无法区分出语音是否经过压缩。这样的语音质量完全可以满足网络视频会议的需求。