视频会议就是通过终端与网络,使身处异地的与会者可以就同一议题参与讨论,相互之间不仅可以听到发言者声音而且还可以看到发言者的图像及背景,同时还可以交流有关该议题的数据。文字。图表等信息,因而与会者可获得比电话会议丰富得多的各种信息,随着超大规模集成电路和计算机技术的发展,集计算机的交互性。网络的分布性和多媒体信息的同步性为一体的多媒体会议电视系统突破了计算机。通信。电视等传统的界限,为人们提供了全新的交互服务。
当前,全球对视频会议设备需求量猛增,尤其是自"非典"事件发生之后,为了确保安全,许多大公司都通过视频会议、远程电话会议、网络会议等手段进行商业活动。
基于N-ISDN或PSTN的视频会议系统虽然也能传输多种媒体信息,但它是利用现有专用或通用的通信网络,采用简单的时分复用(TDM)方式在同一信道上传输多路信息,而没有从多媒体通信系统结构。连接和控制协议出发来进行系统设计,因此人们对通信进程和媒体信息的交互控制能力都非常有限。
随着Internet和局域网的发展以及PC桌面系统的普及,交互式视频会议传输网的基础正由基于电路交换式的N-ISDN或PST向基于分组交换式的IP网过渡,由专门会议室型向个人桌面型发展。IP视频技术对传统的会议模式产生了前所未有的冲击,切实为人们提供了更快捷更优质的沟通手段,引发了通信领域新的革命。IP 视频技术具有低廉的运行成本和高质量的通信服务等明显优势,基于IP 视频的各种解决方案也广泛应用到了我国企业决策、远程教学、远程医疗等领域。本文着重IP视频会议系统。
一、IP视频会议的标准
为了解决不同厂商产品之间的互通问题,建立起全球统一的视频会议标准,国际电信联盟(ITU)的电信标准化部门(ITU-T)自1990年以来制订发布了一系列有关视频会议的标准,从而形成了一套有关视频会议的完整标准体系。目前,视频会议系统的建立可以依据ITU-T的两大框架建议H.323和H.320来进行。
1990年推出的H.320标准是第一代视频会议标准,主要适用于窄带ISDN(N-ISDN)网及非拨号专用网,集中定义了ISDN上的视频会议以及速率为56kbps~2Mbps的视频会议,也是现今发展最为成熟的技术和系统。
1996年推出的H.323定义了在LAN、Intranet以及Internet上的视频会议框架性建议。它使符合标准的不同厂商的系统,可以在LAN上进行相互通信,是视频会议发展的新方向。H.323定义了在LAN上进行视频通信的设备、规程和协议。H.323使用与Internet协议兼容的IETF RTP/RTCP标准,并计划使用各种分组交换网(PSN)协议,包括TCP/IP和Novell SPX/IPX协议。H.323协议就是IP视频会议的标准。
在初期,由于IP协议不是很普遍,基于ISDN线路,符合H.320协议的产品占主要比例,随着几年IP协议的普遍应用和互联网的高速发展,特别是对于宽带网络的预见,符合H.323协议的产品自2000年开始,在整体市场中占有的比例急剧上升。随着IP技术的不断提高和改善、国际标准的制订,IP视频业务的应用范围必定会逐渐扩大,基于H.323平台的应用将日益广泛。
H.323标准涵盖了包交换网络上的音频、视频、数据通信,解决了点对点以及多点视频会议中诸如呼叫与会话控制、
多媒体与带宽控制等问题。H.323引用T.120协议来处理数据交换。 在H.323建议中,采用的图像编解码格式有H.261、H.263、H263+。H.263以及H.263+能够对图像提供更大的压缩速率,能够在低码率下提供比H.261更好的图像质量,因而更适合IP网络应用音频编码格式必须兼容G.711语音编码,另外也可以选择使用G.722、G.723.1,G.728,G.729或MPEG-1的语音编码标准。
基于IP网络的电视会议系统采用了分组交换技术,因为分组交换不保障有序性和固定延时,因而不能保证有固定的延时和带宽。为了较好解决实时通信的业务质量,采用了UDP/IP、RTP、RTCP以及RSVP等协议。
H.323具有以下主要优点。H.323协议被设计成运行在通用的网络体系结构之上,具有网络独立性。H.323协议提供了网络带宽管理功能,能够对网络中并发的H.323连接数和H.323应用可获得的带宽总量进行限制。H.323提供了连接基于电路交换或ISDN的视频会议的手段。H.323支持多点会议和多点会议广播(multicast)功能。H.323实现了不同厂商的多媒体产品和应用的互操作等
二、IP视频会议系统与传统的视频会议系统的比较
以前传统的视频会议系统是基于专线的H.320协议,需要固定路由及QoS保证的视频会议系统。主要采用ISDN或E1接入。虽然图像,声音的质量比较理想,但用户端设备及MCU(多点控制单元)的价格比较昂贵,小型企业和个人用户不可能接受。
由于H.320协议与H.323协议(IP视频会议系统协议)在视频,音频上的压缩协议基本相同,所以,在相同带宽情况下,H.323视频会议(IP视频会议系统)与H.320视频会议质量基本相同。 对于以ISDN接入的桌面型H.320视频会议来说,用户终端需要和固定的ISDN专线绑扎,不能移动,另外,如果召开一个跨省市的会议时,用户还需缴纳长途费,这不仅给用户带来了不便,还增加了用户负担。而H.323视频会议系统(IP视频会议系统)则不存在上述问题,因为,对于因特网用户来说,不存在长途费用的问题,并且,只要H.323视频会议用户的微机上安装了客户端软件、压缩卡及摄像头,并登陆因特网,成功向Gatekeeper(关守)注册后,就可以通过MCU(多点控制单元)随时随地召开会议,非常灵活、方便。一方面为用户节省了大量投资成本与维护成本,大大提高了企业的信息沟通效率;另一方面也为运营商吸引用户,拓展了新的增值业务。
三、IP视频会议系统的组成
根据H.323建议,IP视频会议系统由会议终端(Termial)、网关(gateway)、网闸(gatekeeper)、IP网络以及多点控制器 (MCU)组成。
终端是提供单向或双向实时通信的客户端。所有终端支持语音通信,可选支持视频和数据通信。
网关用于实现与非H.323终端的连接。
网闸执行保护数据网络完整性的功能,主要包括地址转换、访问控制和带宽管理等。
高速IP网络:随着家庭用户对Internet的需求增加以及对于信息交流的更高要求,高速IP网络将会得到快速发展,目前通过重新铺设5类线,用户可以获得10M甚至100M的接入带宽,可以充分支持会议电视业务。利用VLAN交换机代替集线器、支持IGMP路由器、通过帧中继和ATM网络传输图像、保证带宽等措施可以较好地保证会议电视的传输质量。
多点控制器用于支持三点或多点之间的网络会议,由必要的多点控制器(MC)和零个或多个多点处理器(MP)组成。
MC确定所有终端的音视频处理能力并控制会议资源。MP混合、交换和处理音频、视频和数据流。
多点会议分为集中式、分散式和混合式多点会议三种模式。
集中式多点会议必须配备MCU。所有的终端以点对点的方式向MCU发送音频、视频、数据和控制流。MC集中管理会议。MP进行音频混、视频混合和数据分发,并回送参加会议的各终端。集中式多点会议允许所有来自不同厂商的H.323终端加入会议。
分散式多点会议使用了Multicast技术。参加会议的H.323终端将音频、视频流广播给其他参与会议的终端,控制信息则以点对点方式发送给MC。接受终端负责处理接收的音频、视频流。分散式多点会议会议把对网络资源的占用低,并能大幅度地降低成本。它要求网络的配置支持网络广播。
混合式多点会议综合了集中式多点会议和分散式多点会议的特点。参加会议的H.323终端将音频、视频流选择其中之一以点对点方式发送给MC,剩下的以广播方式发送给所有的H.323终端。 通过MCU可以将集中式多点会议和混合式多点会议连接起来,可实现更大的灵活性。 此外,H.323还定义了"松散联系"会议用于支持大规模的会议。在该模式下,参会者被分为主动参与者和被动参与者,主动参与者又分为永久成员和临时成员。被动参与者仅能观看会议。通过临时成员与被动参与者的角色转换,允许更多的参与者发表意见。
四、如何确保IP视频会议质量
近年来,基于H.323的IP视频会议系统得到了很大的发展,已经具备了公众运营的条件,而实现这一条件,服务质量是关键。
由于H.323协议本身的不成熟,这给IP视频会议的公众运营带来一定的困难。IP视频会议的公众运营化,必须解决用户管理、业务管理、计费管理和视频交换的互操作性等问题。由于Internet是一个无连接网络,只提供一种承载业务-尽力传送(best effort)业务。也就是说,网络并不保证向应用数据流提供所需的带宽,也不保证数据流的传送时延和丢失率等质量指标。对于数据业务等非实时业务,尽力传送能够满足要求,但是对于音频或视频等实时通信应用,网络必须能支持具有一定QoS的端到端承载业务。如何提高实时性能,确保通信的QoS,是IP视频系统的关键技术要求,也是一个技术难点。
在IP视频会议中,QoS的策略可分为两个层面来实现:网络层面和业务层面。下面从这两个层面出发分析如何确保IP视频会议质量(QoS)。
1.确保IP视频系统QoS的方法
Internet上确保IP视频系统QoS有两种方法,具体如下:
(1)超量工程法(overengineering)
即在网络规划时预留足够的带宽,使得任何时候都能获得可接受的QoS。这种方法十分简单,不需要资源预留协议和接纳控制功能,但是要求部署足够多的路由器和高速链路,保证即使在忙时网络资源也有足够的余量。它可用于网络资源便宜、同时网络最大业务量又可以预测的情况。
(2)综合服务Internet方法
由IETF综合服务(IntServ)工作组定义。它需定义呼叫接纳控制功能资源预留协议,如RSVP。利用RSVP消息,端点应用程序可以提出数据传送全程必须保留的网络资源(如带宽、缓冲区大小等),同时也确定了沿途各路由器的传输调度策略,藉此,可以对每个数据流的QoS依次进行控制。
2. 网络设计上对QoS的保证
(1)网络结构
城域IP网络通常由核心层、汇接层和接入层组成,汇接层的各节点通过高速链路连接到核心层。在城域IP网中,在路由器连接上考虑路由跳数,保证网络任意两个节点间通信路由跳数最多为4跳,配置高性能路由器,根据经验值,在采用光传输的情况下,一个数据包经过一跳其延迟一般为10ms,该值不由线路的长度和路由器的性能所决定(对于7500以上的路由器),所以数据包在骨干网中的正常延时大概在50ms左右。从这个角度考虑,延时问题不是影响IP视频业务质量的主要问题。
(2)路由振荡问题及其解决
路由振荡原因分为两个方面。一个是由于链路状态的改变造成的路由改变,如果采用IS-IS或OSPF的路由发现,由于该问题要靠Hello包的检测,同时检测一次还不行,还需要检测几次。一般情况下,从链路中断到新路由选定需要几秒到几十秒的时间,这样的问题发生在骨干网上将大大地影响实时多媒体业务的质量,该问题主要通过使用MPLS的FRR能力加以保护。另一个路由振荡问题主要是网络设计不严谨造成的,对于出现大量的同值选路或大量的RouteReLookup或路由状态更新振荡的情况,防止问题的主要方案是在设计网络时要求所有的流量的方向和选路都需要监控者明确地加以检查。
振荡是一个非常难于解决的问题,由于路由器原理的问题(相对于交换机来说),总有一些时间可能处于较忙的时间,这可能令到单台路由器的延迟增加到100ms以上,这样就会造成多媒体会议系统的质量发生下降。产生这样的情况有时候不见得是由于线路上流量过多造成的,有可能在20%~30%的带宽下也会发生这样的事情。这样的问题主要是由于路由器的Buffer设置的问题造成的。改善的方案是将路由器的Buffer设置专门为会议系统这样的情况进行优化,不过有可能造成传统IP业务的效率下降。最好的情况是采用两个网络分开进行服务,这里有一个决策的问题。
(3) 网络拥塞
除了振荡,网络拥塞对IP视频会议业务也有着重大影响。因此我们在设计网络时,要防止网络拥塞的产生。在部署拥塞管理时,使用以下几个步骤:
(a)测定WAN是否发生拥塞现象
(b) 根据所需要管理的通信的种类、网络的拓扑结构及设计方案来决定目标。在确定需要取得什么样的结果的时候,考虑目标是否位于几条标准之中:
能够为所确定的所有通信类型建立一种公平的带宽分配方式;
对于从IP视频业务发送出来的通信,都能够指定严格的优先级。这样可能会伤害到同时也支持的、但不是紧急的通信业务的利益;
能够自定义带宽分配,以便在所服务的所有的应用之间共享网络资源。每一个应用都具有特定的、已经确定好的带宽需求。
(c) 用所选定的那种排队策略配置接口,并且观察所得到的结果。
3.IP视频业务本身的QoS的实现
如何提高实时性,确保通信的QoS,是IP视频会议的关键技术要求。在这一点上,基于H.323的视频会议系统采用IETF提出的实时协议和网络技术。首先,话音信号采用实时传送协议RTP封装传输。但是,RTP本身并不提供任何保证QoS的机制,要确保通信的实时性还需要IP网络本身具有这方面的增强能力。
(1)RTP功能及设计思想
RTP协议为音频、视频等实时数据提供端到端的传递服务,可以向接收端点传送恢复实时信号必需的定时和顺序的信息,并向收发双方和网络运营者提供QoS监测的手段,降低对网络带宽的需求。RTP可以大大减少你的带宽占用。
RTP还可以使视频会议中容忍少量的丢包,以避免数据包重传造成的时延。RTP实际包括两个协议。
RTP本身:用以传送实时数据。其功能提供净荷类型指示、数据分组序号、数据发送时戳和数据源标识。
RTCP:用以传送实时信号传递的质量参数,提供QoS监视机制;同时还可传送会议通信中的参会者的信息,向没有显式的成员控制和呼叫建立的"松弛型"会议通信提供控制机制。
H.323协议利用RTCP的SR和RR包监测QoS。
SR:主要用于多RTP流,如音频和视频之间的同步,和H.225.0密切相关。和流同步相关的字段是RTP时戳和NTP时戳
RR:用户监测QoS指标,包括长时指标和短时指标。如果丢包率高于设定值,就应降低媒体速率。如接收报告间隔超过设定值,则应根据RR包中的丢失率字段判断网络是否严重阻塞,如是,应降低媒体速率。如果连续3个接收报告的到达时延抖动值增加,发送端应采取措施。
(2)保证QoS具体手段
为了维持一定的服务质量,当监测到QoS指标下降时,H.323终端采取一定措施。实际上这些措施并不是保持原有的Qos,而按照一定顺序依次减低各种媒体的质量,使得在给定的带宽和负荷条件下仍然能向用户提供可接受的服务。
首先考虑降低质量的是视频信号,然后依次是数据、音频和控制信号。采取措施可分为两类:短时响应和长时响应。前者旨在解决包短时丢失和时延增加的短期问题;后者用于网络拥塞日益严重的情况。
(a)动态调整图像带宽
人们对图像和语音的敏感程度是不一样的,当图像码流出现延迟、抖动时,解码后图像表现为误码、丢帧;当语音码流出现延迟、抖动时,解码后声音断续。从人的感觉上对图像的误码更宽容一些。为提高QoS,可以利用RTP/RTCP报告,得到关于网络状况的信息,如丢包率、包抖动、延迟,根据这些信息动态调整图像带宽。当网络状况不好时,可以通知编码器,降低图像带宽,优先保证声音带宽;当网络状况好时,通知编码器,提高图像带宽.
(b) 唇音同步
接收方:对于接收方语音和图像的同步,终端收到语音、图像数据之后,分别放到语音缓冲和图像缓冲中,定时从语音缓冲中取出语音包解码,如果取出的语音包时戳与图像吻合,就把相应的图像包解码。这样做的好处是考虑语音的敏感性。
发送方:打时戳。发送方应该给数据包打上时戳,一方面是数据包(RTP包)的时戳,另一方面是数据控制包(RTCP包)的时戳。
基于H.323的IP视频会议系统将成为宽带IP网的一种潜力很大的增值业务。而它的终极目标是公众运营化,使千家万户享受视频服务。但IP视频会议系统的公众运营化,涉及到很多问题,服务质量是实现IP视频会议开展的关键,所以在IP视频的系统设计中,要统一做好服务质量的设计。由于IP视频会议是一项新兴的技术,本身还处于发展中,很多技术有待于进一步的研究和探讨。
五、视频会议领域的未来趋势
随着通信网络运营商宽带业务的拓展以及在保证网络服务质量情况下对核心宽带骨干网技术的应用,我们可以预见,网络传输能力将得到更进一步提高,从而促进H.323视频会议系统(IP视频会议系统)的快速发展。视频会议系统未来的发展趋势有以下几点:
(1)编解码方式由硬件向软件转化
由于计算机处理速度和附属板卡的处理速度提高,许多需要专用设备进行的数据处理过程可以交由计算机及其内置的通用板卡来完成,在效果上没有太大的区别
(2)产品协议类型从H.320向H.323转化
在初期,由于IP协议不是很普遍,基于ISDN线路,符合H.320协议的产品占主要比例,随着几年IP协议的普遍应用和互联网的高速发展,特别是对于宽带网络的预见,符合H.323协议的产品自2000年开始,在整体市场中占有的比例急剧上升。估计在2003年,基于H.323协议的产品的销售额会超过H.320产品。
(3) 市场重心向低价位普通用户市场转移
由于网络条件、技术水平、生产工艺等因素在该时期内的变化,视频会议系统已经从高价位专用市场向低价位普通用户市场转移。现在包括POLYCOM、VCON等大型公司都有相当的产品力量是在个人用户市场中。
(4) 流媒体广播技术越来越多的应用于视频会议系统中
流媒体广播技术将越来越多地应用于视频会议系统中。目前,流媒体技术与IP视频会议一样均受到业内人士追捧,这两者均为视/音频技术的重要组成部分,两者之间的相互融合正在开创广阔的应用空间。现在,视频会议可以应用在网上路演、实时采访、现场播报、在线股评以及远程教学等服务中,主要为用户传输多媒体信息,相互之间的很少交互,这种技术的应用是对传统视频会议功能的扩展。
(5) 虚拟合作应用服务将成为视频会议面向企业的核心功能之一
大多数跨国集团和分支机构较多的企业在使用视频会议系统时,除了会议功能外,使用最为频繁的将是虚拟合作,如远程的项目管理、客户服务、技术培训等等,这种应用在知识型企业尤为明显。
最后,IP视频会议领域的热潮使得市场重心向低价位普通用户市场转移。从通信市场的发展我们可以看到,绝大多数产品的目标市场用户都是从高端用户向中低价位用户逐渐转移。由于技术水平和生产工艺的提高,这些产品的成本逐渐降低,并且随着应用面积的扩大,规模效应开始在这个领域显露。这样,视频会议系统将从高价位专用市场向低价位普通用户市场逐步转移。