分布式图像拼接控制器使用TCP/IP网络作为大屏幕信号传输载体,结构上允许输入、输出节点在地理上分散开来,具备极大地灵活性和扩展性。如图1
图1
分布式图像拼接控制器采集端,采用实时影像数字采集技术,把各种视频信号源(DVI/VGA信号,复合视频信号,HDMI/SDI/YC 高清视频等)变成统一的数字视频信息。然后进行高质量的有损或者无损压缩编码,将视频信息打包成能够在以太网上传输的IP码流。分布式控制器显示端由一个个分离的解码器组成,解码器接收各种信号码流并实时解码,实现复杂的图像层叠缩放显示效果。分布式拼接系统具备图像信号多点共享,网络化图像接入/输出,移动终端预览控制等功能。
作为对比的集中式处理器,采用了FPGA加矩阵交换芯片的技术结构,所有输入输出信号以及数据交换,都必须在一个机箱里面完成。集中式处理器系统规模固定,多用于单一大屏、信号规模固定、简单显示叠加的应用场合。集中式处理器的核心在于各厂家自行设计制造的高速差分交换底板,该底板对于整个处理器的信号完整性、稳定性至关重要,往往一点故障就会导致系统整体崩溃。如图2
图2
分布式图像拼接控制器由一个个独立的功能模块构成:图像采集节点盒、交换机、图像显示节点盒、控制服务器及界面软体。每个节点盒对应一至二路图像信息,例如某大屏拼接应用中,有3×5规模DLP 箱体输出, 6路DVI信号输入,10路Video信号输入。该项目对应的设备清单是: 15个DVI输出节点盒, 6个DVI输入节点盒,5个双路视频输入节点盒,一个48口千兆交换机。(如图3)系统规模如果在前期设计或者实际使用中发生调整,只需要简单地增加或者更换某些节点盒即可,具备极大的整体灵活性和稳定性。
图3
适合分布式图像拼接控制器应用的领域通常具有以下特点:
(1)拼接显示屏规模庞大。(如图4)随着社会信息化的发展,人们需要更大的显示墙综合显示多种多样的信息,通常都在 24面屏以上,有的大系统可能是由多组屏幕和众多单屏信号联动组成,总数高达几百面屏。分布式图像拼接控制器采用物理分布架构,每个处理器单独处理自己的信号,无论有多少信号需要显示,相互之间没有任何影响,从而能够支撑超大规模的拼接显示屏系统。传统的集中式控制器则受限于插槽数目、处理能力、总线带宽等因素,难以支撑大规模的拼接显示墙。
图4
(2)需要显示的信号数量多。(如图5)目前的大屏幕显示系统中,通常需要同时显示几十路RGB信号,几十路甚至上百路的视频信号。在分布式图像拼接控制器中,每路信号由一个单独的处理器进行处理,确保信号能够被实时处理。在传统的集中式控制器中,多路信号处理需要抢占CPU资源和系统总线带宽,因此难以应对多路RGB/视频等信号的同时处理。
图5
(3)需要高性能与高可靠度。(如图6)大屏幕显示墙主要应用于涉及国计民生的国家重点行业,大屏系统担负着调度指挥、安全防范、事故预警和处理等重要职责,因此需要所有信号能够实时显示,系统安全可靠,能够7×24小时连续运行。优秀的分布式图像拼接控制器采用高性能DSP或FPGA作为影像处理平台,实现了实时影像处理和显示。系统具有高性能、高可靠度、低功耗等优点,比较适合对安全性和可靠性要求高的领域。
图6
(4)渐进扩充式大屏应用。(如图7)现实的大屏工程中,越来越多的应用方要求大屏项目采用渐进式、分步骤的方式实施。例如,某大楼整体音视频工程,一期实施指挥中心一个规模为5×10的DLP 大屏,二期实施两个会议室规模为3×5的液晶拼墙,三期实施到中心大楼的联动交互。三期工程要求信息共享,实时互动。对于这种应用方式,首先要求大屏拼接控制系统支持物理上分离布局,然后支持系统规模灵活扩充。网络分布式拼接控制器在这种应用中体现了集中式无法比拟的优势,对项目的分阶段实施,项目款项的合理使用至关重要。
图7
在大屏幕拼接系统中,拼接控制器的优劣直接决定着整个大屏幕显示系统效果的好与坏,也决定了整套显示系统的功能,随着大屏幕拼接墙应用的更为广泛,拼接技术也在不断地发展。
90年代出现的第一代为PCI工控机架构,第二代为 2000年出现的FPGA纯硬件式架构,以及最新出现的第三代分布式架构,每一代控制器都有着自己的特点。
第一代,第二代控制器其核心技术都是基于底板交换技术,都是集中式的控制器,都有很多难以克服的缺点。
集中式控制器遇到的问题:
1.所有输入输出信号都集中连到控制器上,各种DVI ,RGB线缆连接到控制器,传输距离受限,布线困难。
2. 硬件系统交换带宽有限,无法满足特大规模信号管理。
3. 系统升级困难,硬件规模一旦选定,其系统容量确定,就无法提升。
4. 无法实现多显示墙信号共享,实现多屏联动。
5. 维修成本高,系统故障需更换板卡或整机。
随着信息化,网络化的不断发展,大屏幕拼接系统迫切需要新的技术的出现。第三代分布式拼接控制器正是在这种环境下产生的。
分布式图像拼接控制器是基于改进传统集中式处理器的缺点,及新的市场应用发展趋势而出现的一种新的拼接处理器。
第三代分布式拼接控制器:
分布式是最近几年新推出的拼接控制器,是一款全新的集群分布式纯数字化处理的视讯产品。通过对视频、电脑信号的全数字化获取,采用网络传输,对信号源进行集中显示。突破了传统靠硬件模拟采集卡对采集路数和显示路数的限制,具有同时显示信号数量高,窗口操作灵活的特点。
近年来,网络带宽的提升为高品质视频信号流网络化传输提供了保障;而视频编码技术的发展则可在保证画面质量的前提下把视频信号的数据量压缩几倍到几十倍。大大降低对信号网络传输带宽的要求。
网络通讯技术、以及视频编码技术的共同发展显著提高了分布式拼接控制器信号的展示质量以及展示的实时性。让信号源的接入、传输、展示、调节等将变得更加智能化、高效化、网络化、实时化。
另外,由于分布式拼接控制器系统采用模块化架构,全网络化的智能管理:不再受限于空间,扩展能力大幅增强。每个模块都是独立运行、不再相互影响。处理计算能力将是各模块处理计算能力的总和。
分布式拼接控制器优点:
1.信号输入与输出没有数量限制,可以无限扩展;
2.模块化设计,即插即配,自动识别使用系统中交换机上增加减少的节点;
3.支持多显示墙,实现多屏信号共享,多屏联动,多屏内容相互浏览;
4.方便支持大批量IP流监控摄像信号的接入;
5.网络布线,信号传输距离最远可达200m,如使用光纤传输则可达更远,灵活性强。
下一节,我们将为你详细介绍分布式拼接控制器的优点。
分布式图像拼接控制器具有众多优点。
首先,分布式架构,组网灵活。
分布式图像拼接控制器的组成部分:采集节点盒、交换机、显示节点盒、控制服务器及界面软体,几大部件都可以实现物理上分离布局。满足了越来越多的智能信息化大楼的综合实施及管理要求。
例如,三个会议室,有一个主会场,两个分会场,都有显示大屏,位置分开,距离数百米。其中主会场采用3×8的DLP大屏,两个分会场采用两个1×3的投影融合。三个会场要求既可以分开独立应用,又可以同步会议,分享内容,如图8。这个案例,三个独立的显示墙模块,要求互相调度视频数据。三组大屏各自使用自己的交换机, 独立构建自己的现场输入输出节点结构。两个分会场交换机分别使用一根万兆光纤,经过小于 1000米布线,连接到主会场交换机。可以支持最多不超过10G的视频数据共享带宽。
图8
其二,网络是分布式拼接控制器的基石。如图9,如今是移动互联网时代,海量的信息通过移动互联终端(手机、PAD)进行交互。作为诞生自网络技术的分布式控制器,天生具备海量网络信息接入能力,几乎所有的信息设备都有网络接口,无论是大型主机、用户电脑、手持移动互联网终端、IP摄像头、NVR存储设备、网络管理设备,都可以方便的接入到分布式拼接平台。另外,多数分布式处理器为用户提供了包括无线预览、触屏控制、多用户接入、多区域大屏管理等多种多样的交互体验。
图9
其三,图像数据的网络化带来了众多实惠。
网线代替了VGA、DVI、视频屏蔽线,施工、费用、抗射频干扰、稳定性、轻量维护……,优点多多。
网络分布式处理器同时具备网络矩阵功能,轻松实现分布的双向信号分享能力。
IP摄像头无需解码器,直接接入大屏显示。
模块化结构,故障便于控制,也方便排查。
网络化系统良好的扩展性、可维护性。
大项目风险可控,不会出现规模困难症。
同步回显、录播、网络抓屏、超清底图、虚拟桌面、单屏64图层、信号组播无限复制……
其四,分布式拼接处理器可以实现高清虚拟桌面上屏。如图10
分布式控制器的网络接口,完美地结合了虚拟桌面技术和网络发包加网络拼接显示技术。使用一台笔记本,就可以实现256个 1080p画面的显示。对于不要求动态显示的超大画面图片显示应用,分布式控制器是最优的显示方案。
图10
通过普通的电脑千兆网口,安装一个虚拟网络显卡驱动,则可以将电脑中的超大分辨率图像轻松送到大屏幕上,实现点到点的超清画面震撼显示。并可以灵活配置分辨率,直接与第三方高清图像数据软件对接,例如地理信息系统(GIS)、卫星定位系统(GPS)、电力监控系统(SCADA)、行车调度信号系统(SIG)等。也可显示各种矢量图形系统,如 Cadence画图、AutoCAD制图、UG/ProE制图、3Dmax等。相对传统控制器的图像采集卡的方式,基于分布式处理的高清底图软件表现出强大的灵活性、稳定性和经济性。
其五,分布式拼接处理器支持多模式图像预览功能,如图11。
传统大屏控制器通常不具备节点信息预览回显功能,用户在信号列表里面只看到一列数字符号和框图,不能直观地观察到希望上屏显示的实时内容。
图11
对于一些重要应用场合,需要预先知道信号内容,才能发布到会议大厅的大屏幕上。已经多次发生过把错误的、不合适的视频信号发布到公开场合大屏幕进行显示的事故。这与传统处理器缺乏预览控制能力,有着直接关联。
一般分布式处理器可支持多种模式的信号预览回显:
A:使用硬件节点,可以在一个单屏上实时回显任意一路或者多路组合的信号内容。
B:使用软件预览,可以在PC、无线平板、智能手机上回显任意一路或者多路组合的信号内容。支持多用户分权限预览,支持Web 模式广域网信号预览。
C:使用自采集双码流节点,在信号采集端,用户可以硬件实时回显任意一路或者多路组合的信号内容。
其六,分布式意味着高稳定性,高可靠度 如图12
图12
硬件分布式拼接处理器意味着稳定可靠。纯硬件 FPGA核心,无CPU,无操作系统;
模块化功能设计,算法复杂度与载荷分布均衡;
全铝外壳设计,5V供电,低功耗,可靠散热,工业化结构设计,长久保固;
即插即用,自动识别,主动侦错,维护简便。
集中式 | 分布式 | ||||||||
PC架构 | 纯硬件 | 纯硬件 | 嵌入式CPU | PC架构 | |||||
原理 | 以计算机系统作为主体,通过插入多块采集卡和显卡,来实现大屏拼接,图像处理主要由CPU完成 | 通过硬件电路将采集到的图像高速串行化,然后通过背板上的高速串行芯片将图像分发到各个输出板卡显示 | 在采集节点端,将图像分解成网络数据包,在输出节点,将网络包合并成图像 | 在采集端将图像转换成H.264码流,在图像输出端将H.264码流转换成视频输出 | 输入节点机通过插入采集卡采集图像,通过VNC方式分发到各个输出节点机显示 | ||||
系统构成 | 采集端 | PCI/PCI-E采集卡 | 采集板 | 图像采集节点 | 输入节点机 | ||||
显示端 | 显卡,多屏卡 | 输出板 | 图像输出节点 | 输出节点机 | |||||
数据交换设备 | 电脑主板 | 自定义高速串行总线交换板 | 通用交换机 | ||||||
操作系统 | Windows/Linux | 无 | 无 | Linux | |||||
传输 | 数据结构 | 数据块 PCI/PCI-E每次传输都从图像中取出一块块进行突发传输 | 全帧切换图像的传输是以帧为单位 | 数据包输入节点将图像分解为标准的网络数据包 | 数据流 输入节点将图像封装为H.264视频码流 | ||||
延迟 | 100MS | 60MS | 70MS | 500MS | 100MS | ||||
压缩 | 无压缩 | 无压缩或者无损压缩 | H.264 | H.264 | |||||
性能 | 拼接路数 | 一般不超过16进16出 | 一般不超过72入72出 | 取决于交换机能力,目前单台通用千兆交换最大为576口,通过级联方式能支持更大的拼接 | |||||
图像质量 | 好 | 好 | 好 | 较好,在文字边缘有细小马赛克 | 好 | ||||
分辨率 | 高清 | 高清 | |||||||
整屏同步性 | 好 | 好 | 好 | 一般 | |||||
功耗 | 50W/ 每路 | 20W/ 每路 | 5W/ 每路 | 10W/ 每路 | 60W/ 每路 | ||||
单屏开窗数 | 无限制 | 2路到4路 | 4路到64路不等 | ||||||
稳定性 | 一般 | 高(7×24) | 高(7×4) | 一般 | 一般 | ||||
信号预览 | 支持 | 需要配置预览卡 | 支持 | ||||||
超高分辨率 | 软件方式支持 | 硬件方式支持 | 通过软件/硬件方式支持 | 软件方式支持 | |||||
网络摄像头解码 | 支持 |
如果从数据处理角度来看,PC架构的集中式采用的方法是分散采集(通过采集卡采集到内存),分散显示(从内存到显卡), CPU集中计算(当然,这种架构也在发展,目前开始出现了CPU只负责调度,由PCI-E Switch芯片转发数据包,由显卡计算这种方式)。由CPU来集中处理的方式也就决定了PC架构的不稳定性,以及拼接路数的限制。
PC架构的处理器平均功耗很高,主要原因是在PC上运行,功耗的百分之九十可以叫做静态功耗,被操作系统等软件消耗掉。
集中式硬件架构其实是分散化实现数据处理的,它的图像处理在输出板卡完成,交换背板只负责数据分发。由于交换背板是各个厂家自行设计的,每路带宽可以达到几G带宽,但是交换背板的芯片是一种叫做高速串行总线交换开关的芯片,只能通过配置内部寄存器,作点对点传输,这样带来的一个结果就是无法进行图像分割,传输带宽是显示带宽的好几倍,所以一般而言,纯硬件集中式单屏开窗能力只能做到4路。同样的道理,交换芯片无法将采集内容数据化,也就不支持图像直接进入计算机预览的能力,所以纯硬件集中式处理的信号预览只能通过插入额外的预览卡,将图像转换成网络数据包。当然,这样做的好处是不需要做复杂的帧存控制,可以达到很低的延迟。
分布式,尤其是嵌入式CPU分布式,利用嵌入式CPU 的解码能力和内嵌Linux操作的便利性,能够很方便的进行基于H.264码流的传输,做一些灵活的大屏控制。由于H.264码流无法进行图像切割,存在着计算带宽是显示带宽的好几倍的问题。这在做跨屏漫游时很容易突破计算能力而导致画面停顿。H.264码流还存在参考帧和关键帧的区别,每一幅画面的解码都依赖于前几幅(可到15幅)画面。所以延迟较大。
纯硬件分布式由于可以作画面分割,完全按照所需带宽传输,所以可以实现单屏64路信号。纯硬件分布式没有依赖于第三方厂家的图像处理引擎(嵌入式CPU方式的图像处理引擎由芯片厂家提供),只能自主开发,由于通用图像处理引擎过于复杂,一般自主开发时会针对大屏应用舍弃许多不需要的功能,而对大屏应用需要的部分作强化,所以能够实现低功耗高性能。
网络分布式拼接系统与之前两代系统的最大差异就在于它的系统构成上,整个系统在物理结构上进行分散配置,这样看似好像增加了系统的复杂程度,但其实大大增强了系统的灵活性和可操作性。
网络分布式拼接系统采用网络星型拓扑模式构建系统,如下图所示:
在星型拓扑结构中,网络中的各节点通过点到点的方式连接到一个中央节点(又称中央转接站,一般是集线器或交换机)上,由该中央节点向目的节点传送信息。中央节点执行集中式通信控制策略,因此中央节点相当复杂,其负担比各节点重得多。在星型网中任何两个节点要进行通信都必须经过中央节点控制。
分布式拼接控制系统通常由以下四个部分组成:
1、信号源输入处理节点:其负责采集各种接口方式的信号并进行信号预处理,然后进行数据编码生成在以太网上传输的IP码流;
2、显示输出处理节点:其进行数据解码和图像最终显示效果的处理;
3、以太网交换机:它是整套系统的中心,起数据交互作用;
4、控制管理软件,用户通过安装在控制服务器上的控制管理软件对各个处理器进行实时控制和管理;
具体系统结构如下图所示:
网络分布式拼接系统,顾名思义,全套系统以网络模式分布。我们先看图中央,为一个通用全千兆网络交换机,它是整套系统的中心,它只起到数据交互的作用,不做任何数据处理。作为整套系统的中心,使用的是最为稳定的工业交换机,也可以说明这个系统方案的稳定性。
然后就是红色区域的采集节点,其作用是采集各种接口方式的图像信号,然后进行图像预处理和数据编码工作。每个节点相对独立,只负责自己所采集到的一路信号的计算工作。增加或者减少节点不会影响其他节点工作。节点通过网线和网络交换机相连。
最上方的蓝色区域为输出部分,每一块单屏对应一个输出节点,由DVI或HDMI等视频数据线相连,一组拼接屏包含多少个单屏就需要多少个输出节点。输出节点的作用是进行数据解码和图像最终显示效果的处理。同一个系统可以包含多个不同地点的拼接屏。增加或者减少节点不会影响其他节点工作。节点通过网线和网络交换机相连。
另外,系统还需要一台控制服务器,向系统中各个输入或者输出节点发布拼接命令,命令发布后在各节点中保存,工作时可以不再与控制服务器应答。控制服务器由一条网线与网络交换机相连,所有命令由IP地址指向。在不需要频繁发布控制策略的应用场合,系统可以脱离控制服务器连续运行,实现分布式全硬件稳定运行。
根据行业要求,在系统中还可以加入一些辅助设备,例如网络硬盘录像机NVR进行全屏录像,高清底图服务器可以在屏幕上加载地理信息软件GIS,预览及回显服务器可以使用户在控制终端上预览未上屏的视频源图像和回看大屏上已有视频的摆放效果。
从系统架构看,目前市场上存在的分布式处理器主要有四种类别,分别是纯硬件,嵌入式CPU,纯硬件混合式,PC架构。下面一一剖析:
一、纯硬件(如图13)
图13
系统由三部分构成,采集节点,交换机,输出节点
采集节点负责图像采集,然后将图像分解成网络数据包,通过交换机发送到输出节点,输出节点再将数据包混合为图像,在输出端进行图像处理和显示。
纯硬件的特点是把采集到的内容当做图像数据包,而不是视频流来传输。以图像区域元为传输单元,为图像的切割,分发,帧存控制提供了高效的基础。切割和分发是为了满足带宽需要而设的,秉承量入为出的设计宗旨,需要多少传输多少,图像叠加后被遮盖的区域不传,重复的区域不传。(如图14)
图14
这样带来的一个好处就是传输要求的带宽不需要根据叠加区域和重复区域而增加,无论怎么拼接和叠加都可以满足带宽要求。得利于基于图像的传输方式,帧存控制变得更加容易,能够保证整屏同步,低延迟。
纯硬件处理器使用的核心器件是大规模可编程电路(FPGA)。FPGA的特点是没有CPU,不存在程序跑飞,死机的问题。即使环境电源出现故障,FPGA失效后也能快速恢复。
纯硬件的弱点就是不能解码网络摄像头和图像的远程传输(由于传输无损图像,导致带宽很高,无法通过公网传输)。
二、嵌入式CPU(如图15)
图15
系统由三部分构成,采集节点,交换机,输出节点
采集节点负责图像采集,然后将图像压缩成视频压缩流,通过交换机发送到输出节点,输出节点再将压缩码流解压成视频,在输出端进行图像处理和显示。
嵌入式CPU方案一般来说都是采用ARM+编解码模块的方式完成,ARM上面运行Linux操作系统负责事务管理,图像的缩放,网络连接,编解码模块负责图像的压缩和解压。另一种方式是ARM+DSP的方案,和 ARM+编解码模块类似,由DSP完成编解码,所不同的是DSP能够自定义压缩算法,更加灵活。
由于采用H.264编解码的方式,最大的优点是天生具备网络摄像头解码,和图像远程传输(通过公网传输)。同时,该结构也带来了其它问题,压缩后图像质量不佳,把图像当作视频流传输后,只能对视频进行完整的处理,不能做类似于纯硬件方式的切割传输,当单屏解码多路时,导致图像卡顿,整屏同步性不佳,延迟较大。
此外,由于使用了CPU,也就存在死机的风险。虽然能够通过添加看门狗自动复位,但是由于操作系统的启动时间在20秒到30秒之间,这个过程显示屏存在黑屏和花屏的问题。
三、纯硬件混合式(如图16)
图16
该方案其实就是纯硬件和嵌入式CPU的结合。纯硬件部分负责拼接,嵌入式部分负责网络解码和远程传输。该方案带来的好处是既能保证本地视频(采集本地的VGA,DVI,视频)高质量,完全无损、低延迟,又能实现解码网络摄像头和远程传输。
由于采用混合结构,当嵌入式CPU部分死机复位时,纯硬件部分能够将图像冻结保存,不会出现花屏和黑屏现象。
该方案最大程度的结合了前两者的优点,又弥补了两者的弱点,出现1+1>2的现象,这种混合结构是纯硬件和嵌入式CPU两大阵营的发展目标,预计未来几年内将会是分布式处理器的主流。
四、PC架构(如图17)
图17
PC架构由输入节点机和输出节点机以及交换机组成。输入节点机是由一台工控机,采集卡和压缩软件组成。输出节点机由工控机,显卡和解压缩软件组成。
输入节点机通过采集卡采集图像,计算机将其压缩成H.264码流送入交换机,输出节点机将码流解压缩,后处理,最后经显卡显示。
该方案出现在10年前,由网络抓屏发展而来,不过受计算机性能的限制,一个输入或者一个输出就需要一台电脑,导致成本居高,稳定性不佳。近几年由于PC性能提升,显卡加速的原因,图像的效果不错,在一些展览展示项目有一席之地,但是受到PC架构本身的影响,导致稳定性有所下降,不太适合7×24小时开机使用。