纯硬件拼接控制器DC2000是在2006年推出的最新技术产品,产品以FPGA阵列为硬件基础,采用并行高速图形处理技术,实现了多路高速视频信号的统一处理,从根本上取代插卡式拼接控制器,解决了VGA信号输入数量受到限制的问题。产品主要特点如下:
一、独创的FPGA硬件图形并行处理技术
FPGA(Field Programmable Gate Array),称为现场可编程逻辑阵列,是最近新发展的硬件技术。FPGA芯片具有速度快,并行处理,功能灵活的特点,但芯片本身只是一个空白的硬件平台,不具备任何功能,需要技术人员根据自己的要求对其进行硬件编程。DC2000的处理核心就是FPGA芯片阵列。
系统具有高速信号处理技术,保证高分辨信号输入输出的实时处理。DC2000采用DDR技术作高速数据缓存,运用流水线技术,对高速信号进行分级顺序处理,保证了信号的实时性。系统输入标准分辨率可高达1600x1200x60Hz(需要预定),非标分辨率可以达到更高,并且保证每一祯都能够实时的处理完毕,输入与输出之间没有时间拖延。在多单元显示一路信号、一单元显示多路信号、多单元多信号漫游叠加等情况下,显示信号均无延迟。即便在所有输入信号都漫游叠加在一起的极限情况下,所有信号一样保持动态实时性。
系统采用基于输入端口的信号并行处理技术,有效的增加了输入信号个数。系统通过芯片阵列,对高速图形数据流进行逐级处理,每一路信号输入都对应一列处理器。这样就相当于很多处理器同时工作,做到数据的并行处理,极大的提高了系统运算速度。有效的是用并行处理技术使得数据得到分散处理,没有了工控机单处理器的速度瓶颈,从而使得系统对输入信号个数不敏感。就是说增加信号输入个数,并不增加系统的总体运算负担,这样系统就能够接纳多个高速信号。能够有效的进行多路VGA/RGB信号输入,是DC2000与普通插卡式工控机相比,最大的性能优势。
系统属于纯硬件数据处理,没有运行Windows和Linux操作系统,不是一台计算机,不需要营盘、光驱、显卡等辅助设备。
二、
DC2000采用所有输入通道并行方式进入核心处理模块,每条总线使用4个高速LVDS信号,这与工控机拼接控制器的PIC总线有本质上的区别。
普通工控机的PCI总线,基本结构是多个PCI插卡使用同一组总线,一般是32个数据位。如下图所示,6个卡使用同一PCI总线,实际上进入核心处理器的数据只能是其中的一个卡上的信号,PCI总线要分时复用。由于CPU核心处理器同一时间只能处理一个信号,这样的总线结构对于这样的CPU正好适合。DC2000采用并行处理结构,这样的总线是远远达不到处理器速度需求的。
工控机的PCI总线结构
为适应核心并行数据处理要求,DC2000采用并行总线接入方式,就是说每个通道都有独自的总线接入核心处理系统。多个通道采用并行的方式可以实时的将数据送入核心的FPGA处理阵列。
如果每个输入通道都使用PCI总线,那么最终形成的输入线数量会多得惊人。在FPGA核心处理部分中,也许要多组信号进行实时交换。如果也采用并行总线结构,那么系统间的连线数量会成几何上升,使得系统最终无发实际使用。
为解决此结构问题,我们采用超高速LVDS进行信号传输。LVDS,是低电平数字信号的简称,其特点是用两根线差分传输一个数字状态,线间电压低,信号传输速度快,本系统中使用的LVDS信号速度为2.5G/S,信号额定最高速度可以达到4G/S以上。使用LVDS进行图像传输,4组线即可传送超高频的显示信号。是用高速串行信号,极大的减少了系统连线的,使得每个输入输出通道只使用4组线与系统核心计算单元连接。LVDS信号与并行总线信号,最常见的体现是硬盘ATA的并行排线接口和新型硬盘SATA的LVDS接口。下图为DC2000基本系统节构图。
DC2000多通道并行总线结构及串行通信方式
三、
DC2000系统采用并行硬件系统,这样很大程度提高了系统数据处理速度,但并行处理,就意味着很多器件同时工作,增加了系统元件个数,这样,所有器件的同时统一控制,就成为重要问题。对于工控机而言,只有一个CPU进行核心运算,数据是串行处理的,因此配置一套接口,就可以控制所有的设备,而DC2000需要用一个高速控制器同时控制多于32个其他部件,同时又要能灵活的协调各部分顺序运行。为解决此问题,我们选用了基于FPGA的高速软内核NiosII。
NiosII处理器是Altera公司为其FPGA产品配套开发的软核CPU。在逻辑功能上,它们是32位的精简指令集CPU;在实现方式上,它们是在FPGA上通过编程的方式实现的,这也是与传统的CPU的一个根本的差别。NiosII的总线采用了哈佛结构,在很大程度上提高了系统的处理速度。由于系统的总线控制器是在FPGA中实现的,可以进行灵活的配置,在某些外设需要具有冯诺依曼特性时又可以把两套总线合二为一,从而在局部实现冯诺依曼结构,这样就使得系统总线兼有哈佛结的高效率与冯诺依曼结构的灵活性。NiosII系统总线自动对不同时钟域进行协调,可以使挂在总线上的组件工作在不同的主频下,使系统更为灵活。
DC2000使用一片FPGA,内嵌NiosII软内核,成为系统核心控制器。在这片FPGA上,还编程实现了64个外围通信控制模块,为系统提供64个可同时工作的基于LVDS的高速接口,与全部系统其他器件进行高速通信。系统工作时,数据计算FPGA阵列、输入输出端口、系统面板、红外接收器、网络端口、RS232控制口等元件向主控FPGA发送状态信息和请求指令。软核的外围通信控制模块先预处理这些信息,将其最主要的内容交给内核,其他附属信息不需要经过主控制程序,由外围器件自行应答。主控程序是在内核上运行的并行流水线流程控制程序,它负责整台机器的正常顺序工作和非常状态处理。程序根据用户指令和系统当前状态,向外围模块批量发送简单控制指令。由外围模块编译指令,通过LVDS高速串行口发送给系统其他设备。
DC2000使用基于FPGA的NiosII软核和并行外围通信控制模块,提高了整台机器的信息处理性能,将复杂的并行控制简单化;用一个芯片实现全部控制,编程调试简单方便,易于升级。
四、
目前市场上使用的图像拼接控制器,大体分为两种。一种是组装的工控机,需要从国外购买Datapath卡进行组装,另一种就是硬件拼接处理器。
用工控机组装拼接控制器,需要插多个Datapass卡,多卡使用同一组PCI总线,占用PCI总线资源,其结果是机器性能很大程度上取决于工控机CPU计算速度。以普通Pentium 4,2.8G的CPU为例,可以接受4路VGA/RGB 1024x768信号和8路或9路Video信号,可以支持32路输出。一台普通插卡式拼接控制器的性能如下:
系统结构:计算机结构,8-12个PCI插槽;266-533MHz系统总线;
输出通道:数量2-32个;输出通道分辨率640x480到1280x1024像素;
输入视频:个数1-8个;格式NTSC或PAL自适应;8路Video卡不能叠加;
输入RGB:个数1-4路;时钟速度123M;采样颜色深度16bpp;
系统支持:WindowsXP/2000
软件支持:设备提供上自开发软件
控制:本地键盘鼠标、远程鼠标键盘
需要注意的是:
1、 当VGA/RGB信号多于2路时,系统分配给每路VGA信号的处理时间不足,导致信号实时性降低,基本现象就是鼠标和动态图像的不连续;
2、 有些工控系统号称具有24bpp的采样颜色深度,事实上在实际使用中,由于计算速度的限制,都只用到16bpp颜色;
3、 采用网络接口采样的方法增加RGB输入信号数量,并不能节约系统资源,结果仍然是多个信号同时显示的时候,图像实时性受影响。并且网络信号采样的质量、实时性等受到网络速度、通信质量等环境影响,有一定未知性和不稳定性。
DC2000拼接控制系统采用全硬件设计,与工控机有本质区别。系统采用多通道分离处理,所有数据并行处理;使用FPGA阵列并行处理信号,速度快,支持通道个数多;系统主控芯片与系统计算芯片分离,采用主程序串行控制;不属于工控机,不运行Windows/Linux操作系统,不存在计算机防病毒问题,不存在软件系统维护问题;数据实时处理,不需要硬盘、光驱等海量存储设备;设备支持全年24小时运行,不需要特殊维护。其基本性能参数如下:
系统结构:并行处理结构,自定义高速LVDS总线,速度2.5Gb/s
输出通道:实时页面存储,数量1-16个,内部级联后,可依据当前显示窗口数无限扩展;分辨率640x480到1600x1200像素,可定制特殊分辨率,如4096x768(1x4屏) 或1920x1080;支持DVI-I模拟数字接口;
输入视频:单系统1-32路,内部级联后无限扩展;格式NYSC或PAL自适应;Video信号高速动态图像补偿;信号任意拉伸、压缩,可以在多屏内任意位置开窗口,信号任意跨屏漫游,叠加(信号叠加层数不宜超过4层),图像实时性不受影响;
输入RGB:实时页面存储,分级数据预处理;单系统1-32路,内部级联后无限扩展;采样深度24bpp/32bpp真彩色;分辨率640x480到1600x1200像素,可定制特殊分辨率的支持功能,如可以支持4096x768或1920x1080;支持DVI-I模拟数字接口;信号任意拉伸、压缩,可以在多屏内任意位置开窗口,信号任意跨屏漫游,叠加(信号叠加层数不宜超过4层),图像实时性不受影响;
系统支持:不需要系统支持
软件支持:DC2000/2000远程控制软件
控制方式:RS232串口、面板按键、红外遥控、100/1000Mbps网络(TCP/IP协议)
对于单机而言,以上参数为可实现的正常运行参数。例如,RGB信号可以支持8路分辨率为1600x1200的RGB信号同时输入;所有输入信号,RGB或者视频信号,都可以跨多屏漫游,能够跨屏信号叠加;运行颜色深度为24bpp,可选择所有通道使用32bpp的真彩色设置。
DC2000与普通工控机拼接卡系统的性能比较,如下表所示:
名称 |
DC2000纯硬件拼接器 |
插卡式拼接器 |
操作系统 |
硬件嵌入式操作系统,系统稳定高效,切实保障系统长时间运行 |
Windows\Linux操作系统,系统常常因为病毒等各种原因崩溃 |
硬件构成 |
模块化设计,系统组成较为简单,都是由一个厂家独立研发和制造,故障率低 |
工控机加采集卡,多头输出卡等组成,部件众多,情况复杂,常常因为个别部件故障导致整机无法运行 |
系统总线 |
自主研发的高速总线,各通道独立处理,可同时处理多路RGB信号,速度不受影响 |
受限于PCI传输总线的限制,不能同时处理多路RGB信号,单信号的采集也不能超过123M |
输入信号 |
所有输入信号可在任意单个或多个屏上拉伸、缩放、跨屏漫游、叠加,信号实时性不受影响 |
信号漫游、叠加功能受限 |
输出信号 |
高质量DVI-I(向下兼容VGA信号)信号可选 |
VGA模拟信号,效果跟数字信号有很大差距 |
RGB信号 |
可接受高分辨率DVI、VGA信号,同时显示的数量不受限制,可任意的在屏幕上任何位置显示,画面速度不受影响 |
无法接受DVI数字信号;最多同时显示两路RGB信号,且受限于带宽,播放高数据流量动态图像时,画面速度会明显变慢 |
VIDEO信号 |
可接收YUV,YC,VIDEO等格式的视频信号,NP自适应,动态补偿;图像经过处理,显示质量好,画面速度不受影响 |
图像未经处理直接采集输出,效果比较差,且一般不能跨窗口漫游 |
工作方式 |
上电即可使用,操作简单,对工作环境要求低,运行安静,发热量小 |
需要等待长时间的开机过程,受工作环境影响大,夏季面临散热问题,冬季风扇噪音大 |
性价比 |
优良的性能,同等要求下,价格低于卡式机,性价比较高 |
功能有限,同等要求下,价格高于硬件式拼接。 |
示例:多个图像在一个单元或多个单元上实现图像分割功能:
示例:多个图像在一个单元或多个单元上实现图像叠加功能:
示例:多个图像实现图像叠加缩放功能: