据谷田介绍,如何将新型视频会议系统拟人化,以贴近人工智能需求,是雅马哈PJP系列倡导的最新网络会议技术理念。这些理念将通过瞬间呈现技术、声音非增幅音响设计、内置适应型回声消除器等一系列技术得以体现。
假如甲地和乙地一起举行远程视频会议,甲地人员如何清楚确定乙地哪位与会者正在发言(视频追踪)十分重要。在处理这一问题上,思科、北电—宝利通采取的措施霸气十足:打造一个30万美元以上的网真会议室,租用超宽带宽传输声音和图像,用超大电视墙1∶1地还原场景和参会者;而苏州科达等国内企业的做法相对经济实惠:用甲地员工手中的遥控器去控制乙地会议室摄像头的转动和焦距调节,寻找小显示屏幕一次装不下的参会者或给出特写镜头。总体来说,这两种做法都使用的是“寻声辨人”的方式,但用的是人眼搜索。
雅马哈给这一问题增加了一条技术解决路径,那就是使摄像头学会寻声辨人。谷田向记者介绍道:“不要忽略人类都是‘寻声望去’这一听觉的天性,在视频会议系统中,视频显示与声音的处理技术其实是密不可分的。以PJP-300V这款摄像头、麦克风、扬声器一体机为例,它可以实现说话人瞬间显示的功能。即使使用普通液晶屏幕,会议发言人的特写和声音也能瞬间呈现。”这项技术的实现,依靠的是在PJP-300V上面配列16个麦克风阵列,可以自动判别说话人的位置;通过说话人的位置信息和3个摄像机的切换、联动,使说话人可以瞬间在屏幕上显示出来。这项技术不需要摄像头的切换动作,保证了会议顺畅进行。同时这项瞬间呈现技术,在桌面型VoIP电话中也可以应用,使音频会议呈现立体感,实现与语话者座位的匹配。