谷田表示,如何让机器学会只录取特定人和特定声音是视频会议音频处理技术的重要研究方向,也是雅马哈人工智能理念的体现。
首先,在网络或视频会议进行的过程中,如果在开放空间或者有来自投影仪等杂音源的场所,如何识别音源的位置是对视频会议产品与技术的一个挑战。
面对这个挑战,雅马哈采取的对策是,使会议用传声扬声器可以根据场面的不同而采取不同的收音模式。该扬声器中的麦克风阵列可以识别音源的位置,只收录说话人的声音,并清楚地传达给对方。具体到具备了这样功能的PJP-100H上,它拥有三种特定模式:第一,区域模式:最适合在安静环境下的会议,在场所有人的声音都可被录入;第二,点式模式:可收录特定方向上的声音;第三:追踪模式,设备可以自动追踪发言人的声音。
其次,视频会议系统通常会面临出差员工从外地接入,参加会议这样的情况,临时会议录音功能非常重要。市场上现有的产品一般的解决思路是靠一台笔记本电脑、软件外加耳麦,组成临时的视频会议端点。但是,长时间使用耳麦容易造成疲劳,也不利于两位以上的出差员工同时参与。因此,雅马哈研制了一系列轻巧、便于携带的Web会议用传声扬声器,采用USB供电的方式,供连接笔记本电脑使用。
针对此类产品,谷田如此描述他们的技术设计思路:这类小型扬声器具备和个人电脑、音乐播放器连接,以增强其使用率;但更重要的是,不能忽略其传声和会议录音的功能,只录最需要的声音。在一次对此类产品PJP-25UR的体验中,记者一边利用扬声器大声播放电脑中的音乐,同时利用扬声器录音现场的对话。最后播放录音,里面只能听到记者说话的声音,完全没有音乐等杂声。田丸卓也表示,这是通过对扬声器和软件的设定实现的。