来源:广播与电视技术
翻译:麻家宾
审稿:杨 宇
日本公共广播机构NHK的科学技术研究实验室STRL正在研究一种音频描述制作系统,该系统能够向视障人士传达比赛的情况和运动员的表情,使视障人士能够享受到体育直播带来的乐趣。在本次展览中,我们介绍了实时生成音频信息并将其传输到智能手机和其他设备的技术,技术示意图如图1所示。
图1 实时音频描述制作和传输系统示意图
1. 研究目标
在体育直播节目中,主持人的精彩解说和播报信息通过音频传递给观众,同时,图像信息也出现在屏幕上,呈现了比赛的具体情况和运动员的细腻表情。不幸的是,视障人士无法接收到视觉信息,也就不能了解这些细节了。NHK正在开发一种能够提供实时音频描述的系统,以便帮助视障人士能够更好地享受体育直播节目带来的乐趣。
2. 研究主题
主持人很难在现场广播的同时对视觉信息提供音频描述,因为音频描述往往需要即时的现场判断和适当的信息补充,同时还要预测直播主音的中断时间,以免加入的描述音频与节目的主音频重叠。
3. 解决方案
图2 音频描述制作和传输系统服务
科学技术研究实验室开发了一种工具,可以根据节目即时播送的视觉信息,轻松补充高优先级匹配状态的音频描述信息。
只需要手动选择经系统分析后的匹配信息按钮,就可以自动生成相应信息的音频描述。
图3 音频描述输入工具
此外,此系统分发到智能手机上面的合成语音不会与节目主音频的时间重叠,从而实现广播节目主音频与音频描述能够一起和谐呈现的效果。
好文共赏请转发 有话要说请留言