您的位置: 世界经理人> 世界计算机 > 商业科技 > 软件趋势
先进压缩标准引发音视频同步化技术热
2007-05-16 11:23   来源:
摘要:

  -ADI高级应用工程师Ke Ning、Gabby Yi

  DTV、DVD、直播卫星(DBS)和数字有线等技术采用压缩方法来为消费者提供品质极高的节目。随着音频视频内容传送方面先进的视音频压缩标准的引入,人们对音频和视频间的时序关系的关注程度也在不断提高。

  音视频信号要同步

  数字广播系统的基本目标之一,就是向观众提供实现合理同步的视频和音频数据内容。提出这样一个目标的原因,是从制作到收看的整个传播链条中的每种数字音频和视频部件,都会给通过该部件的信号带来一定的延迟。音频和视频信号上出现的延迟一般是不相等的。每个元件都很有可能造成其输出信号出现音视频同步方面的错误。

  音频和视频流的解码必须按照一定的先后顺序完成,这样才能确保“对上口形”。音频和视频解码器可以通过相互独立的处理器来实现,或者,如果有相应的处理能力的话,也可以将它们集成到单个处理器上。无论何种情况,为了保证音视频信号的同步,必须采取某种形式的A/V同步技术。若音频和视频解码后的数据流无法保证同步,则听到的音效将超前于或滞后于原本对应的视频帧。这当然是观众不可接受的。

  媒体数据通道和延迟

  典型的基于媒体的数字系统是由一组编码器和解码器构成的。系统的编码器部分执行压缩功能,而系统解码器功能则执行解压缩功能,以供观众观看。

  媒体数据(Meda)在编码器系统和解码器系统间传送,该数据同时包含了音频和视频分量。因为音频和视频分量本身的特性并不相同,两个子系统的同步化方法也不同。

  一般来说,由于音频流通过系统时出现的延迟极低,因此无需添加音频延迟补偿措施。另一方面,视频的处理所需的时间和计算能力都大大超过音频。

  与音频信号类似,视频信号一旦被数字化并被缓冲后,对该信号的处理操作所花费的时间将长于在模拟域进行的相同操作。因为大多数视频效果无法在模拟域实现,就必须采用数字处理,于是,必然出现一定的“系统”延迟。

  关注一下如下问题将很有意义:音频和视频的信号处理是如何影响到系统的总延迟的?视频处理的时间之所以要长于音频处理的,是因为待处理的数据量更大,而且对处理的要求也更高。视频处理所需的工作量高于音频信号处理的工作量的特点,又使得视频信号相对于音频信号会出现延迟。于是,视频和音频分量从编码过程开始就“脱离了同步”。

  业界标准在不断推进

  对于任何延迟超过几个ms的视频装置,补偿都是必不可少的,否则观众就会觉察到延迟的存在,视频内容的收看质量就会受到影响。为了保证这一现象不至于发生,音频通道必须出现同样长度的延迟。ITU则进一步推荐了可以采取的技术,该技术作为ITU-R BT.1377的一部分推出。具体来说,该技术是对音频和视频的帧进行标记,以指示处理过程带来的延迟。

  人类的感官对于听觉滞后于视觉的现象的容忍度要更高一些,因为这一滞后现象是我们每天都司空见惯的。国际电信联盟(ITU)于1998年发布了ITU-R BT.1359。它基于如下研究结果:当非同步误差处在音频超前视频45ms和滞后视频125ms这样的范围内时,A/V同步误差能够被可靠地检测出来。这仅仅是检测方面的标准,而可接受的范围和推荐的最大值则要宽得多。总而言之,ITU的推荐认为,从观众或听众捕捉节目内容的角度来看,可容忍的范围应该分别不大于90ms(音频超前于视频)和185ms(音频滞后于视频)。在现实中,这一范围对于真正可接受的性能来说也许太宽了,所以一般遵循更小的公差。

  随着数字媒体广播的增长,人们认为对ITU R BT.1359-1的市场要求对于DTV广播的音频和视频同步来说已经不合适了。先进电视系统委员会(Advanced Television System Committee,ATSC)是一个关于数字电视标准的产业性组织。其“实施方案”分委员会经过调查,提交了一份“实施方案分委员会”发现报告,IS/191 ATSC实施方案分委员会发现报告:广播操作中的声音和视觉的相对时序”。该分委员会发现,在所有的工作条件下,在DTV编码装置的输入点,声音节目都应该与视频节目严格保持同步。基于该发现,他们推荐声音节目超前于视频节目的时间绝对不能超过15ms,而且滞后于视频节目的时间也不能长于45ms。

  音频解码更重要

  MPEG规范提供了可绝对保证A/V同步的恰当工具。每个音频和视频帧都有一个能让解码器同步对声音和图像进行重建的PTS。这些PTS值由MPEG编码器中的复用器来赋予。解码器在这些PTS之前接收到音频和视频数据,于是便能利用这些值来同步地播放视频和音频。

  MPEG位流中需要插入播放时间印记,插入的间隔不超过700ms。MPEG系统目标解码器模型容忍最高为1s的解码器缓冲延迟。在传输流中,用来呈现应该同步播放的声音和图像的音频、视频播放单元可以在时间上分离,时间差长达1s。为了产生同步化的输出,接收机必须恢复出解码器的系统时间时钟(STC)并使用播放时间印记(PTS)来向观众播放音频-视频内容,其相应的公差在PTS所标注的时间点的正负15ms内。

  音频解码被认为更为重要,因为音频中的任何间断都非常明显,而人们对视频就不那么敏感(例如,视频帧的丢失就不那么容易被观看者所察觉)。视频解码器的调节比音频解码器的调节更为容易,因为视频场每1/60s(16.6ms)才发送一次。这样的调节必须不至于造成视频场的遗漏或丢失。建议定期对音频和视频STC值进行同步化处理,频率最低为每秒1次。

[1] [2] 下一页
关键词:先进压缩标准引发音视频同步化技术热            
  评论 文章“先进压缩标准引发音视频同步化技术热”
1、凡本网注明“世界经理人”或者“世界计算机”的作品,未经本网授权不得转载,经本网授权的媒体、网站,在使用时须注明稿件来源:“世界经理人”或者“世界计算机”,违反者本网将依法追究责任。
2、凡注明“来源:xxx(非本站)”作品,不代表本网观点,文章版权属于原始出处单位及原作者所有,本网不承担此稿侵权责任。
3、欢迎各类型媒体积极与本站联络,互相签订转载协议。
4、如著作人对本网刊载内容、版权有异议,请于知道该作品发表之日起30日内联系本网,否则视为自动放弃相关权利。
5、联系我们:contact@icxo.com;投稿邮箱:article@icxo.com,欢迎赐稿。
相关阅读
 微软开发HDR幻像技术修复照片曝光
 评论:探讨开源软件的互操作策略
 手机操作系统三英战吕布
 行业协会抨击GPL第三版草案
 软银亚洲易主 首期基金创始人孙正义交权
 没当上CEO继承人 甲骨文CFO马菲离