• 提示:您的电脑还没有安装阿里旺旺。免费安装阿里旺旺,与百万商人在线谈生意!
  • 关闭
我的推荐
无推荐
我的图片 (共3张)
我的文章
H.264视频编码基本知识  (2007/09/21 17:51)

H.264视频编码基本知识

一、视频编码技术的发展历程

  视频编码技术基本是由ISO/IEC制定的MPEG-x和ITU-T制定的H.26x两大系列视频编码国际标准的推出。从H.261视频编码建议,到H.262/3、MPEG-1/2/4等都有一个共同的不断追求的目标,即在尽可能低的码率(或存储容量)下获得尽可能好的图像质量。而且,随着市场对图像传输需求的增加,如何适应不同信道传输特性的问题也日益显现出来。于是IEO/IEC和ITU-T两大国际标准化组织联手制定了视频新标准H.264来解决这些问题。


  H.261是最早出现的视频编码建议,目的是规范ISDN网上的会议电视和可视电话应用中的视频编码技术。它采用的算法结合了可减少时间冗余的帧间预测和可减少空间冗余的DCT变换的混合编码方法。和ISDN信道相匹配,其输出码率是p×64kbit/s。p取值较小时,只能传清晰度不太高的图像,适合于面对面的电视电话;p取值较大时(如 p>6),可以传输清晰度较好的会议电视图像。H.263 建议的是低码率图像压缩标准,在技术上是H.261的改进和扩充,支持码率小于64kbit/s的应用。但实质上H.263以及后来的H.263+和H.263++已发展成支持全码率应用的建议,从它支持众多的图像格式这一点就可看出,如Sub-QCIF、QCIF、CIF、4CIF甚至16CIF等格式。


  MPEG-1标准的码率为1.2Mbit/s左右,可提供30帧CIF(352×288)质量的图像,是为CD-ROM光盘的视频存储和播放所制定的。MPEG-l标准视频编码部分的基本算法与H.261/H.263相似,也采用运动补偿的帧间预测、二维DCT、VLC游程编码等措施。此外还引入了帧内帧(I)、预测帧(P)、双向预测帧(B)和直流帧(D)等概念,进一步提高了编码效率。在MPEG-1的基础上,MPEG-2标准在提高图像分辨率、兼容数字电视等方面做了一些改进,例如它的运动矢量的精度为半像素;在编码运算中(如运动估计和DCT)区分"帧"和"场";引入了编码的可分级性技术,如空间可分级性、时间可分级性和信噪比可分级性等。近年推出的MPEG-4标准引入了基于视听对象(AVO:Audio-Visual Object)的编码,大大提高了视频通信的交互能力和编码效率。 MPEG-4中还采用了一些新的技术,如形状编码、自适应DCT、任意形状视频对象编码等。但是MPEG-4的基本视频编码器还是属于和H.263相似的一类混合编码器。


  总之,H.261建议是视频编码的经典之作,H.263是其发展,并将逐步在实际上取而代之,主要应用于通信方面,但H.263众多的选项往往令使用者无所适从。MPEG系列标准从针对存储媒体的应用发展到适应传输媒体的应用,其核心视频编码的基本框架是和H.261一致的,其中引人注目的MPEG-4的"基于对象的编码"部分由于尚有技术障碍,目前还难以普遍应用。因此,在此基础上发展起来的新的视频编码建议H.264克服了两者的弱点,在混合编码的框架下引入了新的编码方式,提高了编码效率,面向实际应用。同时,它是两大国际标准化组织的共同制定的,其应用前景应是不言而喻的。

二、H.264介绍


  H.264是ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家组)的联合视频组(JVT:joint video team)开发的一个新的数字视频编码标准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。1998年1月份开始草案征集,1999年9月,完成第一个草案,2001年5月制定了其测试模式TML-8,2002年6月的 JVT第5次会议通过了H.264的FCD板。2003年3月正式发布。


  H.264和以前的标准一样,也是DPCM加变换编码的混合编码模式。但它采用"回归基本"的简洁设计,不用众多的选项,获得比H.263++好得多的压缩性能;加强了对各种信道的适应能力,采用"网络友好"的结构和语法,有利于对误码和丢包的处理;应用目标范围较宽,以满足不同速率、不同解析度以及不同传输(存储)场合的需求;它的基本系统是开放的,使用无需版权。


  在技术上,H.264标准中有多个闪光之处,如统一的VLC符号编码,高精度、多模式的位移估计,基于4×4块的整数变换、分层的编码语法等。这些措施使得H.264算法具有很的高编码效率,在相同的重建图像质量下,能够比H.263节约50%左右的码率。H.264的码流结构网络适应性强,增加了差错恢复能力,能够很好地适应IP和无线网络的应用。

三、H.264的技术亮点


1、分层设计


  H.264的算法在概念上可以分为两层:视频编码层(VCL:Video Coding Layer)负责高效的视频内容表示,网络提取层(NAL:Network Abstraction Layer)负责以网络所要求的恰当的方式对数据进行打包和传送。在VCL和NAL之间定义了一个基于分组方式的接口,打包和相应的信令属于NAL的一部分。这样,高编码效率和网络友好性的任务分别由VCL和NAL来完成。


  VCL层包括基于块的运动补偿混合编码和一些新特性。与前面的视频编码标准一样,H.264没有把前处理和后处理等功能包括在草案中,这样可以增加标准的灵活性。


  NAL负责使用下层网络的分段格式来封装数据,包括组帧、逻辑信道的信令、定时信息的利用或序列结束信号等。例如,NAL支持视频在电路交换信道上的传输格式,支持视频在Internet上利用RTP/UDP/IP传输的格式。NAL包括自己的头部信息、段结构信息和实际载荷信息,即上层的VCL数据。(如果采用数据分割技术,数据可能由几个部分组成)。


2、高精度、多模式运动估计


  H.264支持1/4或1/8像素精度的运动矢量。在1/4像素精度时可使用6抽头滤波器来减少高频噪声,对于1/8像素精度的运动矢量,可使用更为复杂的8抽头的滤波器。在进行运动估计时,编码器还可选择"增强"内插滤波器来提高预测的效果。


  在H.264的运动预测中,一个宏块(MB)可以按图2被分为不同的子块,形成7种不同模式的块尺寸。这种多模式的灵活和细致的划分,更切合图像中实际运动物体的形状,大大提高了运动估计的精确程度。在这种方式下,在每个宏块中可以包含有1、2、4、8或16个运动矢量。


  在H.264中,允许编码器使用多于一帧的先前帧用于运动估计,这就是所谓的多帧参考技术。例如2帧或3帧刚刚编码好的参考帧,编码器将选择对每个目标宏块能给出更好的预测帧,并为每一宏块指示是哪一帧被用于预测。


3、4×4块的整数变换


  H.264与先前的标准相似,对残差采用基于块的变换编码,但变换是整数操作而不是实数运算,其过程和DCT基本相似。这种方法的优点在于:在编码器中和解码器中允许精度相同的变换和反变换,便于使用简单的定点运算方式。也就是说,这里没有"反变换误差"。 变换的单位是4×4块,而不是以往常用的8×8块。由于用于变换块的尺寸缩小,运动物体的划分更精确,这样,不但变换计算量比较小,而且在运动物体边缘处的衔接误差也大为减小。为了使小尺寸块的变换方式对图像中较大面积的平滑区域不产生块之间的灰度差异,可对帧内宏块亮度数据的16个4×4块的DC系数(每个小块一个,共16个)进行第二次4×4块的变换,对色度数据的4个4×4块的DC系数(每个小块一个,共4个)进行2×2块的变换。


  H.264为了提高码率控制的能力,量化步长的变化的幅度控制在12.5%左右,而不是以不变的增幅变化。变换系数幅度的归一化被放在反量化过程中处理以减少计算的复杂性。为了强调彩色的逼真性,对色度系数采用了较小量化步长。


4、统一的VLC


  H.264中熵编码有两种方法,一种是对所有的待编码的符号采用统一的VLC(UVLC :Universal VLC),另一种是采用内容自适应的二进制算术编码(CABAC:Context-Adaptive Binary Arithmetic Coding)。CABAC是可选项,其编码性能比UVLC稍好,但计算复杂度也高。UVLC使用一个长度无限的码字集,设计结构非常有规则,用相同的码表可以对不同的对象进行编码。这种方法很容易产生一个码字,而解码器也很容易地识别码字的前缀,UVLC在发生比特错误时能快速获得重同步。


5、帧内预测


  在先前的H.26x系列和MPEG-x系列标准中,都是采用的帧间预测的方式。在H.264中,当编码Intra图像时可用帧内预测。对于每个4×4块(除了边缘块特别处置以外),每个像素都可用17个最接近的先前已编码的像素的不同加权和(有的权值可为0)来预测,即此像素所在块的左上角的17个像素。显然,这种帧内预测不是在时间上,而是在空间域上进行的预测编码算法,可以除去相邻块之间的空间冗余度,取得更为有效的压缩。


如图4所示,4×4方块中a、b、...、p为16 个待预测的像素点,而A、B、...、P是已编码的像素。如m点的值可以由(J+2K+L+2)/ 4 式来预测,也可以由(A+B+C+D+I+J+K+L)/ 8 式来预测,等等。按照所选取的预测参考的点不同,亮度共有9类不同的模式,但色度的帧内预测只有1类模式。


6、面向IP和无线环境


H.264 草案中包含了用于差错消除的工具,便于压缩视频在误码、丢包多发环境中传输,如移动信道或IP信道中传输的健壮性。


为了抵御传输差错,H.264视频流中的时间同步可以通过采用帧内图像刷新来完成,空间同步由条结构编码(slice structured coding)来支持。同时为了便于误码以后的再同步,在一幅图像的视频数据中还提供了一定的重同步点。另外,帧内宏块刷新和多参考宏块允许编码器在决定宏块模式的时候不仅可以考虑编码效率,还可以考虑传输信道的特性。


除了利用量化步长的改变来适应信道码率外,在H.264中,还常利用数据分割的方法来应对信道码率的变化。从总体上说,数据分割的概念就是在编码器中生成具有不同优先级的视频数据以支持网络中的服务质量QoS。例如采用基于语法的数据分割(syntax-based data partitioning)方法,将每帧数据的按其重要性分为几部分,这样允许在缓冲区溢出时丢弃不太重要的信息。还可以采用类似的时间数据分割(temporal data partitioning)方法,通过在P帧和B帧中使用多个参考帧来完成。


在无线通信的应用中,我们可以通过改变每一帧的量化精度或空间/时间分辨率来支持无线信道的大比特率变化。可是,在多播的情况下,要求编码器对变化的各种比特率进行响应是不可能的。因此,不同于MPEG-4中采用的精细分级编码FGS(Fine Granular Scalability)的方法(效率比较低),H.264采用流切换的SP帧来代替分级编码。

四、H.264的性能比较


  TML-8为H.264的测试模式,用它来对H.264的视频编码效率进行比较和测试。测试结果所提供的PSNR已清楚地表明,相对于MPEG-4(ASP:Advanced Simple Profile)和H.263++(HLP:High Latency Profile)的性能,H.264的结果具有明显的优越性。


  H.264的PSNR比MPEG-4(ASP)和H.263++(HLP)明显要好,在6种速率的对比测试中,H.264的PSNR比MPEG-4(ASP)平均要高2dB,比H.263(HLP)平均要高3dB。6个测试速率及其相关的条件分别为:32 kbit/s速率、10f/s帧率和QCIF格式;64 kbit/s速率、15f/s帧率和QCIF格式;128kbit/s速率、15f/s帧率和CIF格式;256kbit/s速率、15f/s帧率和QCIF格式;512 kbit/s速率、30f/s帧率和CIF格式;1024 kbit/s速率、30f/s帧率和CIF格式。

摘要:
数字视频图像监控系统至今已经历了两个发展阶段:九十年代末期,利用计算机多媒体技术来实现视频图像的数字化监控,称为第二代准数字化本地视频监控系统,其代表产品就是数字硬盘录像机(DVR),包括基于PC的数字硬盘录像机和嵌入式的数字硬盘录像机;二十一世纪初期,以网络为依托,以数字视频处理技术为核心,综合利用光电传感器、数字化图像处理、嵌入式计算机系统、数据传输网络、自动控制和人工智能等技术的...
找客户的经验  (2007/06/25 21:53)
摘要:
总结20个找客户的经验
http://www.secu.com.cn  中国安防产品网  时间:2007-06-22 16:16   <a title="生意人使用生意宝,生意越来越旺盛!" href="javascript:d=document;t=d.selection?(d.selection.type!='N...
如何做好一个销售主管  (2007/06/16 18:13)
摘要:                                  ...
监视器相关知识  (2007/06/16 18:08)
摘要:
监视器相关知识问答
浏览次数:478
一、    监视器与电视机有什么区别?为什么电视机不能作为监视器使用?
监视器在功能上要比电视机简单但在性能上,却要求比电视机要求高,其主要区别反映在三个“度”。
1. 图像清晰度
由于传统的电视机接收的是电视台发射出来的射频信号,这一信号对应的视频图像带宽通常小于6M,因而...
摄象机镜头选择指南  (2007/06/16 18:07)
摘要:
摄像机镜头选购指南
浏览次数:512
在电视监控系统中如何根据现场被监视环境,正确选用摄像机镜头是非常重要的,因为它直接影响到系统组成后在系统末端监视器上所看到的被监视面画的效果能否满足系统的设计要求(就画面范围或图像细节而言),所以正确的选用摄像机镜头可以使系统得到最优化设计并可获得良好的监视效果。
摄像机镜头就光圈而言可分为手动光圈镜头及自动光圈镜头两种,就焦距而言又可...
如何选好硬盘录相机  (2007/06/16 18:05)
摘要:
怎样选择硬盘录像机?
浏览次数:378
目前市场上的硬盘录像机产品品种很多。如何选择一款最合适的硬盘录象机,对于很多工程商们来说是一个难题,特别是新手,更是无从下手,选择硬盘录象机,应重点考察该硬盘录象机图象压缩方式、图象质量、实时性、网络性能、稳定性及价格。
  压缩技术是硬盘录像机的核心,选择何种压缩方法最为关键。这里既要考虑到图像的画质,又要顾...
软压与硬压的区别  (2007/06/14 21:30)
摘要: 关于软压缩与硬压缩DVR的问与答
1) 软压缩与硬压缩的主要区别是什么?
答:软压缩与硬压缩的区别主要在于压缩算法由谁执行,如果压缩算法由CPU来执行运算,就是软压缩,如果压缩算法由嵌在DVR卡上的DSP或其他压缩芯片来运算,则是硬压缩。
2) 软压缩DVR好还是硬压缩好?
答:好与不好,关键在于DVR软件,如果软件写的好,软压缩比硬压缩还要好,目前国际上做的最好的DVR依然...
如何看摄象机的技术指标  (2007/04/30 18:14)
摘要: 在摄像机这个圈子,一张彩页里的技术指标其实就已经涵盖了大部份的技术,不信,有几个人敢说他完全知道的,不管是销售人员或工程商,最先拿到的就是一张彩页,而那张彩页,大部份就在吹牛,只有在最后的技术指标上还”稍”有些学问,今天就带大家来搞一搞:
预计分”知识篇”及”实战篇”, 知识篇我来说,实战篇就由各位提供资料,大家一起...
销售十忌  (2007/04/30 18:04)
摘要:
一忌准备不足
毛泽东同志说不打无准备之仗,销售拜访也是如此。如果你对要拜访的客户一点也不了解,你的拜访不但不能促进订单,而且会适得其反。
案例1:
小王:赵总,你好,我是大华公司的销售人员小王,这是我们产品的资料,你看你们是否感兴趣?
赵总:放我这吧!我感兴趣的话给你打电话。
小王:你看看,我们的设备质量好,而且价格也便宜…&h...
无显示 无显示
博主信息
山不在高,有仙则名。水不在深,有龙则灵。斯是陋室,唯吾德馨。
加为好友
给我留言
定制此作者文章
  • 访问量:889
  • 文章数:17
  • 评论数:9
RSS订阅
订阅博主的博客: 不知道如何订阅?
个人资料
最新博文
最新评论
最近访客
我的文章分类
日历
<<    2008年11月    >>
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30            
好友列表
最近更新博客
友情链接
编辑推荐
创建信息
阿里创建号:ALI-001428671
创建日期:
2007-03-27 17:53:26
修改日期:
2007-09-21 17:51:45
版权所有,未经作者许可,不得抄袭或转载,如有需要,可以与本人联系。