ICS35.040
L71
中华人民共和国国家标准
GB/T20090.2—2013
代替GB/T20090.2—2006
信
息技术 先进音视频编码
第2部分:视频
Informationtechnology—Advancedcodingofaudioandvideo—Part2:Video
2013-12-31发布 2014-07-15实施
中华人民共和国国家质量监督检验检疫总局
中国国家标准化管理委员会发布目 次
前言 Ⅰ …………………………………………………………………………………………………………
引言 Ⅲ …………………………………………………………………………………………………………
1 范围 1 ………………………………………………………………………………………………………
2 术语和定义 1 ………………………………………………………………………………………………
3 缩略语 8 ……………………………………………………………………………………………………
4 运算符和数学函数 8 ………………………………………………………………………………………
5 位流语法、解析过程和解码过程的描述 11 ………………………………………………………………
6 编码位流的结构 15 …………………………………………………………………………………………
7 位流的语法和语义 22 ………………………………………………………………………………………
8 解析过程 65 …………………………………………………………………………………………………
9 解码过程 87 …………………………………………………………………………………………………
附录A(规范性附录) 伪起始码 140 ………………………………………………………………………
附录B(规范性附录) 档次和级别 141 ……………………………………………………………………
附录C(规范性附录) 位流虚拟参考解码器 148 …………………………………………………………
附录D(规范性附录) 基本熵编码码表 153 ………………………………………………………………GB/T20090.2—2013
前 言
GB/T20090《信息技术 先进音视频编码》分为以下13个部分:
———第1部分:系统;
———第2部分:视频;
———第3部分:音频;
———第4部分:符合性测试;
———第5部分:参考软件;
———第6部分:面向数字版权管理的可信解码器与访问协议;
———第7部分:面向交互应用的视频编解码;
———第8部分:在IP网络上传输AVS;
———第9部分:AVS文件格式;
———第10部分:移动语音和音频;
———第11部分:同步文本;
———第12部分:综合场景;
———第13部分:可重构视频编码工具集。
本部分为GB/T20090的第2部分。
本部分按照GB/T1.1—2009给出的规则起草。
本部分代替GB/T20090.2—2006《信息技术 先进音视频编码 第2部分:视频》。
本部分与GB/T20090.2—2006相比,除编辑性修改外主要技术变化如下:
———术语和定义中增加了参考背景前向帧间解码图像、二元符号、二元符号串、核心图像、条带集和
帧内解码背景图像等术语的定义,删除了非参考图像术语,同时为了标准术语的统一,将“比
特”统一为“位”,故本部分术语和定义中的填充位为GB/T20090.2—2006中的填充比特、位
串为GB/T20090.2—2006中的比特串、位流为GB/T20090.2—2006中的比特流、位流缓冲
区为GB/T20090.2—2006中的比特流缓冲区,位流顺序为GB/T20090.2—2006中的比特流
顺序(见第2章);
———增加了帧内解码背景图像(G帧)、背景参考前向帧间解码图像(S帧)的定义(见6.2.3);
———增加了条带集的定义(见6.3);
———增加了4×4块的定义(见6.6);
———对视频序列的语法和语义做了修改(见7.1和7.2);
———解析过程增加了ce4(v)和ae(v)的解析过程(分别见8.3.2和8.4);
———图像头解码过程增加了确定加权量化矩阵的步骤(见9.2);
———宏块类型增加了G帧、S帧宏块类型的定义(见9.4.2);
———宏块解码过程增加了4×4帧内预测模式的解码过程(见9.4.4.3);
———宏块解码过程增加了加权量化矩阵的解码过程(见9.4.9);
———基本熵编码的解码过程增加了4×4块解码过程(见9.5.1.3);
———增加了高级熵编码的解码过程(见9.5.2);
———逆扫描增加了4×4块逆扫描的过程(见9.5.3);
———增加了量化系数预测过程的定义(见9.6);
———增加了4×4块反变换的过程(见9.8.3);
ⅠGB/T20090.2—2013
———增加了4×4块参考样本的获得(见9.9.5)及4×4亮度块帧内预测过程(见9.9.6);
———增加了亮度1/8样本插值过程(见9.10.2.2);
———增加了用于4×4块的基本熵编码码表(见附录D);
———增加了档次和级别的定义(见附录B)。
本部分由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。
本部分起草单位:中国科学院计算技术研究所、清华大学、浙江大学、华中科技大学、北京工业大学、
中山大学、华为技术有限公司、上海广电(集团)有限公司中央研究院、北京长信嘉信息技术有限公司、武
汉大学、北京大学、香港科技大学、法国电信北京代表处、中兴通讯股份有限公司、深圳市海思半导体有
限公司、联合信源数字音视频技术(北京)有限公司。
本部分主要起草人:高文、黄铁军、吴枫、何芸、虞露、梁凡、赵海武、马思伟、吕岩、李国平、张志明、
沈燕飞、周敏华、贾云卫、郭红星、楼剑、熊联欢、郑萧桢、张莉、郑建铧、孙莉、毛煦楠。
ⅡGB/T20090.2—2013
引 言
0.1 目标
GB/T20090.2是为了适应数字电视广播、数字存储媒体、网络流媒体、多媒体通信等应用中对运动
图像压缩技术的需要而制定的。
0.2 应用
本部分适用的范围包括但不限于下述领域:
———数字地面电视广播(DTTB,digitalterrestrialtelevisionbroadcasting);
———有线电视(CATV,CableTV);
———交互存储媒体;
———直播卫星视频业务(DBS,directbroadcastsatellitevideoservices);
———宽带视频业务;
———多媒体邮件;
———分组网络的多媒体业务(MSPN,multimediaservicesonpacketnetworks);
———实时通信业务(视频会议、可视电话等);
———远程视频监控。
0.3 档次和级别
本部分能支持多种比特率、分辨率和质量的视频压缩。考虑到应用本部分时的互操作性,定义档次
和级别:
———档次是本部分规定的语法、语义及算法的子集;
———级别是在某一档次下对语法元素和语法元素参数值的限定集合。
0.4 技术概述
本部分采用了一系列技术来达到高效率的视频编码,包括帧内预测、帧间预测、变换、量化和熵编码
等。帧间预测使用基于块的运动矢量来消除图像间的冗余;帧内预测使用空间预测模式来消除图像内
的冗余。再通过对预测残差进行变换和量化消除图像内的视觉冗余。最后,运动矢量、预测模式、量化
参数和变换系数用熵编码进行压缩。
0.4.1 预测技术
帧内预测不需要参考其他图像,采用帧内预测编码的图像可作为编码后序列的随机访问点。
帧间预测需要参考先前已解码的图像,解码的顺序可与编码器中源图像捕获处理的顺序或从解码
器输出用于显示的顺序不同。帧间预测中运动矢量的精度能达到1/4或1/8像素,运动矢量采用预测
编码。
ⅢGB/T20090.2—2013
0.4.2 图像分块
本部分中视频解码过程的基本处理单元是宏块。一个宏块包括一个16×16的亮度样值块和对应
的色度样值块。宏块可进一步划分到最小8×8或4×4的样本块来进行预测。
0.4.3 变换和量化
变换的单元是8×8或4×4的样本块。变换系数进行标量量化。
0.5 如何阅读本部分
建议读者从第1章(范围)开始,然后转到第2章(术语和定义)。第5章描述了位流语法、解析过程
和解码过程。第6章定义了编码位流结构。第7章(语法和语义)定义了位流的语法和语义:7.1是语法
描述,定义了位流中语法元素出现顺序;7.2是语义描述,也即语法元素的范围、限制和条件。第8章定
义了语法元素的解析过程。最后,第9章(解码过程)定义了语法元素如何映射到解码样值。在阅读本
部分的过程中,读者还需阅读第2章(术语和定义)、第3章(缩略语)、第4章(运算符和数学函数)及
附录。
0.6 相关专利情况说明
本部分的发布机构提请注意,声明符合本部分时,可能涉及到8.2、9.2、9.3、9.4.2、9.4.5、9.4.6.2、
9.4.9、9.5.1、9.5.2、9.7、9.8、9.10.2、9.10.2.2、9.12和附录A相关的专利的使用。
本部分的发布机构对于该专利的真实性、有效性和范围无任何立场。
该专利持有人已向本部分的发布机构保证,他愿意同任何申请人在合理且无歧视的条款和条件下,
就专利授权许可进行谈判。该专利持有人的声明已在本部分的发布机构备案。
在本部分起草过程中,起草组织者数字音视频编解码技术标准工作组根据会员签署同意的工作组
章程和有关知识产权规定以及会员在提案、审阅等期间提出的专利披露与许可声明等对
GB-T 20090.2-2013 信息技术 先进音视频编码 第2部分 视频
文档预览
中文文档
175 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共175页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2025-07-12 23:15:06上传分享