现代视频编码标准:H.265与H.266技术解析

立即解锁
发布时间: 2025-09-02 00:19:37 阅读量: 11 订阅数: 46 AIGC
PDF

多媒体技术核心解析

### 现代视频编码标准:H.265与H.266技术解析 #### 1. H.265编码标准 H.265作为重要的视频编码标准,在多个方面进行了优化和改进。 ##### 1.1 帧内编码中DCT与DST的组合 在H.265的帧内编码里,根据不同的帧内预测类别和相邻样本的使用情况,对垂直和水平方向采用不同的变换方式,具体如下表所示: | 帧内预测类别 | 相邻样本使用情况 | 垂直(列)变换 | 水平(行)变换 | | --- | --- | --- | --- | | 类别1 | 仅使用左侧样本 | DCT | DST | | 类别1 | 仅使用顶部样本 | DST | DCT | | 类别2 | 使用顶部和左侧样本 | DST | DST | | DC | 特殊(固定集合) | DCT | DCT | ##### 1.2 环路滤波 H.265的环路滤波过程和H.264类似,目的是消除块状和其他伪像。它包含去块滤波和样本自适应偏移(SAO)两个部分。 - **去块滤波**:与H.264对4×4块进行去块滤波不同,H.265仅对8×8图像网格上的边缘应用去块滤波。这一改变降低了计算复杂度,尤其适合并行处理,因为相邻样本级联变化的可能性大大降低。去块滤波先处理图像中的垂直边缘,再处理水平边缘,也可以按CTB逐个处理。 - **样本自适应偏移(SAO)**:SAO过程可在去块滤波后选择性调用。它基于特定条件为每个样本添加偏移值,有带偏移模式和边缘偏移模式两种。 - **带偏移模式**:将样本幅度范围划分为32个带,可同时为连续的四个带中的样本值添加带偏移,有助于减少平滑区域的“带状伪像”。 - **边缘偏移模式**:先分析梯度(边缘)信息,图像有水平、垂直和两种对角线共四种可能的梯度(边缘)方向。根据样本p与相邻样本n0、n1的关系,为样本p添加正偏移、负偏移或零偏移: - 正偏移:p是局部最小值(p < n0 & p < n1),或者p是边缘像素(p < n0 & p = n1 或 p = n0 & p < n1)。 - 负偏移:p是局部最大值(p > n0 & p > n1),或者p是边缘像素(p > n0 & p = n1 或 p = n0 & p > n1)。 - 零偏移:不满足上述条件。 ##### 1.3 熵编码 H.265在熵编码中仅使用CABAC,不再使用CAVLC。由于引入了新的编码树和变换树结构,树深度成为上下文建模的重要部分,同时结合H.264/AVC中的空间相邻上下文,减少了上下文数量,进一步提高了熵编码效率。 读取变换系数时定义了三种简单扫描方法:斜右上、水平和垂直,目的是最大化零游程长度。扫描始终在4×4子块中进行,与TB大小无关。具体扫描方法的使用规则如下: - 斜右上扫描:用于所有帧间预测块以及16×16或32×32的帧内预测块。 - 水平扫描:用于预测方向接近垂直的4×4或8×8帧内预测块。 - 垂直扫描:用于预测方向接近水平的4×4或8×8帧内预测块。 - 斜右上扫描:用于其他预测方向的4×4或8×8帧内预测块。 ##### 1.4 特殊编码模式 H.265定义了三种特殊编码模式,可在CU或TU级别应用: - **I_PCM**:和H.264一样,绕过预测、变换编码、量化和熵编码步骤,直接发送PCM编码(固定长度)的样本。当其他预测模式无法实现数据缩减时会调用该模式。 - **无损编码**:将帧间或帧内预测的残差误差直接进行熵编码,避免任何有损步骤,特别是变换编码后的量化。 - **变换跳过**:仅绕过变换步骤,适用于某些特定数据(如计算机生成的图像或图形),且只能应用于4×4的TB。 ##### 1.5 H.265的配置文件 HEVC版本1仅定义了三种配置文件:主配置文件、主10配置文件和主静态图片配置文件。版本2新增了21种配置文件,如Main 12、Main 4:2:2 10等。默认颜色格式为YCbCr。 以主配置文件为例,它支持多种不同分辨率和帧率的视频格式,涵盖从低分辨率到高分辨率的视频,不同级别对应的最大亮度图片尺寸、帧率和最大比特率如下表所示: | 级别 | 最大亮度图片宽度×高度 | 最大亮度图片尺寸(样本) | 帧率(fps) | 主层级最大比特率(Mb/s) | | --- | --- | --- | --- | --- | | 1 | 176 × 144 | 36,864 | 15 | 0.128 | | 2 | 352 × 288 | 122,880 | 30 | 1.5 | | 2.1 | 640 × 360 | 245,760 | 30 | 3.0 | | 3 | 960 × 540 | 552,960 | 30 | 6.0 | | 3.1 | 1280 × 720 | 983,040 | 30 | 10 | | 4 / 4.1 | 2048 × 1080 | 2,228,224 | 30 / 60 | 12 / 20 | | 5 / 5.1 / 5.2 | 4096 × 2160 | 8,912,896 | 30 / 60 / 120 | 25 / 40 / 60 | | 6 / 6.1 / 6.2 | 8192 × 4320 | 35,651,584 | 30 / 60 / 120 | 60 / 120 / 240 | 与H.264相比,H.265在编码效率上有显著提升。在相同PSNR下,不同视频压缩方法的平均比特率减少情况如下表所示: | 视频压缩方法 | H.264/MPEG - 4 AVC HP | MPEG - 4 ASP | MPEG - 2/H.262 MP | | --- | --- | --- | --- | | H.265 MP | 35.4% | 63.7% | 70.8% | | H.264/MPEG - 4 AVC HP | - | 44.5% | 55.4% | | MPEG - 4 ASP | - | - | 19.7% | 主观上比较H.264和H.265的编码效率时,采用双刺激方法。结果显示,与H.264/MPEG - 4 AVC HP相比,在大致相同的主观质量下,9个娱乐应用测试视频中,H.265 MP的平均比特率减少范围为29.8% - 66.6%,平均为49.3%,接近50%的原始目标。 ##### 1.6 H.265的扩展 由于视频技术的新发展和应用范围的扩大,H.265进行了一系列扩展: - **范围扩展(RExt)**:HEVC版本1主要针对每样本8或10位的4:2:0色度子采样应用设计,无法满足新应用需求。RExt的主要目标是支持4:2:2和4:4:4色度格式以及每样本超过10位(如12或16位)的位深度,同时支持扩展功能和提高编码效率,例如屏幕内容编码、直接编码R’G’B’源材料以及辅助图片编码等。其实现主要通过增强编码算法和工具,很多情况下也需要处理元素有更高的动态范围。 - **可伸缩性扩展(SHVC)**:可伸缩高效视频编码(SHVC)标准在HEVC版本2中确定。除了HEVC版本1已支持的时间可伸缩性,SHVC还支持空间可伸缩性、信噪比(SNR)可伸缩性、位深度可伸缩性和色域可伸缩性,适用于采用更高位深度和更宽色域的UHD视频,并且支持这些可伸缩性的任意组合。 SHVC采用多环编码框架,参考层必须先完全解码才能用作预测参考。如果有两个以上的空间或SNR层,中间的增强层也可作为参考层。它使用多个重新利用的单层HEVC编解码器核心,并添加层间参考图片处理模块,目标是采用一种可伸缩编码架构,仅对底层单层HEVC标准进行高层语法(HLS - only)更改。 - **多视图和3D视频扩展**:多视图扩展(MV - HEVC)可实现多个摄像机视图和相关辅助图片的高效编码,通过复用单层解码器实现,无需更改块级处理模块,在运动补偿预测中使用视图间参考以实现比特率节省。 3D扩展(3D - HEVC)针对包含多个视图和相关深度图的视频设计,支持在高级3D显示器中生成额外的中间视图。为实现与MV - HEV
corwn 最低0.47元/天 解锁专栏
买1年送3月
继续阅读 点击查看下一篇
profit 400次 会员资源下载次数
profit 300万+ 优质博客文章
profit 1000万+ 优质下载资源
profit 1000万+ 优质文库回答
复制全文

相关推荐

SW_孙维

开发技术专家
知名科技公司工程师,开发技术领域拥有丰富的工作经验和专业知识。曾负责设计和开发多个复杂的软件系统,涉及到大规模数据处理、分布式系统和高性能计算等方面。
最低0.47元/天 解锁专栏
买1年送3月
百万级 高质量VIP文章无限畅学
千万级 优质资源任意下载
千万级 优质文库回答免费看
立即解锁

专栏目录

最新推荐

RPM包构建、测试与文件共享全解析

# RPM 包构建、测试与文件共享全解析 ## 1. RPM 包构建基础 ### 1.1 各部分功能概述 RPM 包构建涉及多个部分,每个部分都有其特定功能: - **%description**:用于描述 RPM 包,可长可短,示例如下: ```plaintext %description A collection of utility scripts for testing RPM creation. ``` - **%prep**:构建过程中首个执行的脚本,用于准备构建目录,将所需文件复制到相应位置。示例脚本如下: ```plaintext %prep ################

Ubuntu使用指南:IRC与命令行游戏及进程管理

### Ubuntu使用指南:IRC与命令行游戏及进程管理 #### 1. IRC客户端介绍 IRC客户端在屏幕顶部的实时窗口中显示服务器消息,底部是输入区域,可编辑命令和消息,按回车键发送。命令以斜杠(/)开头,客户端未使用的命令会发送到服务器处理,不以斜杠开头的行则会发送到活跃的IRC频道供他人阅读。 #### 2. 连接IRC服务器 - **启动irssi客户端**:使用`irssi`命令启动irssi IRC客户端。首次运行时,会提示访问`www.irssi.org/`的“Documentation”部分查找“startup-HOWTO”文件,该文件为熟悉其他IRC客户端的用户提供

工业绘图系统落地实践:Delphi矢量控件在真实项目中的应用

![矢量绘图控件](https://iptc.org/wp-content/uploads/2014/12/diagram-photo-metadata.png) # 摘要 本文围绕工业绘图系统的设计与实现,重点探讨了基于Delphi平台的矢量图形开发技术。首先介绍了Delphi开发环境及其对矢量图形的支持机制,分析了矢量图形与位图的区别及常用控件库的集成方式。随后,系统阐述了工业绘图系统的核心功能设计,包括图形建模、交互操作、编辑与导出功能,并结合实际案例说明了Delphi矢量控件在工业控制面板和自动化产线可视化系统中的应用。文章进一步探讨了系统部署优化、跨平台适配及与PLC、SCAD

优化与管理Zabbix服务器及数据库的实用指南

### 优化与管理Zabbix服务器及数据库的实用指南 #### 1. 优化Zabbix服务器性能 在使用Zabbix服务器时,有几个关键方面可以进行性能优化。 ##### 1.1 Zabbix进程调整 Zabbix进程是服务器设置的重要部分,需要谨慎编辑。在小型安装中,我们可以编辑发现器进程。例如,在添加新发现器进程之前,可能会看到一个LLDProcessor子进程一次只能处理一个规则,导致其他规则排队。添加新的发现器进程可以在一定程度上平衡负载,但要注意: - 并非所有问题都能通过增加资源解决。有些Zabbix设置配置不佳,会使进程不必要地忙碌。解决配置问题可以减轻负载,减少所需进程数

Linux文件系统全解析:从基础概念到实践操作

### Linux 文件系统全解析:从基础概念到实践操作 #### 1. 存储硬件与基础概念 在数据存储领域,有几个持久数据存储硬件相关的术语需要明确: - **存储**:任何用于长期、非易失性数据存储的硬件设备。即数据在重启后依然保留,断电时也不会丢失。 - **硬盘驱动器(HDD)**:使用旋转磁盘进行持久数据存储的设备。 - **固态硬盘(SSD)**:使用闪存形式进行持久数据存储的设备。 #### 2. 文件系统功能 文件系统具有多种重要功能: - **数据存储**:提供结构化的空间来存储和检索数据,这是文件系统的主要功能。 - **命名空间**:一种命名和组织方法,规定了文件命名

利用Ansible构建和管理Docker容器

### 利用Ansible构建和管理Docker容器 在现代的应用程序部署和管理中,Docker和Ansible是两个非常强大的工具。Docker可以帮助我们创建、部署和运行应用程序的容器,而Ansible则可以自动化这些容器的构建和管理过程。本文将详细介绍如何使用Ansible来构建和管理Docker容器,包括Flask应用、MySQL容器以及Hubot Slack机器人容器。 #### 1. 部署Flask应用和MySQL容器 首先,我们将通过Ansible来部署一个Flask应用和一个MySQL容器。 ##### 1.1 复制Flask应用和模板 使用Ansible的`copy`模

利用Terraform完善AWS基础设施

### 利用 Terraform 完善 AWS 基础设施 #### 1. 基于 SRE 原则构建 SLAs/SLIs/SLOs 借助 Terraform 大规模部署和管理基础设施的能力,团队能够确保其基础设施始终满足性能要求,提供高度的可靠性和可用性。Terraform 还可用于自动化更新部署和基础设施变更流程,持续提升性能并优化资源利用率。 要有效地使用 Terraform 来执行服务级别协议(SLAs)、服务级别指标(SLIs)和服务级别目标(SLOs),需要深入了解底层基础设施以及所部署应用程序或服务的特定要求。这要求开发、运维和管理团队密切协作,确保基础设施与业务目标保持一致。

Python情感识别原型开发:从零搭建完整系统的10个核心步骤

![Python情感识别原型开发:从零搭建完整系统的10个核心步骤](https://assets-global.website-files.com/5fdc17d51dc102ed1cf87c05/619ea6dbcc847f24b7f0bc95_sentiment-analysis.png) # 摘要 情感识别系统在自然语言处理领域具有广泛的应用价值,涵盖舆情分析、智能客服和用户体验优化等多个方向。本文系统介绍了情感识别的基本理论,涵盖自然语言处理基础、情感分析方法及评估指标,并详细阐述了基于Python的情感识别系统开发流程。文章重点描述了系统开发环境的搭建、核心功能的实现过程,以

从拆解看设计:ThinkPad TW可维护性评分+工业设计深度解析(仅限内部视角)

![从拆解看设计:ThinkPad TW可维护性评分+工业设计深度解析(仅限内部视角)](https://i.pcmag.com/imagery/articles/01LYq0o6iXGVntjM1nX9RYe-15.fit_lim.size_1050x.jpg) # 摘要 本文围绕ThinkPad TW的工业设计与可维护性理念展开系统研究,通过对硬件拆解流程、模块化设计结构及可维护性评分标准的深入分析,评估其在维修便利性、升级扩展性及维修成本控制方面的表现。同时,文章探讨了其在设计语言、结构强度、散热系统与用户可维护性之间的平衡逻辑,揭示了工业设计背后的工程实现与用户需求之间的融合与冲

RoCEv2在FPGA部署核心难题:拥塞控制与数据一致性的破解之道

![基于赛灵思的FPGA 支持 10-100Gbit/s 的 TCP/IP、RoCEv2、UDP/IP 的可扩展网络堆栈](https://media.fs.com/images/community/erp/is7hz_n586048schKCAz.jpg) # 摘要 本文围绕RoCEv2协议与FPGA技术的融合展开系统研究,深入解析RoCEv2协议的核心机制,包括其架构特性、拥塞控制策略及数据一致性保障方法。同时,针对在FPGA平台上部署RoCEv2所面临的关键挑战,如硬件资源适配、实时拥塞控制实现以及多节点数据一致性维护等问题,本文提出了优化的解决方案与硬件实现架构。通过设计基于FP