龙空技术网

新一代视频压缩标准VVC的技术创新解析

懒懒散散的程序员 26

前言:

而今大家对“视频压缩标准主要采用什么系列标准”大体比较注重,兄弟们都需要分析一些“视频压缩标准主要采用什么系列标准”的相关文章。那么小编同时在网上收集了一些关于“视频压缩标准主要采用什么系列标准””的相关内容,希望同学们能喜欢,姐妹们一起来了解一下吧!

在不断发展的视频压缩世界中,MPEG 在 2020 年宣布了几种新的编解码器,例如 VVC(通用视频编码)、EVC(基本视频编码)和LCEVC(低复杂度增强视频编码)。这些编解码器具有不同的要求并满足不同的用例,例如高效压缩 4K、8K 或免版税(基线 EVC)。

在这篇架构概述文章中,我们将了解 MPEG 的多功能视频编码或 VVC 编解码器,并了解其要求、时间线以及使其成为值得关注的视频编解码器的一些创新功能!

VVC 的历史、要求和时间表

2015 年 10 月,MPEG和 VCEG 成立了联合视频探索小组 (JVET),其任务是评估可用的压缩技术并探索对下一代视频压缩标准的要求。VVC的标准化始于2018年。

新标准的主要要求如下:

在相同的体验质量下,为算法提供比现有 HEVC 标准更好 30% 到 50% 的压缩,并支持无损和主观无损压缩支持 4K 到 16K 分辨率以及 VR 360° 视频支持具有 4:4:4、4:2:2 和 4:2:0 量化的 YCbCr 色彩空间每个组件颜色深度为 8 位到 16 位BT.2100 和 16+ 步高动态范围 (HDR)辅助通道,如深度通道、阿尔法通道等。从 0 到 120 Hz 的可变和部分帧率具有时间(帧速率变化)和空间(分辨率变化)可伸缩性的可伸缩编码SNR、立体/多视图编码、全景格式和静止图像编码。

与 HEVC 相比,预计编码复杂度增加十倍,解码复杂度增加两倍。

VVC 压缩标准也称为 H.266、ISO/IEC 23090-3、MPEG-I 第 3 部分和未来视频编码 (FVC),已于 2020 年 7 月 6 日最终确定。

本文讨论已成为 VVC 标准一部分的最有趣的视频编码技术。

让我们从下一节中的 VVC 的编码结构开始。

VVC的编码结构

在 VVC 中,与 HEVC 相比,CTU(编码树单元)大小从 64х64 增加到 128х128 像素。瓦片、切片和子图片现在在比特流中逻辑分离。每个视频帧被分成规则的块网格。VVC 实现可以将多个块组合成定义为图块、切片和子图片的逻辑区域。

这些方法在早期的编解码器中已经为人所知,但 VVC 采用了一种新方法来组合它们。这些区域的主要特点是它们在比特流中在逻辑上是分开的,并提供不同的选项,例如——

编码器和解码器可以实现并发处理。解码器可以选择只解码它需要的视频区域(一种可能的应用是传输全景视频,用户只能看到完整视频的一部分)可以对比特流进行编码以动态提取视频流的一部分,而无需重新编码。VVC 中的块拆分

在 HEVC 中,有一个单一的树结构,允许将每个方形块递归地拆分为 4 个方形子块。但是,VVC 现在在多树结构中提供了几种可能的拆分操作。

第一个分裂是四叉树,就像在 HEVC 中一样。然后可以将每个块水平和垂直拆分为 2 个(BT 拆分)或 3 个(TT 拆分)部分。

再次递归执行此步骤,以便每个矩形块可以进一步水平或垂直拆分为 2 或 3 个部分。这种方法使编码器能够更好地适应输入并显着增加视频编码的复杂性。

此外,亮度(亮度编码)和色度(色度编码)块可以不同,形成双树结构。换言之,色度样本可以具有独立于同一 CTU 内的亮度样本的编码树结构。这使得可以对色度样本使用比亮度样本更大的编码块。

VVC中的空间块预测

我们首先查看 VVC 中的空间预测(帧内)选项,然后继续进行帧间预测。

对于帧内预测,​现有的平面、DC、PCM 和角度预测模式仍然可用。角度预测的方向数量已从 33(在 HEVC 中)增加到 65。

广角帧内预测

由于预测块在 VVC 中可能是非方形的,因此传统模式被广角方向(Wide Angle Intra Prediction)自适应地替代。因此,VVC 实现可以使用更多的参考像素进行预测。本质上,这将预测方向角扩大到超过正常 45° 和 –135° 的值。

位置相关预测组合

添加了新的 Position-dependent预测组合 模式,可以进行方向插值。它将空间(帧内)预测与一些主要和参考样本的位置相关加权相结合。

跨组件预测

此外,在许多情况下,亮度和色度分量携带非常相似的信息,因此 为这些情况添加了称为交叉分量预测的新预测模式 。在该模式中,使用一种方法,该方法使用具有两个参数(因子和偏移)的重构像素的线性组合直接从重构亮度块预测色度分量,其中因子是根据帧内参考像素计算的。如有必要,也会对块进行缩放。

href=";>相关: 什么是广告填充率以及它是如何计算的?

多参考线预测

现在可以在 VVC 中使用与当前块不直接相邻的两条线进行预测;这称为 多参考线预测

帧间预测

从一个或两个参考图片进行单向和双向运动补偿的基本概念大多没有变化。但是,有一些新工具以前没有在视频编码标准中使用过。

VVC中的仿射运动估计模型

传统的运动补偿代表二维平面运动。然而,这种运动在实际视频中很少遇到,因为物体移动得更自由和/或改变它们的形状。对于这些情况, 仿射运动 模型是在 VVC 中实现的,它使用两个或三个向量来实现具有四个或六个自由度的运动。

最大亮度运动矢量精度从像素的1/4增加到1/16,对应的色度运动矢量精度从像素的1/16增加到1/32。

您现在可以使用 自适应运动矢量分辨率 进行编码。这有助于降低大 MV 值的编码成本,这与高分辨率(4K 及更高)尤其相关。

VVC 中的重叠块运动补偿和 BDOF

现在可以使用一种补偿重叠块运动的方法。这种称为 重叠块运动补偿的方法将相邻块的边缘重叠,然后平滑它们以避免通常在帧间预测中出现的急剧过渡。

如果块使用双向预测,则可以使用新的BDOF(双向光流)方法来细化预测块的运动。该算法不需要解码器信令并提供 2% 到 6% 的比特率节省。

解码器端运动矢量细化

解码器侧运动矢量细化 使得可以在不传输额外运动数据的情况下在解码器中细化运动矢量。这个过程包括三个阶段。首先进行双向预测,将数据加权成初步预测块。然后以固定数量的位置围绕原始块的位置执行搜索。如果找到更好的位置,则相应地更新原始运动矢量。最后,使用更新后的运动向量执行新的双向预测以获得最终预测。

几何分区

矩形块通常不能很好地预测真实视频。为了更有效的预测, VVC 中添加了几何分区。此选项允许将块非水平拆分为两个部分,每个部分都有单独的运动补偿。当前的实现包括 82 种不同的几何分区模式。

变换和量化

VVC 中的最大变换块大小已增加到 64×64。当涉及到高清和超高清内容时,这些转换特别有用。

与只有一个 DCT (DCT-II) 变换的 HEVC 不同,VVC 有 4 个可分离的变换:

DCT (DCT-VIII) – VIII 型离散余弦变换DST-VII – 离散正弦变换。

编码器可以根据预测模式选择不同的变换。

自适应环路滤波器

VVC标准中的自适应环路滤波器具有以下特点:

7×7 菱形滤波器(13 种不同系数)用于亮度分量,5х5 菱形滤波器(7 种不同系数)用于色度分量使用垂直、水平和两个对角线渐变将每个 4х4 亮度块分类为 25 个不同类别之一根据计算出的梯度,滤波器系数在应用之前可以经历三种变换之一——对角反射、垂直反射或旋转。HEVC 与 VVC 性能评估

下图显示了使用 HEVC HM 16.15 和 VVC VTM-12.0 参考编码器对两个测试序列进行编码的结果。在这两种情况下,编码都是使用标准配置文件 (randomaccess.cfg) 和同样优化的编码器执行的。

从图表(图 1 和图 2)中可以看出,VVC 的编码效率在所有比特率下都超过了之前的标准。考虑 BQMall 图(图 1)及其中间部分获得的值。

对于 HEVC 序列,我们获得了 1002 kbps 的比特率和 38.58 dB 的 APSNR。为了使用 VVC 编码实现类似的质量,696 kbps 的比特率就足够了(APSNR 为 38.50 dB),从而节省了 30% 的比特率。

HEVC 编码器的编码时间约为 16 分钟,而 VVC 的编码时间为 2.29 小时,是 9.3 倍。

结论

我们来到这个 VVC(多功能视频编码)的架构概述。我希望您对这个新的和即将推出的视频编码标准有更好的了解,了解它的特性,并了解 VVC 和 HEVC 之间的性能差异。

标签: #视频压缩标准主要采用什么系列标准 #视频压缩标准主要采用什么系列标准的