2022年7月13日 星期三

HEVC學習筆記

高效率視訊編碼(High Efficiency Video Coding,簡稱HEVC),又稱為H.265和MPEG-H第2部分,是一種視訊壓縮標準。

HEVC码流是由一系列NAL unit(NALU)组成,每个NAL包含整数字节的数据,头两个字节为NAL unit Header(1 byte in H.264),剩余的为负载数据(原始字节序列负荷RBSP)。不同的NAL单元分为VCL NAL和non VCL NAL单元,前者携带编码过的图像数据,后者包含多帧共享的控制参数信息。

解析度=1920 x 1080
顏色取樣深度=24bit(R、G、B各色8bit)
每秒幀數=60幀
每秒需要的流量是
1920 x 1080 x 24bit x 60 = 2985984000bit -> 2985984000bit/8bit/1024/1024 = 355.957MB



NALU 单元组成解析:

[Start Code]:用於標示这是一个NALU 单元的开始(也称分隔符),必须是”00 00 00 01” 或”00 00 01”。

[NALU Header]:。

[NALU Payload]:代表着對應 NALU Header 中 NALU type 的資料。


NAL unit header format (2 bytes)

    • F( 1 bit):forbidden_zero_bit,在 H.265 规范中规定了这一位必须为 0。它的作用是在尚存 MPEG-2 系统环境中,防止产生可以解释为 MPEG-2 起始码的比特模式。
    • Type( 6 bits):,必须为49,表示是FU报文
    • LayerId( 6 bits):編碼層級信息,用于 H265 拓展层标识符。
    • TID( 3 bits):時間分級信息,表示 H265 的接入单元(AU)属于哪个时域子层,时域标识符值为 0 到 6。



H265 码流打包

RFC 7798 Section 4.4 指定了四种不同类型的 RTP 数据包有效负载结构:

    • 单 NAL 单元模式(Single NAL Unit Packet): 仅包含单个 NAL Unit 的有效载荷。
    • 组合封包模式(Aggregation Packet):用于聚合多个 NAL Unit 的分组类型成为单个 RTP 有效负载。
    • 分片封包模式(Fragmentation Unit):用于将单个 NAL Unit 分段成多个 RTP 数据包。
    • 携带 RTP 数据包的 PACI:包含有效载荷报头(与其他有效载荷报头有所不同),有效载荷报头扩展结构(PHES)和 PACI 有效载荷。

其中常用的有两种类型:单 NAL 单元模式和分片封包模式。


Single NAL Unit Packet

一个 RTP 包仅由一个完整的 NALU 组成。这种情况下 RTP 的 NAL 头类型字段 PayloadHdr 和原始的 H.265 的 NALU Header 字段是一样的。

对于 NALU 的长度小于 MTU 大小的包,一般采用单一 NAL 单元模式,打包时去除H.265的 [Start Code] ,把其他数据封包为 RTP 包即可。


Aggregated packet(AP)

当编码一帧有多个NALU数据的时候(比如一个IDR帧,还会携带SPS、PPS、VPS、SEI等NALU数据),可以把这多个NALU数据都打包在一个RTP报文里面。但是需要控制打包报文总长度小于1500字节,否则会引起IP分片。其NAL type为48。


Fragmentation Unit

分片封包模式(FU)能将单个 NAL 单元分段成多个 RTP 数据包。

NAL 单元的片段由该 NAL 单元的整数个连续 8 bytes 组成。 分片封包的 NAL 单元必须以升序的 RTP 序列号连续顺序发送(同一 RTP 流中的其他 RTP 数据包不得在第一个片段与最后一个片段之间发送)。

携带 FU 的 RTP 分组的 RTP 时间戳被设置为分段 NAL 单元的 NALU 时间。

FU 由一个有效负载报头(PayloadHdr),一个 8 bit 的 FU Header,一个有条件的 16 bit DONL 字段和 FU 有效负载组成。


FU(Fragmentation Units) header format (1 byte)

S( 1 bit):1表示是首个分片报文;0表示非首个分片报文。

E( 1 bit):1表示最后一个分片报文;0表示非最后一个分片报文。

FuType( 6 bits):该分片报文对应的NALU type。

FU的NAL类型为49


IDR(Instantaneous Decoding Refresh)–即时解码刷新。

I帧:帧内编码帧是一种自带全部信息的独立帧,无需参考其它图像便可独立进行解码,视频序列中的第一个帧始终都是I帧。 


REF

https://blog.csdn.net/wonder_coole/article/details/96753844

沒有留言:

張貼留言