X265墒编码--代码分析

news2026/3/28 6:47:49
x265 墒编码X265 HEVC编码器架构分析一 整体代码架构1.1 目录与模块划分source/├── x265cli.cpp / x265cli.h # 命令行入口、参数解析、help├── x265.h # 对外 API、参数结构、版本├── encoder/ # 编码核心│ ├── encoder.cpp/h # 编码器顶层创建/销毁、encode() 主流程、VPS/SPS/PPS│ ├── api.cpp # x265_encoder_encode() 等对外接口│ ├── frameencoder.cpp/h # 单帧编码compressFrame、WPP 行调度、processRow│ ├── slicetype.cpp/h # Lookaheadslice 类型决策、低分辨率估计、cost│ ├── search.cpp/h # 运动估计、模式搜索ME、PME、merge 等│ ├── analysis.cpp/h # CU 划分与模式决策Analysis::compressCTU 等│ ├── motion.cpp/h # 运动估计数据结构与接口│ ├── entropy.cpp/h # CABAC 熵编码│ ├── framefilter.cpp/h # 去块、SAO│ ├── ratecontrol.cpp/h # 码率控制QP、VBV、ABR 等│ ├── dpb.cpp/h # 解码图像缓冲区DPB│ ├── nal.cpp/h, sei.cpp, level.cpp, reference.cpp, bitcost.cpp, sao.cpp├── common/ # 通用数据结构与算法│ ├── frame.cpp/h, framedata.cpp/h, slice, picyuv, cudata # 帧/片/CU 数据│ ├── quant.cpp/h, dct.cpp # 变换量化│ ├── param.cpp, primitives.cpp, bitstream, predict, deblock, loopfilter, intrapred│ ├── threadpool.cpp/h # 线程池、JobProvider、BondedTaskGroup│ ├── wavefront.cpp/h # WPP 波前调度行依赖、enqueue/enable│ ├── threading.cpp/h # Thread、Event、Lock 等封装├── input/, output/ # YUV/Y4M 等 IO├── dynamicHDR10/ # HDR10 等└── test/, profile/ # 测试与性能分析1.2 数据与编码流水线概览- 输入x265_picture, 拷贝到Frame PicYuv 送入Lookahead- Lookahead低分辨率初始化AQ帧代价估计slice类型与POC决策输出已决策帧- 编码器从Lookahead 取getDecidedPicture 交给某个FrameEncoder 做单帧压缩- 单帧压缩码率控制-slice 墒初始化CTU行波前或串行处理分析 变换量化 墒编码 去块/SAO- 输出 编码后的帧通过 getEncodePicture() 回到Encoder::encode() 写入DPB输出NAL比特流。二 线程架构2.1 线程角色概览- API 主线程1 调用encode() 送输入取lookahead决策帧分配FrameEncoder, 取编码结果并输出- Frame Encoder线程frameNumThreads 每个对应一个FrameEncoder运行threadMain 等- 线程池Worker 每池N个执行JobProvider::findJob() 为Lookahead或FrameEncoder- Lookahead 专用池可选lookaheadThreads 0 时单独建池只做lookahead 不与帧编码共享2.2 线程间协作关系API线程输入pic_in, 封装为Frame m_lookahead-addPicture()当lookahead填满后frameEnc m_lookahead-getDecidedPicture()再选一个curEncoder, curEncoder取出 curEncoder-getEncodedPicture(m_nallist) 内部会等该帧的m_done- Frame Encoder线程循环m_enable.wait() -comporessFrame() -m_done.trigger()再compressFrame() 里码率控制 slice/墒初始化若 ** 开WPP **则对每行解外部依赖后enableRow, 对row0, enqueueRow, tryWakeOne() 然后本线程 阻塞在m_completionEvent 直到所有行被处理完。- 未开 WPP同一线程串行执行processRowEncoder(i, m_tld[...]) 不用池- 线程池 Worker从当前或优先的JobProvider调用 findJob(workerId)JobProvider 可以是Lookahead 低分辨率初始化AQ帧代价估计等PreLookaheadGroup,CostEstimateGroup 等通过BondedTaskGroup 拉多线程FrameEncoder 继承WaveFront, JobProvider findJob 即波前调度取可用的最小row, 执行processRow(row, threadid) 分析 编码 滤波该行Lookahead专用池当lookaheadThreads 0时会单独allocThreadPools(..., 1) 建一组池只挂Lookahead为JobProvider, 不与帧编码的池共享避免lookahead与帧编码抢同一批worker。2.3 参数对线程的影响frame-threads (frameNumThreads) 并发编码的帧数也是FrameEncoder 及各自线程的个数每帧由一个FrameEncoder负责- pools numaPools:按NUMA节点划分的线程池每个池若干Worker FrameEncoder 轮流绑定到不同池i % m_numPools- wpp 开启后帧内按CTU行波前并行行由线程池Worker 执行processRow 关闭则仅仅由该帧对应的FrameEncoder线程串行processRowEncoder()-pmode/pme 在帧内用BondedTaskGroup把模式分析运动估计等子任务分给池内worker-lookahead-threads 专用lookahead 池的worker数量0表示lookahead与帧编码共用同一批池三 线程架构图(Mermaid)下面用 Mermaid 画出「线程类型 数据/控制流」的架构图便于在支持 Mermaid 的查看器中渲染如 GitHub、VS Code 插件等。mermaidflowchart TBsubgraph API[API / 主线程]A1[encode(pic_in, pic_out)]A2[Frame → Lookahead.addPicture()]A3[frameEnc Lookahead.getDecidedPicture()]A4[curEncoder.startCompressFrame(frameEnc)]A5[curEncoder.getEncodedPicture(nalList)]A1 -- A2A2 -- A3A3 -- A4A4 -- A5A5 -- A1endsubgraph FE[Frame Encoder 线程 (× frameNumThreads)]F1[threadMain(): m_enable.wait()]F2[compressFrame()]F3[slice/熵初始化、enableRow / enqueueRow]F4[WPP: m_completionEvent.wait()]F5[m_done.trigger()]F1 -- F2F2 -- F3F3 -- F4F4 -- F5F5 -- F1endsubgraph Pool[线程池 Worker (每池 N 个)]W1[findJob(workerId)]W2A[Lookahead: 低分辨率/AQ/Cost 估计]W2B[FrameEncoder: processRow(row)]W1 -- W2AW1 -- W2Bendsubgraph LA[Lookahead (逻辑)]L1[addPicture / 决策队列]L2[getDecidedPicture()]endAPI --|addPicture| LAAPI --|getDecidedPicture| LAAPI --|startCompressFrame → m_enable.trigger()| FEAPI --|getEncodedPicture → 等 m_done| FEFE --|enqueueRow / tryWakeOne()| PoolFE --|JobProvider this| PoolLA --|JobProvider Lookahead| PoolPool --|processRow() 完成行| FE简化版线程与角色关系Mermaidflowchart LRsubgraph Main[主线程]API[API encode]endsubgraph FrameThreads[帧编码线程]FE0[FrameEnc 0]FE1[FrameEnc 1]FEN[FrameEnc N-1]endsubgraph Pools[线程池]WP[Worker 0..M]endsubgraph LookaheadPool[Lookahead 专用池 (可选)]LW[Lookahead Workers]endAPI --|输入帧| LookaheadLookahead --|已决策帧| APIAPI --|分配帧| FrameThreadsFrameThreads --|WPP: 行任务| PoolsLookahead --|低分辨率/代价| PoolsLookahead --|若 lookaheadThreads0| LookaheadPoolPools --|processRow / findJob| FrameThreadsFrameThreads --|编码结果| API四 关键类与职责类/模块 职责Encoder 顶层编码器:create/destory, encode() 主循环Lookahead /DPB/RC/FrameEncoder创建与协调FrameEncoder 单帧编码继承Thread WaveFront(JobProvider)compressFrame, 行依赖WPP调度Lookahead 缓冲输入帧低分辨率AQ帧代价slice类型决策getDecidedPicture()ThreadPool,一组WorkerThread 分配JobProvider 支持Numa亲和JobProvider findJob(workerId); lookahead与FrameEncoder均为Provider WaveFront 行级依赖位图enqueueRow/enableRow, findJob选最小row调用processRowBondedTaskGroup 临时绑定多个worker执行processTasks, 用于PMEpmode,Lookahead批量任务五 小结帧级并行 多路FrameEncoder线程每路负责一帧的完整编码流出API线程按顺序取决策并轮转分配给不同FrameEncoder帧内并行WPP, 开启后由线程池Worker 并处理不同CTU行FrameEncoder 线程只做调度与等待完成。Lookahead 并行通过线程池或专用lookahead 池做低分辨率cost估计等可与帧编码共享或独立池。协调机制Event m_enable,m_done, m_completionEvent, lock原子/依赖位图以及RateControl的跨帧顺序保证正确性与码率控制。1 文档位置source/docs/ARCHITECTURE.md包含目录与模块划分数据/编码流水线线程角色与协作参数对线程的影响关键类职责以及两段Mermaid图流程图 简化关系图source/docs/thread-architecture.mmd单独的线程架构Mermaid图便于Mermaid编辑里打开或导出为图片。2 整体架构概括入口 Encoder::encode() 输入x265_picture 输出Nal比特流流水线输入帧-〉lookahead 低分辨率AQ帧代价slice类型决策-决策进入DPB/编码队列 分配给某个FrameEncoder 做整帧压缩码率控制slice, CTU行处理墒编码去块/SAO 输出编码帧核心目录encoder/编码流程帧编码lookahead 搜索墒编码码率控制等。common/帧CU/量化/DCT线程池波前参数等。3 线程架构概括 对应架构图线程类型数量/来源作用API主线程1调用encoder() 送帧进lookahead,取getDecidedPicture(), startCompressFrame() 分配帧getEncodePicture()取结果并输出Frame Encoder线程frameNumThreads每个一个线程循环等m_enable-执行compressFrame() 码率控制初始化若开WPP则下发行任务并等待完成-触发m_done线程池Worker每池N个执行JobProvider::findJob(),要么为Lookahead做低分辨率/代价估计要么为FrameEncoder做WPP的processRow(row),编码一行CTULookahead专用池可选单独一组worker只做lookahead不与帧编码池共享关系要点多帧并行多个FrameEncoder线程每帧固定由一个FrameEncoder负责帧内并行WPP开WPP时CTU行由线程池里的worker 并行执行processRow() ,对应FrameEncoder 线程只做调度并等m_completionEventLookahead可与帧编码共用同一批线程池也可用专用池。1 墒编码在本工程里分两层层次内容典型接口/写法参数集/高层语法VPSSPS,PPS,VUI,AUD,slice header等codeVPS/codeSPS/codePPS/codeSliceHeader等多为定长Exp-Golomb(WRITE_CODE,WRITE_UVLC等继承自SyntaxElementWriter)片内数据 CTU/CU/TU 系数HEVC规定的CABACEntropy::encodeBin/encodeBinEP/encodeBinTrm ,上下文在m_contextState[]Entropy.h 里面的Entropy同时承担写真实比特流m_bitIf 指向BitStream 和RDO时估计比特(m_bitIf NULL) 只累加m_fracBits, 不真正写文件。2 单帧里墒编码在流水线的位置1 模式决策 变换量化在Analysis::compressCTU完成过程中用一个Entropy在m_bitIf NULL 下估计代价。2 最终写码流同一 rowCoder在CTU定稿后再encodeCTU已选定的CU系数按语法写入若开SAO还会在CTU前写SAO语法。帧末尾在FrameEncoder::compressFrame, 先m_entropyCoder(m_initSliceContext), 再codeSliceHeader, 把各个WPP子码流 拼进NAL也就是说先把CTU 数据编码进子流再写slice头并封装。3 CTU 级encodeCTU, encodeCU递归void Entropy::encodeCTU(const CUData ctu, const CUGeom cuGeom){bool bEncodeDQP ctu.m_slice-m_pps-bUseDQP;encodeCU(ctu, cuGeom, 0, 0, bEncodeDQP);if (!(ctu.m_bLastCol ctu.m_bLastRow))encodeBinTrm(0);}encodeCU 按CUGeom 递归进入子CU需要时写codeSplitFlag叶CU上大致顺序 与HEVC一致1 非I片codeSkipFlag, 若为Skip codeMergeIndex finishCU, 结束2 否则codePredMode 帧内/帧间3 codePartSize PU划分2Nx2N,2NxN,AMP等4 codePredInfo, 帧内则亮度/色度intra方向帧间则codePUWise5 codeCoeff;根CBF 帧间再进行encodeTransform写TU树与系数If (!slice-isIntra()) {Bool skipFlag ctu.m_predMode[absPartIdx] PRED_SKIP;codeSkipFlag(ctu, absPartIdx, skipFlag);If (skipFlag) {codeMergeIndex(ctu, absPartIdx);finishCU(ctu, absPartIdx, depth, bEncodeDQP);Return ;}codePredMode(ctu.m_predMode[absPartIdx]);}codePartSize(ctu, absPartIdx, depth);//prediction InfocodePredInfo(ctu, absPartIdx);codeCoeff(ctu, absPartIdx, bEncodeDQP, tuDepthRange);finishCU(ctu, absPartIdx, depth, bEncodeDQP);4 变换与系数 codeCoeff-encodeTransform-codeCOeffNxNVoid Entropy::codeCoeff(const CUData cu, uint32_t absPartIdx, bool bCodeDQP, const uint32_t depthRange[2]){If (!cu.isIntra(absPartIdx)) {Bool rootCbf cu.getQtRootCbf(absPartIdx);If (!cu.m_mergeFlag[absPartIdx] cu.m_predMode[absPartIdx] PRED_2Nx2N)codeQtRootCbf(rootCbf);Uint32_t log2CuSize cu.m_log2CuSize[absPartIdx];encodeTransform(cu, absPartIdx, 0, log2CuSize, bCodeDQP, depthRange)}}codeCOeffNxN 系数编码的主体确定 last significant coefficient 位置一类逻辑前缀CABAC 后缀 bypass.按4x4系数组写significant_coeff_group_flag组内写significant_coeff_flag, coeff_abs_level_greater1/2, coeff_abs_level_remaining等与你在quant.cpp 里RDOQ用的上下文一致。若开启sign hiding, 符号按规范与电平一起处理。5 CABAC状态resetEntropy 与引擎resetEntropy(const Slice slice): 按slice 类型 QP用标准INIT_*表初始化m_contextState各段(split, skip, merge, MVD, cbf, sig, last, level等)然后start 重置算数编码寄存器void Entropy::resetEntropy(const Slice slice){int qp slice.m_sliceQp;SliceType sliceType slice.m_sliceType;initBuffer(m_contextState[OFF_SPLIT_FLAG_CTX], sliceType, qp, (uint8_t*)INIT_SPLIT_FLAG, NUM_SPLIT_FLAG_CTX);...initBuffer(m_contextState[OFF_ABS_FLAG_CTX], sliceType, qp, (uint8_t*)INIT_ABS_FLAG, NUM_ABS_FLAG_CTX);...start();}start(): m_range 510, m_low 0, m_bitsLeft -12等即HEVC CABAC算数编码段的起点void Entropy::start(){m_low 0;m_range 510;m_bitsLeft -12;m_numBufferedBytes 0;m_bufferedByte 0xff;}encodeBin(bin, ctxModel)用sbacNext 更新上下文状态若有m_bitIf 按LPS表划分区间重归一化必要时writeOut 把字节写入BitStream若无m_bitIf, 只m_fracBits sbacGetNetropyBits() 用于RDOvoid Entropy::encodeBin(uint32_t binValue, uint8_t ctxModel){uint32_t mstate ctxModel;ctxModel sbacNext(mstate, binValue);if (!m_bitIf){m_fracBits sbacGetEntropyBits(mstate, binValue);return;}...if (m_bitsLeft 0)writeOut();}encodeBinEP/encodeBinsEP, 等概率bin, 不更新上下文直接扩m_low / m_rangeencodeBinTrm 用于terminate 如CTU间0slice结束 finishSlice里的1Finish 算数编码flush, 处理carry与末尾比特与标准CABAC收尾一致。片结束处finishSlice() 会encodeBinTrm(1) finish() 字节对齐6 WPP与上下文同步每一行用独立子码流当前行第二个CTU col 1, 把CABAC上下文存到m_rows[row].bufferedEntropy,供下一行第一个CTU前loadCOntexts 保证与HEVC波前约束一致frameencoder.cpp里encodeRow/processRowEncoder 与bufferEntropy7流程串起来参数集用定长UVLC - slice header用混合语法片内从左上CTU起递归CUskip/merge /模式/PU/TU/CBF/QP 系数全部走CABAC encodeBin, 或bypass encodeBinEP, CTU之间encodeBinTrm(0), slice未encodeBinTrm(1) finish() RDO阶段同一套APi在m_bitIf NULL下只累计分数比特。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2447664.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…