回头看,FPGA+RK3576方案的功耗性能优势

news2025/6/3 18:55:39

作者:Hello,Panda

各位朋友,大家好,熊猫君这次开个倒车,在这个广泛使用Xilinx(Altera)高端SoC的时代,分享一个“FPGA+ARM”实现的低功耗高性能传统方案。

图1 瑞芯微RK3576电路

当前,包含FPGA和硬核处理器的SoC主要集中于以下几个系列:

1、Xilinx(现在的AMD):(1)高端的VerSal系列,集成超大容量的FPGA和双核Cortex-A72/Cortex-A78E处理器;(2)中端的ZYNQ MPSoC,集成中等容量的FPGA和双核或四核的Cortex-A53处理器;(3)通用的ZYNQ-7000系列SoC,集成一般容量的FPGA和单/双核的Cortex-A9处理器。

2、Altera(现在的Intel可编程逻辑业务):(1)高端的Agilex和Stratix 10系列SoC均采用四核Cortex-A53处理和超大规模的FPGA;(2)通用的Arria 10和Cyclone V系列SoC均采用单/双/四核的 Cortex-A9处理器。

3、其他,包括高云、安陆等国内厂家,均有提供集成FPGA和硬核处理器的SoC。硬核处理器大多为ARM Cortex-M3/M4(搭配中小规模FPGA使用)或RISC-V处理(搭配较大规模的FPGA使用),主要还是适合在一些不太复杂的控制领域使用。

通过以上总结可以看到,Xilinx和Altera的大规模和超大规模SoC主要用于验证AISC设计或原理样机验证,不大可能用到量产工业或消费产品中去。中低端的FPGA处理器性能又普遍偏弱,在一些图形图像中的处理能力偏弱,功耗也不低,形成优势产品的难度较大。

在一些手持设备、电池供电的系统或对发热敏感的高性能图像应用系统,常常需要在功耗、面积、性能上找到一个最优解。对一个图像系统而言,常常需要FPGA来做图像采集、控制和其它接口扩展,处理一些适合Pipeline的图像或图像算法等等,同时又需要ARM或DSP做一些较为复杂的应用算法、图像效果或数据库等等。这种情况下,封装尺寸小的“低功耗FPGA+低功耗ARM SoC”分立方案反而成了最优解。

这里一个最典型的应用就是红外热成像领域,具有100%指征:

(1)非制冷的手持设备和电池供电设备:对热量敏感,机器内部发热会严重影响成像效果,带来灵敏度降低(NETD),热辐射“锅盖”现象等;对续航敏感,无论是测温设备、穿戴设备还是仪器仪表,都要求待机时间越长越好,因此对低功耗要求高;对计算要求较高,这些机器里面通常需要运行一些图像处理类的算法外,还需要运行图像融合,检测、识别、跟踪等算法或是较为复杂的图形界面、样本数据库等等,所以这些设备的计算性能要求绝对不低。

当然,也有部分非制冷探测器应用集成封装FPGA,如国内某头部红外制造商堆栈封装了易灵思Ti60 FPGA;

(2)制冷型的红外设备:此类设备主要用于仪器和特殊领域使用,虽然对续航时间没有要求,但其对发热和性能的要求同样高,一句话就是:性能尽量高,发热要小。

一、低功耗FPGA

现在咱们聊一聊低功耗的FPGA。咱们暂且分为国产和进口两大类。

(1)进口低功耗FPGA:说到功耗低、不发热,性能又比较好的,必须是Lattice,尤其是其Crosslink-NX系列(包括该系列的国内马甲芯片),可以说是排在低功耗性能器件的首位;其次是MicroChip的,功耗是真的低,但是容量和性能也是真的低;再次就是Altera的Max10系列,内部集成了Flash和ADC等,功耗性能比上也还是很不错的(缺点是没有mipi核,40k以上逻辑没有小封装)。综上:进口低功耗FPGA首选Lattice Crosslink-NX 40K逻辑器件,压榨其资源(尽可能能用的资源都用上,不含PCIe器件)平均实测功耗≤500mW,直观的用手去摸芯片表面,基本感受不到发热(测试FPGA型号为LIFCL-40-7MG121I)。

图2  :Lattice LIFCL-40电路图

(2)国产低功耗FPGA:严格意义上,国产器件没有专门的低功耗设计,其功耗由流片工艺决定。高云小蜜蜂、智多晶、京微齐力、紫光同创、安陆等等功耗较低的器件普遍容量小,接口和性能上也差事儿,能做的事情不多。目前来讲,可用的主要是高云的GW5A和易灵思的TI60(集成HyperRAM和QSPI Flash)两个系列的器件上。从实测效果上看,选用GW5AT-60 MG132封装和Ti60 100pin封装两颗器件(逻辑量均为60k),运行相同功能的逻辑,用手接触芯片表面明显发热,整体功耗也在1200mW以上。在对国产化要求有硬性指标的应用场合,这个大概是最佳选项。

图3 高云GW5AT-LV60UG225电路图

图4 易灵思Ti60电路图

下面是Lattice、高云、易灵思三家器件的对照表:

二、低功耗SoC

SoC的功耗直接与其制程和性能相关。咱们这里不讨论国外的如英伟达、高通、TI之类的,主要还是选国产,按照其能打程度,主要还是海思、瑞芯微和全志三大家,但是这三家又各有特点:

(1)海思SoC主要针对图像处理,ISP性能强,但是自其恢复供货后,受制造工艺限制,功耗高了不少;

(2)瑞芯微主要针对通用处理,其ISP性能较弱,但是通用计算能力强,接口也很丰富;

(3)全志比较低调,就是纯ARM SoC,没有较强的图像图形处理能力,且没有工业和车载等级器件。

从以上三家的情况来看,“FPGA+ARM”方案,ARM SoC主要承担的是应用处理算法和图形、数据处理能力,因此选用瑞芯微器件会更加合适。

下表是RK3576、RK3588和海思Hi3559AV100参数对照表。

实际上,低功耗视觉应用场景图像的分辨率不会太大,对应的图像链路的处理负载和内存消耗不会太大,对应的输入输出接口和Codec的功耗也会较小。其功耗消耗主要是运行前述的复杂算法。

三、案例

以下是一个常规的双光融合设备的框图,如前面内容所述,FPGA和RK3576各自分工承担计算负载,如下图5所示。像这样的一个典型应用方案,处理板上的功耗约4瓦(常温25°C时,不含屏)。

图5  FPGA+RK3576双光融合方案框图

今天就聊这么多,分享结束,感谢大家阅读,希望能起到抛砖引玉的作用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2395166.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LiveNVR 直播流拉转:Onvif/RTSP/RTMP/FLV/HLS 支持海康宇视天地 SDK 接入-视频广场页面集成与视频播放说明

LiveNVR直播流拉转:Onvif/RTSP/RTMP/FLV/HLS支持海康宇视天地SDK接入-视频广场页面集成与视频播放说明 一、视频页面集成1.1 关闭接口鉴权1.2 视频广场页面集成1.2.1 隐藏菜单栏1.2.2 隐藏播放页面分享链接 1.3 其它页面集成 二、播放分享页面集成2.1 获取 iframe 代…

进程间通信IV System V 系列(linux)

目录 消息队列 原理 操作 补充概念 信号量 (原子性计数器) 原理 操作 (和共享内存相似) 总结 小知识 消息队列 原理 在内核中建立一个队列,进程可以相互进行通信,通过队列进行IPC,就是进程之间发送带类型的数据块。 操作 接口和共享…

设计模式——建造者设计模式(创建型)

摘要 本文详细介绍了建造者设计模式,这是一种创建型设计模式,旨在将复杂对象的构建过程与其表示分离,便于创建不同表示。文中阐述了其设计意图,如隐藏创建细节、提升代码可读性和可维护性,并通过构建电脑的示例加以说…

使用Yolov8 训练交通标志数据集:TT100K数据集划分

使用Yolov8 训练交通标志数据集:TT100K数据集划分(一) 一、数据集下载二、划分数据集三、目录放置 一、数据集下载 官方网址:TT100K 数据集对比 源码如下: def classes(filedir):with open(filedir) as f:classes …

NLP学习路线图(十三):正则表达式

在自然语言处理(NLP)的浩瀚宇宙中,原始文本数据如同未经雕琢的璞玉。而文本预处理,尤其是其中至关重要的正则表达式技术,正是将这块璞玉转化为精美玉器的核心工具集。本文将深入探讨正则表达式在NLP文本预处理中的原理…

javaweb-maven以及http协议

1.maven坐标: 坐标是资源的唯一标识,通过该坐标可以唯一定位资源位置; 2.坐标的组成: groupId:定义当前项目隶书的组织名称; artifactId:定义当前maven项目名称 version:定义项目版本 3.依…

华为OD机试真题—— 最少数量线段覆盖/多线段数据压缩(2025A卷:100分)Java/python/JavaScript/C++/C语言/GO六种最佳实现

2025 A卷 100分 题型 本文涵盖详细的问题分析、解题思路、代码实现、代码详解、测试用例以及综合分析; 并提供Java、python、JavaScript、C++、C语言、GO六种语言的最佳实现方式! 2025华为OD真题目录+全流程解析/备考攻略/经验分享 华为OD机试真题《最少数量线段覆盖/多线段数…

C语言创意编程:用趣味实例玩转基础语法(2)

文章目录 0. 前言1. 📊 动态条形图1.1 程序效果展示1.2 完整代码解析1.3 关键技术详解1.3.1 Unicode字符应用1.3.2 函数封装思想1.3.3 输入处理1.3.4 跨平台考虑 2. 🔤 字母金字塔2.1 程序效果展示2.2 完整代码解析2.3 关键技术详解2.3.1 嵌套循环结构2.…

OpenCV CUDA模块图像处理------颜色空间处理之GPU 上对两张带有 Alpha 通道的图像进行合成操作函数alphaComp()

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 该函数用于在 GPU 上对两张带有 Alpha 通道的图像进行合成操作。支持多种常见的 Alpha 合成模式(Porter-Duff 合成规则)&…

OpenWebUI(1)源码学习构建

1. 前言 通过docker镜像拉取安装就不介绍了,官方的命令很多。本节主要撸一撸源码,所以,本地构建 2. 技术框架和启动环境 后端python,前端svelte 环境要求:python > 3.11 ,Node.js > 20.10 3. 源…

npm error Cannot find module ‘negotiator‘ 的处理

本想运行npm create vuelatest,但提示: npm error code MODULE_NOT_FOUND npm error Cannot find module negotiator npm error Require stack: npm error - C:\Users\Administrator\AppData\Roaming\nvm\v18.16.1\node_modules\npm\node_modules\tuf-j…

爬虫入门指南-某专利网站的专利数据查询并存储

免责声明 本教程仅用于教育目的,演示如何合法获取公开专利数据。在实际操作前,请务必: 1. 仔细阅读目标网站的robots.txt文件和服务条款 2. 控制请求频率,避免对服务器造成负担 3. 仅获取和使用公开数据 4. 不用于商业用途或…

SQL(Database Modifications)

目录 Insertion Specifying Attributes in INSERT Adding Default Values(缺省值) Inserting Many Tuples Creating a Table Using the SELECT INTO Statement Deletion Example: Deletion Semantics of Deletion Updates Example: Update Sev…

【android bluetooth 案例分析 04】【Carplay 详解 2】【Carplay 连接之手机主动连车机】

1. 背景 在【android bluetooth 案例分析 04】【Carplay 详解 1】【CarPlay 在车机侧的蓝牙通信原理与角色划分详解】中我们从整理上介绍了车机中 carplay 相关基础概念。 本节 将详细分析 iphone手机主动 连接 车机carplay 这一过程。 先回顾一下 上一节, carpla…

【仿muduo库实现并发服务器】实现时间轮定时器

实现时间轮定时器 1.时间轮定时器原理2.项目中实现目的3.实现功能3.1构造定时任务类3.2构造时间轮定时器每秒钟往后移动添加定时任务刷新定时任务取消定时任务 4.完整代码 1.时间轮定时器原理 时间轮定时器的原理类似于时钟,比如现在12点,定一个3点的闹…

day15 leetcode-hot100-28(链表7)

2. 两数相加 - 力扣(LeetCode) 1.模拟 思路 最核心的一点就是将两个链表模拟为等长,不足的假设为0; (1)设置一个新链表newl来代表相加结果。 (2)链表1与链表2相加,具…

​​知识图谱:重构认知的智能革命​

在数字经济的浪潮中,知识图谱正悄然掀起一场认知革命。它不仅是技术的迭代,更是人类从“数据依赖”迈向“知识驱动”的里程碑。当谷歌用知识图谱优化搜索引擎、银行用它穿透复杂的金融欺诈网络、医院用它辅助癌症诊疗时,这项技术已悄然渗透到…

【计算机网络】4网络层①

这篇笔记讲IPv4和IPv6。 为了解决“IP地址耗尽”问题,有三种措施: ①CIDR(延长IPv4使用寿命) ②NAT(延长IPv4使用寿命) ③IPv6(从根本上解决IP地址耗尽问题) IPv6 在考研中考查频率较低,但需掌握基础概念以防冷门考点,重点结合数据报格式和与 IPv4 的对比记忆。…

MATLAB中的table数据类型:高效数据管理的利器

MATLAB中的table数据类型:高效数据管理的利器 什么是table数据类型? MATLAB中的table是一种用于存储列向数据的数据类型,它将不同类型的数据组织在一个表格结构中,类似于电子表格或数据库表。自R2013b版本引入以来,t…

Dropout 在大语言模型中的应用:以 GPT 和 BERT 为例

引言 大型语言模型(LLMs)如 GPT(生成式预训练 Transformer)和 BERT(双向编码器表示 Transformer)通过其强大的语言理解和生成能力,彻底改变了自然语言处理(NLP)领域。然…