NVIDIA Mellanox BlueField-2 DPU(Data Processing Unit)智能网卡的调试和使用

news2025/7/26 23:09:41

专有名词

OOB:

BMC:

BFB:

EMMC:

关键词解释
eMMCEmbedded Multi-Media Card——把 NAND 闪存颗粒与控制器封装在一起的板载存储件,类似手机里的“内置储存”

.deb:文件是​​Debian软件包格式​​的专用扩展名,专为Debian及其衍生Linux发行版(如Ubuntu)设计,用于软件的分发、安装与管理。

外观

 各个模块的功能

配置使用

BlueField DPU Administrator Quick Start Guide - NVIDIA Docs

本版本的网卡,需要外接供电,否则光靠pcie的供电,网卡不能正常工作。

产看网卡是否正常上线

update-pciids


lspci  | grep BlueField

将网卡的pci总线地址和网卡IP地址做一个对应

得到pci总线地址和网卡名称的对应关系

lspci | grep BlueField
for nic in /sys/class/net/ens*; do     printf "%-12s → %s\n"         $(basename $nic)         $(basename $(readlink -f $nic/device)); done

  • 0000:c4:00.0 → PF0,对应主机侧端口 0(ens24f0np0)

  • 0000:c4:00.1 → PF1,对应主机侧端口 1(ens24f1np1)

  • 0000:c4:00.2 → 同一物理设备上的管理/DMA 功能,不暴露成网口

将网卡名称和IP地址对应

ifconfig -a

配置管理口IP地址

下载DOCA到服务器上

DOCA = Data-Center On-a-Chip Architecture(也写作 Data-Center Infrastructure-on-a-Chip Architecture。它是 NVIDIA 为 BlueField DPU / SuperNIC 及 ConnectX 网卡推出的一整套 软件框架 + SDK + 运行时,用来把本来跑在主机 CPU 上的网络、存储、安全等基础设施工作负载「卸载、加速、隔离」到 DPU 上。

NVIDIA DOCA Downloads | NVIDIA Developer

下载server端的DOCA.

根据系统安装

把下面的命令行,一行一行的粘贴到服务器上

给网卡刷系统

BFB 镜像

  • BFBBlueField Bundle)是一种专用的整机镜像文件,扩展名为 .bfb

  • 它里面已经打包好了引导程序、内核、固件以及 全部 DOCA 运行时/SDK 软件包

  • 刷入以后,BlueField DPU 会直接运行这一整套官方环境。

NVIDIA DOCA Downloads | NVIDIA Developer

下载镜像然后上传到服务器

使用命令安装并安装pv显示进度

bfb-install --bfb bf-bundle-3.0.0-135_25.04_ubuntu-22.04_prod.bfb --rshim rshim0

apt install pv

也可以添加.cfg

创建一个新文件bd

sudo bfb-install     --bfb bf-bundle-3.0.0-135_25.04_ubuntu-22.04_prod.bfb     --config bf.cfg     --rshim rshim0
 

升级固件

登录到DPU

OOB法

通过OOB(Out-Of-Band Management)带外管理,一个RJ45的网口

还有一个方法,通过mac,然后插到交换机上,让管理员根据mac,设置一个对应的IP地址。

通过rsim?

问一下,是不是ubuntu的密码有没有变化,因为第一次都要改密码

rshim法

echo "deb [trusted=yes] https://linux.mellanox.com/public/repo/doca/3.0.0/ubuntu22.04/x86_64 ./" | sudo tee /etc/apt/sources.list.d/doca.list
 

sudo apt update
 

sudo apt install doca-runtime rshim
 

也有可能是之前装doca的时候,就已经都有了。

然后启用服务

sudo systemctl enable --now rshim # 启动服务并启用开机自启

查看状态是否正常

ip link show | grep tmfifo_net,如果正常如下

# 给主机侧配静态 IP
sudo ip addr add 192.168.100.1/30 dev tmfifo_net0
sudo ip link set tmfifo_net0 up

# 连通性测试 & SSH 登录 BlueField
ping -c 3 192.168.100.2
ssh ubuntu@192.168.100.2   

接下来的处理

只能重新用笔记本,连接OOB口,重新烧系统,然后获取OOB的IP地址,或者是路由器。

否则就是试试新买串口能不能链接上。

笔记本电脑当dhcp服务器,tftp64使用

最后通过路由器解决了这个问题。笔记本的dhcp没有用。

得到管理口的IP地址192.168.56.4.

使用mobaxterm,ssh登录后,修改密码即可登录。

不同的使用模式

1. DPU(SmartNIC)模式

也称为 Embedded/Separated/Arm Mode,默认模式。

  • BlueField Arm 侧运行完整的 Linux 操作系统(Ubuntu/CentOS/SUSE)。

  • 用作智能网卡、存储加速、安全防护等,DPU 独立运行,主机可通过 OOB(带外)或 In-Band(带内)与其通信。

  • 主机和 DPU ARM OS 各自拥有独立的以太网接口(通常是 PF/VF)。


2. NIC(Network Interface Card)模式

也称为 Integrated/x86 Host NIC Mode

  • BlueField 只作为传统网卡使用,不启用 Arm 侧 OS。

  • 相当于把 BlueField 作为普通 Mellanox NIC 用,管理、数据全部透过主机侧,不提供 ARM DPU 的加速能力。

  • 部分固件/配置可切换到此模式,常用于 BIOS/低级调试、对 ARM OS 无需求场景。


3. 混合(Hybrid/Multi-Host/Shared)模式(高端/多端口卡支持)

  • 一张 BlueField 卡的端口可部分分配给主机侧 PCIe、部分保留 DPU 自用。

  • 允许主机和 DPU 同时访问部分物理端口,实现网络多租户、带外/带内管理分离。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2397681.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Tomcat- AJP协议文件读取/命令执行漏洞(幽灵猫复现)详细步骤

一、漏洞描述 Apache Tomcat是由Apache软件基金会属下Jakarta项目开发的Servlet容器.默认情况下,Apache Tomcat会开启AJP连接器,方便与其他Web服务器通过AJP协议进行交互.但Apache Tomcat在AJP协议的实现上存在漏洞,导致攻击者可以通过发送恶意的AJP请求,可以读取或者包含Web应…

B1、进度汇报(— 25/05/31)

本文档汇总了各成员在 2025 年 5 月 11 日 ~ 5 月 31 日完成的工作。我们遇到了进度问题(收工后需反思): 本学期第十四周(05/19 ~ 05/25)有相当多课程需要提交实验结果或上台展示。本学期第十六周(06/02 ~…

Flutter实现不规则瀑布流布局拖拽重排序

因为业务,所以需要用flutter去实现一种不规则图形的瀑布流,但是同时需要支持拖拽并重新排序。效果类似如下。 查询过现有的插件,要么是仅支持同样大小的组件进行排序,要么就是动画效果不是很满意,有点死板,…

【第4章 图像与视频】4.1 图像的绘制

文章目录 前言在 Canvas 之中绘制图像drawImage() 方法的用法 前言 drawImage() 方法可以将一幅图像的整体或某个部分绘制到 canvas 内的任何位置上,并且允许开发者在绘制过程中对图像进行缩放。也可以将图像绘制在离屏 canvas 中,这样的话就可以对图像…

G25-05-31Rust开源项目日报 Top10

根据Github Trendings的统计,今日(2025-05-31统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量Rust项目10TypeScript项目1Pake: 利用 Rust 轻松构建轻量级多端桌面应用 创建周期:491 天开发语言:Rust协议类型:MIT LicenseStar数量:2095…

window安装nginx

步骤1:下载Nginx for Windows​ 访问Nginx官网下载页面:https://nginx.org/en/download.html 在​​Stable version​​(稳定版)下找到Windows版本,点击下载.zip文件(如 nginx-1.28.0.zip) 步…

ArcGIS Pro裁剪影像

方法1: 工具箱中,数据管理工具-栅格-栅格处理-裁剪栅格 注意:勾选上使用输入要素裁剪几何 方法2: 按掩膜提取工具裁剪栅格:在工具箱中,Spatial Analyst工具-提取分析-按掩膜提取

[智能算法]蚁群算法原理与TSP问题示例

目录 ​编辑 一、生物行为启发的智能优化算法 1.1 自然界的群体智能现象 1.2 人工蚁群算法核心思想 二、算法在组合优化中的应用演进 2.1 经典TSP问题建模 2.2 算法流程优化 三、TSP问题实战:Python实现与可视化 3.1 算法核心类设计 3.2 参数敏感性实验 3.3 可视化…

【Go语言】Fyne GUI 库使用指南 (面向有经验开发者)

引言 Fyne 是一个使用 Go 语言编写的、易于使用的跨平台 GUI 工具包和应用程序 API。它旨在通过单一代码库构建在桌面和移动设备上运行的应用程序。本文档面向有一定 Go 语言开发经验的开发者,将详细介绍 Fyne 最新版的核心功能,包括基础组件、布局系统…

openssl 怎么生成吊销列表

mkdir test cd test # 根据 /usr/lib/ssl/openssl.cnf 配置文件中目录结构可知有个demoCA目录,目录下有各种文件。 mkdir ./demoCA ./demoCA/newcerts ./demoCA/private sudo chmod 777 -R ./demoCA/ echo 01 > ./demoCA/serial touch ./demoCA/index.txt # /usr…

springboot-响应接收与ioc容器控制反转、Di依赖注入

1.想将服务器中的数据返回给客户端,需要在controller类上加注解:ResponseBody; 这个注解其实在前面已经使用过,RestController其实就包含两个注解: Controller ResponseBody 返回值如果是实体对象/集合,将会转换为j…

Spring代理工厂类ProxyFactory作用以及实现原理

代理工厂类ProxyFactory AdvisedSupport(代理配置信息类)ProxyFactory(代理工厂类)小结测试 源码见:mini-spring 在 AOP(面向切面编程)中,Spring 支持两种常见的代理机制&#xff1a…

集成电路制造设备防震基座选型指南:为稳定护航-江苏泊苏系统集成有限公司

集成电路制造设备防震基座选型指南:为稳定护航 在集成电路制造这一精密复杂的领域,每一个环节都如同精密仪器中的微小齿轮,一丝偏差都可能导致严重后果。制造设备的稳定运行更是重中之重,而防震基座作为守护设备稳定的第一道防线…

华为OD机试真题——阿里巴巴找黄金宝箱(II)(2025A卷:100分)Java/python/JavaScript/C/C++/GO最佳实现

2025 A卷 100分 题型 本专栏内全部题目均提供Java、python、JavaScript、C、C++、GO六种语言的最佳实现方式; 并且每种语言均涵盖详细的问题分析、解题思路、代码实现、代码详解、3个测试用例以及综合分析; 本文收录于专栏:《2025华为OD真题目录+全流程解析+备考攻略+经验分…

探索DeepSeek提示词:关键策略与实用场景

在人工智能飞速发展的时代,DeepSeek作为一款备受关注的AI工具,其强大的功能为用户提供了高效便捷的服务。然而,要充分发挥DeepSeek的潜力,掌握提示词的使用策略至关重要。本文将深入探讨DeepSeek提示词的关键策略,并结…

海底三维可视化平台

1. 摘要 本文作者为视觉分析构建了一个真实海底的“虚拟世界”。在3D环境中导入底部轮廓。在该模型中,通过地震反射获得的海床地层剖面被数字化为离散点,并用克里金算法进行插值,以在每个地层中产生均匀的网格。然后在每一层构建 Delaunay三…

Elasticsearch 读写流程深度解析

在数据驱动的数字化浪潮中,Elasticsearch 凭借其毫秒级搜索响应与水平扩展能力,已成为现代数据架构的核心引擎。本文将深入剖析其读写流程的设计思想、实现细节与工程权衡,揭示这一分布式系统的精妙架构。 一、 架构基石:分布式设…

AIoT赋能场馆数字化转型:智能管理新生态

在数字化浪潮席卷全球的当下,传统场馆管理模式已难以满足日益增长的高效运营与精细化服务需求。智慧场馆建设成为行业发展的必然趋势,而AIoT(人工智能物联网)技术的深度应用,为多系统集成提供了全新的解决方案&#xf…

1、Pytorch介绍与安装

1、Pytorch介绍 PyTorch 是由 Facebook AI Research (FAIR) 团队开发并维护的一款开源深度学习框架,于 2016 年首次发布。它因其直观的设计、卓越的灵活性以及强大的动态计算图功能,迅速在学术界和工业界获得了广泛认可,成为当前深度学习研究…

【从零开始学习QT】Qt 概述

目录 一、什么是 Qt 1.1 简介 1.2 Qt 的发展史 1.3 Qt 支持的平台 1.5 Qt 的优点 1.6 Qt 的应用场景 二、搭建 Qt 开发环境 2.1 Qt SDK 的下载 2.2 Qt SDK 的安装 2.3 验证 Qt SDK 安装是否成功 2.4 Qt 环境变量配置 三、认识 Qt Creator 3.1 Qt Creator 概览 3.…