PCIe Switch 问题点

news2025/5/17 7:40:46

在这里插入图片描述

系列文章目录



文章目录

  • 系列文章目录
  • 完善
  • PCIe Retimer Overview Document Outline
  • Switch 维度
  • BroadCom
  • MicroChip
  • Asmedia 祥硕
  • Cyan
  • 其他


完善

  • Functional block diagram,功能框图
  • Key Features and Benefits,主要功能和优点
  • Fabric 链路
  • Multi-root

PCIe Retimer Overview Document Outline

KB90xx (Regli™) PCIe Retimer Overview Document Outline

  1. Introduction

    • Overview of KB90xx (Regli™) PCIe Retimer family
    • Purpose and target applications
  2. Kandou’s Unique Chiplet Approach

    • Single-silicon development for multiple products (x16, x8, x4 retimers)
    • Integration of Glasswing interface for low-power, low-latency chiplet communication
  3. KB900x Product Overview

    • Key Features:
      • Compliance with PCIe Gen5/CXL 2.0 standards
      • Low latency (~10ns), insertion loss compensation (up to 36dB@16GHz)
      • Dynamic lane skew compensation, automatic offset calibration
      • Support for L1PM substates, on-chip diagnostics (eye scope, BER monitors, logic analyzer)
    • Voltage Flexibility:
      • PWR_1 (VDD_IO): 1.8V
      • PWR_2 (VDD_CORE): 0.9V
      • PWR_12 (VDD_PHY): 1.8V (Regular) or 1.2V/1.5V (Power Saving Mode)
    • Packaging Options:
      • KB9003 (x16): 354-ball BGA (8.9mm×22.8mm)
      • KB9002 (x8): 332-ball BGA (8.5mm×13.4mm)
      • KB9001 (x4): 146-ball BGA (5.5mm×10mm)
  4. KB900x Product Family Comparison (NDA Required)

    FeatureKB9003KB9002KB9001
    PCIe Lanes16 (Bidir)8 (Bidir)4 (Bidir)
    CXL SupportCXL 1.0/2.0CXL 1.0/2.0CXL 1.0/2.0
    Insertion Loss Comp.Rx: 36dB@16GHzSame as KB9003Same as KB9003
    Power Consumption14.7W7.4W3.7W
    AvailabilityES: NowCS: May 2024CS: Q1 2025
  5. KB900x Functional Block Diagram

    • Integration of AC coupling capacitors (220nF)
    • MCU with EEPROM/SPI Flash boot options
    • 100MHz HCSL clock source for PCIe reference clocks
  6. KB900x Key Features & Benefits

    • Co-design compatibility with Astera Labs
    • Dynamic channel loss compensation (up to 36dB)
    • Secure platform boot support
    • Integrated logic analyzer for real-time debugging
    • Power-saving modes (1.2V/1.5V supply)
  7. KB900x Software Overview

    • Besso GUI for advanced debugging features
    • Remote diagnostics capabilities
  8. KB900x Advanced Debug Features

    • Eye Scope & BER Monitors: Analyze signal integrity and bit error rates
    • RTSSM Analyzer: Track state transitions across all lanes
    • Logic Analyzer: Trigger on signals (rising/falling edges) for upstream/downstream debug
    • Link Training Widget: Visualize PCIe Gen1-Gen5 link speeds and states
  9. KB900x Link Training States

    • States: INACTIVE (gray), FAILED (red), ACTIVE (blue), PASSED (green)
    • Components: Detect, Polling, Configuration, Recovery, Loopback, L0 (Operational)
  10. KB9003 CEM (x16 Lane) Riser Card

    • Evaluation board for KB9003
    • USB-connected PC control via Besso app
  11. Retimer Use Cases

    • Genoa-based interoperability testing
    • Ethernet SmartNIC (ConnectX) integration
    • MCIO AEC test configurations
  12. PCIe TSSM Block Diagram

    • Illustrates link training states (LTSSM) and protocol awareness
  13. KB900x Debugging Tools

    • Firmware update and version display
    • Temperature sensor monitoring
    • Register dump and soft/hard MCU reset
    • Logic analyzer trigger conditions (e.g., pl_ltssm = 0x10 for L0 state)
  14. Conclusion & Support

    • Global technical assistance from Kandou’s AE/FAE teams
    • Accelerated time-to-market through co-design and prototyping support

附录图表说明

  • KB900x Functional Block Diagram: 展示芯片功能模块(AC电容、MCU、时钟源)。
  • KB900x RTSSM Analyzer: 实时状态转换监控界面截图。
  • KB900x Logic Analyzer: 触发条件配置与信号采样界面示例。

Switch 维度

  • Part Number, 部件编号
  • PCI-Sig Base Spec, PCI-SIG 规范版本
  • Lanes,通道数
  • Port Count,端口数量
  • Product Brief,产品简介
  • ACS/ARI,访问控制服务/高级可扩展接口
  • DMA,直接内存访问
  • Dual/Multi Cast,单播/多播
  • Latency,延迟
  • Multi-Root/Multi-Host,多根/多主机
  • Non-Transparency,非透明性
  • Packaging Size,封装尺寸
  • Power Typ. ,典型功耗
  • Read Pacing,读取速率控制
  • Virtual Channels,虚拟通道

BroadCom

ExpressFabric Switch and Retimer Solutions

博通PCIe Switch-学习笔记

在这里插入图片描述

MicroChip

Switchtec™ PCIe® Switches

Asmedia 祥硕

PCIe Switch

Cyan

在这里插入图片描述

其他

NVMe All Flash Array (AFA) systems

青芯说,国内现在他们的 PCIe4 Switch 用的最多的是 Storage RAID 卡(下行多个x4,上行一般是x8或者x16),和 GPU的一卡双芯(上行X16,两个下行X16)

全球PCIe交换芯片(PCIe Switch)核心厂商包括Broadcom、Microchip和Texas Instruments等,前三大厂商占有全球大约80%的份额。亚太是最大的市场,占有大约75%的份额。产品类型而言,PCIe 3.0是最大的细分,占有大约47%的份额。就下游来说,企业级是最大的下游领域,占有约45%的份额。

在这里插入图片描述

在这里插入图片描述


AI产业笔记(二):存算一体和PCIe SW芯片

  1. Balance 拓扑:每个CPU下连接1个PCIe SW芯片,每个PCIe SW芯片最多可以连接5张GPU。远端GPU P2P通信受限于CPU间的UPI通信瓶颈,比较适用于VDI、公有云、AI训练等场景,属目前市场主流拓扑。

在这里插入图片描述

  1. Common 拓扑:CPU0下连接2个PCIe SW芯片,每个PCIe SW芯片连接4张GPU。远端GPU通信无需跨CPU通信,GPU P2P吞吐量高。适合CPU参与较多任务的P2P通信密集训练算法模型,如Resnet 101/50。

在这里插入图片描述

  1. Cascade 拓扑:CPU0 直连1个 PCIe SW芯片,此PCIe SW芯片与另一个PCIe SW芯片互联,每个PCIe SW芯片下面连接 4 张 GPU。Switch 芯片互联提供最强的 GPU P2P 通信,但CPU到GPU吞吐量小。适合CPU参与较少任务的P2P参数密集型训练算法模型如VGG-16。

在这里插入图片描述

  1. 双上行拓扑:每个CPU下连接一个PCIe SW芯片,每个PCIe SW芯片连接4张GPU。CPU利用率最大化,提供最大上行链路带宽(2个x16的速率),但远端GPU P2P通信受限于CPU间的UPI通信瓶颈,适用于VDI、公有云、AI训练等场景。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2377463.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

开源轻量级地图解决方案leaflet

Leaflet 地图:开源轻量级地图解决方案 Leaflet 是一个开源的 JavaScript 库,用于在网页中嵌入交互式地图。它以轻量级、灵活性和易用性著称,适用于需要快速集成地图功能的项目。以下是关于 Leaflet 的详细介绍和使用指南。 1. Leaflet 的核心…

Flutter目录结构介绍、入口、Widget、Center组件、Text组件、MaterialApp组件、Scaffold组件

目录 1. 创建Flutter项目 1.1使用Android Studio创建Flutter项目 1.2 使用命令行创建Flutter项目 2. Flutter项目介绍 2.1所有代码都在lib目录下编写 2.1 pubspec.yaml 依赖库/图片的引用 ​编辑 3. 运行项目 4. 编写mian.dart文件 4.1 使用MaterialApp 和 Scaffold两个组件…

如何实现金蝶云星空到MySQL的数据高效集成

金蝶云星空数据集成到MySQL的技术案例分享 在企业信息化建设中,数据的高效流动和准确处理是关键。本文将聚焦于一个具体的系统对接集成案例:金蝶云星空的数据集成到MySQL,方案名称为“xsck-2金蝶销售出库-->mysql”。通过这一案例&#x…

院校机试刷题第四天:1911反转公约数、1702十六进制不进位加法

一、1911反转公约数 1.题目描述 2.解题思路 两个关键点:1.如何把数字反转,2.如何求最大公约数。 反转:用字符串形式存储,定义一个新的字符串倒序存储反转之后的字符串,将字符串按位转换位数字。 求最大公约数&…

Redis解析

Redis解析 一、单线程模型 redis在io层面是多线程的,在数据处理层面是单线程的。 多线程一般用于: 关闭连接删除/淘汰内存网络IO 1.1 io多路复用 redis使用nio(select、poll、epoll)的方式处理socket 主线程负责接收建立连接…

2025年Ai写PPT工具推荐,这5款Ai工具可以一键生成专业PPT

上个月给客户做产品宣讲时,我对着空白 PPT 页面熬到凌晨一点,光是调整文字排版就改了十几版,最后还是被吐槽 "内容零散没重点"。后来同事分享了几款 ai 写 PPT 工具,试完发现简直打开了新世界的大门 —— 不用手动写大纲…

css:倒影倾斜效果

这是需要实现的效果,平时用的比较多的是添加阴影,是box-shadow,而添加倒影是box-reflect,需要注意的是box-reflect需要添加浏览器前缀,比如我用的谷歌浏览器,要加-webkit-才能生效。 -webkit-box-reflect:…

语音识别——通过PyAudio录入音频

PyAudio 是一个用于处理音频的 Python 库,它提供了录制和播放音频的功能。通过 PyAudio,可以轻松地从麦克风或其他音频输入设备录制音频,并将其保存为文件或进行进一步处理。 安装 PyAudio 在使用 PyAudio 之前,需要先安装它。可…

五月月报丨MaxKB在教育行业的应用进展与典型场景

在2025年的3月和4月的“用户应用月度报告”中,MaxKB开源项目组相继总结了MaxKB开源项目在政府、公共事业、教育、医疗以及企事业单位的应用情况。毫无疑问,在DeepSeek等国产大模型被各行各业的用户广泛接受之后,AI应用建设并运营的步伐也在显…

【流程控制结构】

流程控制结构 流程控制结构1、顺序结构2、选择结构if基本选择结构if else语法多重if语法嵌套if语法switch选择结构 3、循环结构循环结构while循环结构程序调试for循环跳转语句区别 流程控制结构 1、顺序结构 流程图 优先级 2、选择结构 if基本选择结构 单if 语法 if&…

PowerBI基础

一、前言 在当今数据驱动的时代,如何高效地整理、分析并呈现数据,已成为企业和个人提升决策质量的关键能力。Power BI 作为微软推出的强大商业智能工具,正帮助全球用户将海量数据转化为直观、动态的可视化洞察。数据的世界充满可能性&#xf…

一文了解多模态大模型LLaVA与LLaMA的概念

目录 一、引言 二、LLaVA与LLaMA的定义 2.1 LLaMA 2.2 LLaVA 2.3 LLaVA-NeXT 的技术突破 三、产生的背景 3.1 LLaMA的背景 3.2 LLaVA的背景 四、与其他竞品的对比 4.1 LLaMA的竞品 4.2 LLaVA的竞品 五、应用场景 5.1 LLaMA的应用场景 5.2 LLaVA的应用场景 六…

原生小程序+springboot+vue+协同过滤算法的音乐推荐系统(源码+论文+讲解+安装+部署+调试)

感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,我会一一回复,希望帮助更多的人。 系统背景 在数字音乐产业迅猛发展的当下,Spotify、QQ 音乐、网易云音乐等音乐平台的曲…

【MySQL】项目实践

个人主页:Guiat 归属专栏:MySQL 文章目录 1. 项目实践概述1.1 项目实践的重要性1.2 项目中MySQL的典型应用场景 2. 数据库设计流程2.1 需求分析与规划2.2 设计过程示例2.3 数据库设计工具 3. 电子商务平台实践案例3.1 系统架构3.2 数据库Schema设计3.3 数…

回调函数应用示例

回调函数是一种通过函数指针(或引用)调用的函数,它在特定事件或条件发生时被另一个函数调用。回调函数的核心思想是将函数作为参数传递,以便在适当的时候执行自定义逻辑,常用于异步编程、事件驱动架构等场景。 业务场景…

upload-labs通关笔记-第4关 文件上传之.htacess绕过

目录 一、.htacess 二、代码审计 三、php ts版本安装 1、下载ts版本php 2、放入到phpstudy指定文件夹中 3、修改php配置文件 4、修改php.ini文件 5、修改httpd.conf文件 (1)定位文件 (2)修改文件 6、重启小皮 7、切换…

DeepSearch代表工作

介绍下今年以来深度搜索相关的一些论文~ 文章目录 Search-o1简述方法实验Search-R1简介方法带搜索引擎的强化学习多轮搜索调用的生成训练模板奖励建模实验R1-Searcher简介方法数据选择两阶段的强化学习训练算法ReSearch: Learning to Reason with Search for LLMs via Reinforc…

记录一次服务器卡顿

一、服务器卡顿现象 服务用了一段时间后,突然很卡,发现在服务器上新建excel也很卡,发现服务器中病毒了,然后重新安装了操作系统。重新安装服务环境时,发现同时安装pdf、tomcat时都很慢,只能一个安装好了&am…

leetcode2749. 得到整数零需要执行的最少操作数-medium

1 题目:得到整数零需要执行的最少操作数 官方标定难度:中 给你两个整数:num1 和 num2 。 在一步操作中,你需要从范围 [0, 60] 中选出一个整数 i ,并从 num1 减去 2i num2 。 请你计算,要想使 num1 等于…

14 C 语言浮点类型详解:类型精度、表示形式、字面量后缀、格式化输出、容差判断、存储机制

1 浮点类型 1.1 浮点类型概述 浮点类型用于表示小数(如 123.4、3.1415、0.99),支持正数、负数和零,是科学计算和工程应用的核心数据类型。 1.2 浮点数的类型与规格 浮点类型存储大小值范围(近似)实际有效…