4.4【A】
进程之间不能直接访问对方内存所以必须用Socket 共享内存通信每个进程独立运行每个进程自己负责自己的连接网卡模拟器进程监听 PCIe 连接QEMU 进程主动连接 PCIe它们通过 Socket 建立连接交换自我介绍然后用共享内存高速通信底层状态初始化BaseIfInit 给接口填参数、做检查BaseIfListen 创建 Socket、绑定、监听、从共享内存里划分队列空间BaseIfEstablish 等待连接 握手真正把链路打通in_num_entries /out_num_entries 是固定常数不是动态变化的因为这是 “环形队列Ring Buffer”长度固定你必须理解SimBricks 用的是 预分配固定长度环形队列不是动态链表in_num_entries 队列最大能存多少条消息out_num_entries 队列最大长度创建时就定死永远不变就像快递柜一共有50 个格子这个数量永远不变格子只会在 “空 / 满” 之间变化最大容量永远是 50所以in_num_entries 固定常数out_num_entries 固定常数创建时就确定不会变SimbricksBaseIfInit作用初始化接口结构体、做参数检查只干 3 件事检查延迟 ≥ 同步间隔必须满足否则同步出错把接口内存清零把参数复制到接口里它不创建 Socket、不分配内存、不监听只是 “填表”blocking_conn 是否使用阻塞连接blocking_conn true→ 阻塞模式→ 等待连接时程序会卡住不动直到有人连接blocking_conn false→非阻塞模式我们要设置的→ 等待连接时程序不会卡住可以去做别的事判断 fcntl 获取属性是否失败Linux 系统函数调用失败时会返回-1。这里就是检查“我刚才读取文件状态成功了吗”失败就直接报错退出。SimbricksBaseIfListen作用创建 Socket 绑定 监听 从共享内存划分队列空间干 6 件大事创建 Unix Socket设置非阻塞可选bind 绑定路径listen 开始等待连接从共享内存池里划出一段空间作为 入队列 (in_queue)再划出一段空间作为 出队列 (out_queue)这个函数执行完 → 接口开始等待别人来连接创建 Socket相当于装个电话绑定地址相当于装个电话号码开始监听相当于等着别人打电话划分共享内存队列切出收件箱、发件箱pool-base共享内存起始地址pool-pos当前分配到的位置计算结果从共享内存里切出一段作为收件箱SimBricksBaseIfEstablish作用等待所有接口连接成功 握手交换信息就是你启动时看到的plaintextwaiting for pcie connection... waiting for net connection...干 3 件事循环检查所有接口PCIe ETH是否连上连上后发送 / 接收握手信息intro所有接口全部就绪才返回它是 “等待全部接通” 的函数调用SimbricksBaseIfConnected检查当前接口连好了吗。它会返回 3 种值ret 0连接失败出错ret 0已经连接好ret 0还没好需要继续等待发送握手消息告诉对方我是谁接收握手消息读取对方是谁用 poll 等着事件发生不浪费 CPU直到PCIe 和网络都握手成功函数才结束Handshake 握手Tx Send 发送Intro 自我介绍我是网卡、我的设备 ID…如果当前状态是“等待发送自我介绍” 那就调用函数把自我介绍发出去 如果发送失败 → 报错退出NicIf队列大小 条目数量 × 单个条目大小ests [2] 存放 “要建立的连接信息” 的数组最多同时建立 2 个连接PCIe 网络所以数组大小是 2。n_bifs 实际要建立的接口数量有网络 → n_bifs有 PCIe → n_bifs建立接口信息if (netParams) { SimbricksBaseIfInit(netif, netParams); // 初始化网络接口 SimbricksBaseIfListen(netif, pool); // 等待交换机连接 // 把这个接口加入“待建立列表” ests[n_bifs].base_if netif; ests[n_bifs].tx_intro net_intro; // 我发给对方的信息 ests[n_bifs].rx_intro net_intro; // 对方发给我的信息 n_bifs; }Socketsockaddr_un Unix 域套接字地址结构体_un Unix 的缩写表示本地进程间通信saunsockaddr_un的简写sun_ sockaddr_un 前缀为了统一命名sun_family是宏展开出来的不是手动写的socket() 买了一部手机得到手机号 / FDbind() 去营业厅把手机号和你本人绑定结构体地址问题nicif_ 不是指针它是一个实实在在的结构体变量结构体变量一旦创建它的内部所有成员就已经存在内存里了不需要提前初始化也不需要赋值就能取地址即使里面的值是随机的、脏的变量本身是存在的struct SimbricksBaseIf *netif nicif-net.base;struct SimbricksBaseIf *pcieif nicif-pcie.base;为什么这两行没问题因为1.nicif是一个有效指针你传的是nicif_2.nicif-net已经存在结构体成员3.nicif-net.base也已经存在4. 所以nicif-net.base是合法地址这里仅仅是取地址没有读里面的值CXLCXLCacheCXL Type34.1 Type 3内存扩展器Classic 模式完整链条用户运行 gem5.opt x86-cxl-type3-with-classic.py │ ▼ [Python 初始化阶段] 1. 创建 SimpleBoard / X86Board 2. 配置 PrivateL1PrivateL2SharedL3CacheHierarchy (L1 32K/32K L2 512K L3 96M, MESI) 3. 创建 DIMM_DDR5_4400 × 2 - memory[0]: 3GB 主机内存 0x00000000 - memory[1]: 8GB CXL 内存 0xC0000000 (CXL 地址空间) 4. 注入 CXLBridge位于 L3 缓存与 CXL DRAM 控制器之间 5. set_kernel_disk_workload(vmlinux, disk_img, cmd) 6. simulator.run() │ ▼ [gem5 事件驱动模拟启动] 7. KVM CPU 快速启动 Linux 内核跳过 Boot 细节 8. Linux 内核通过 ACPI/SRAT 发现 CXL NUMA 节点 9. m5 exit 事件触发 → 切换到 TIMING/O3 CPU │ ▼ [基准测试执行阶段] 10. 用户程序发起内存访问例如 numactl --membind1 ./test │ ▼ [CPU 访问 CXL 内存的周期级模拟路径] CPU 核心O3/TIMING → L1D CacheMESI 查找 → L2 CacheMESI 查找 → L3 Cache共享MESI 查找 → Cache Miss → 发送 MemReq 包到内存总线 │ ▼ CoherentXBar一致性总线 → 地址解码命中 CXL 地址范围 → Yes → 路由到 CXLBridge │ ▼ CXLBridge::BridgeResponsePort::recvTimingReq() → 检查地址是否在 cxl_range 内 → 计算 total_delay bridge_lat proto_proc_lat → 设置 pkt-cxl_cmd M2SReq读/ M2SRwD写 → 将包推入 reqQueue调度 schedTimingReq 事件 │ [等待 total_delay 周期] │ ▼ CXLBridge::BridgeRequestPort 发送请求 → CXL 设备侧 MemCtrl::recvTimingReq() → DRAM Interface 计算 DRAM 时序tCL, tRCD, tRP... → 生成响应包pkt-cxl_cmd S2MDRS含数据 │ [等待 DRAM 访问延迟] │ ▼ CXLBridge::BridgeResponsePort 接收响应 → 推入 respQueue → 调度 schedTimingResp 事件 │ [等待 bridge_lat 返回延迟] │ ▼ CoherentXBar → L3 Cache 填充 → L2 Cache 填充 → L1D Cache 填充 → CPU 寄存器文件获得数据 │ ▼ [周期计数更新统计延迟/带宽指标]CXLBridgem5m5 是 gem5 模拟器的核心 Python 模块是用户与 gem5 底层 C 仿真引擎交互的入口也是 SimCXL基于 gem5 扩展中控制仿真全生命周期的核心接口。核心定位m5 模块由 gem5 构建系统通过 pybind11 自动生成绑定 C 代码 手动编写的 Python 封装组成是 Python 层与 C 层的 “桥梁”。所有仿真操作实例化系统、启动仿真、读取统计信息、控制仿真流程都通过 m5 模块完成比如m5.instantiate()将 Python 定义的系统配置转化为 C 仿真对象m5.simulate()启动事件驱动的仿真循环m5.stats.dump()导出仿真统计数据m5.exit()终止仿真。这是 SimCXL/gem5 中从高层易用的 Python 组件封装到底层 C 绑定的调用链路核心是 “把用户写的简洁 Python 配置转化为底层 C 仿真对象”C语言1.socket()创建一个通信端点电话2.bind()给 Socket 绑定一个路径地址装电话号码3.listen()开始等待别人连接等电话4.fcntl()修改文件描述符属性设置非阻塞5.close()关闭 Socket释放资源挂电话strlen(字符串)作用计算字符串长度这里检查Socket 路径太长会超出系统限制无法绑定listen监听函数作用开始等待别人来连接参数5等待连接的队列长度最多等 5 个socket(地址族, 类型, 协议)AF_UNIX本地进程间通信机器内SOCK_STREAM可靠字节流TCP 模式返回值listen_fd文件描述符相当于电话的 ID后面所有操作都靠它bind绑定函数非常重要作用把 Socket 和文件路径绑定在一起相当于给电话装上号码别人通过这个路径就能找到你strncpy字符串拷贝安全复制字符串防止超长溢出代理DNS 解析失败— Clash 配置了使用 Cloudflare 的 DoHDNS over HTTPSdns.cloudflare.com/dns-query但这个 DNS 服务器本身就被墙了所以连 DNS 都查不了。模式是直连— 当前是DIRECT直连模式没有走代理所以即使 DNS 解析出来GitHub 的连接也大概率超时。去左侧点「代理」把模式从「直连」改成「规则」或「全局」规则模式— 按规则分流推荐全局模式— 所有流量走代理用于测试宏宏 代码替换工具文本替换宏就是给一段代码 / 内容起个别名编译之前编译器会把别名自动替换成真实内容纯文本替换不理解语法只是无脑替换
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2490153.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!