CANN/hccl:rank table配置资源信息(Atlas 300I Duo 推理卡)
rank table配置资源信息Atlas 300I Duo 推理卡【免费下载链接】hccl集合通信库Huawei Collective Communication Library简称HCCL是基于昇腾AI处理器的高性能集合通信库为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl针对Atlas 300I Duo 推理卡以包含两个AI Server每个AI Server内2个Device为例rank table文件配置示例如下[!NOTE]说明 rank table文件为JSON格式本节所示JSON文件示例中的注释仅为方便理解实际使用时请删除JSON文件中的注释。{ status:completed, // rank table可用标识completed为可用 version:1.0, // rank table模板版本信息配置为1.0 server_count:2, // 参与训练的AI Server数目此例中有两个AI Server server_list: [ { server_id:node_0, //AI Server标识String类型请确保全局唯一 device:[ // AI Server中的Device列表 { device_id:0, // 处理器的物理ID device_ip:192.168.1.8, // 处理器真实网卡IP rank_id:0 // rank的标识从0开始配置请确保全局唯一 }, { device_id:1, device_ip:192.168.1.9, rank_id:1 } ] }, { server_id:node_1, device:[ { device_id:0, device_ip:192.168.2.8, rank_id:2 }, { device_id:1, device_ip:192.168.2.9, rank_id:3 } ] } ] }rank table配置文件说明如下所示一级配置项二级配置项三级配置项配置说明status必选。rank table可用标识。- completed表示rank table可用。- initializing表示rank table不可用。version必选。rank table模板版本信息。配置为1.0。server_count必选。参与集合通信的AI Server个数。server_list必选。参与集合通信的AI Server列表。server_id必选。AI Server标识字符串类型长度小于等于64请确保全局唯一。配置示例node_0。device必选。AI Server中的Device列表。device_id必选。AI处理器的物理ID即Device在AI Server上的序列号。可通过执行“ls /dev/davinci*”命令获取AI处理器的物理ID。例如显示/dev/davinci0表示AI处理器的物理ID为0。取值范围[0实际Device数量-1]。注意“device_id”配置项的优先级高于环境变量“ASCEND_DEVICE_ID”。device_ip必选。AI处理器集成网卡IP全局唯一要求为常规IPv4或IPv6格式。可以在当前AI Server执行指令“cat /etc/hccn.conf”获取网卡IP例如address_0xx.xx.xx.xxnetmask_0xx.xx.xx.xxnetdetect_0xx.xx.xx.xx查询到的address_xx即为网卡IPaddress后的序号为AI处理器的物理ID即device_id后面的ip地址即为需要用户填入的该device对应的网卡IP。rank_id必选。rank唯一标识请配置为整数从0开始配置且全局唯一取值范围[0, 总Device数量-1]为方便管理建议rank_id按照Device物理连接顺序进行排序即将物理连接上较近的Device编排在一起。例如若device_ip按照物理连接从小到大设置则rank_id也建议按照从小到大的顺序设置。【免费下载链接】hccl集合通信库Huawei Collective Communication Library简称HCCL是基于昇腾AI处理器的高性能集合通信库为计算集群提供高性能、高可靠的通信方案项目地址: https://gitcode.com/cann/hccl创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2598377.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!