CANN驱动设备错误码查询
dcmi_get_device_errorcode_string【免费下载链接】driver本项目是CANN提供的驱动模块实现基础驱动和资源管理及调度等功能使能昇腾芯片。项目地址: https://gitcode.com/cann/driver函数原型int dcmi_get_device_errorcode_string(int card_id, int device_id, unsigned int error_code, unsigned char *error_info, int buf_size)功能说明查询设备故障描述。参数说明参数名称输入/输出类型描述card_id输入int设备ID当前实际支持的ID通过dcmi_get_card_list接口获取。device_id输入int芯片ID通过dcmi_get_device_id_in_card接口获取。取值范围如下NPU芯片[0, device_id_max-1]。MCU芯片mcu_id。说明device_id_max值为1当device_id为0时表示NPU芯片当device_id为1时表示MCU芯片。error_code输入unsigned int要查询的错误码通过dcmi_get_device_errorcode_v2接口获取。error_info输出unsigned char *对应的错误描述。buf_size输入int传入的error_info取值范围是大于等于48Byte。若设置的error_info小于48Byte则系统报错。若设置的error_info在48~255Byte之间则在《健康管理故障定义》中的故障码查询出来的故障信息为简化信息。若设置的error_info大于等于256Byte则查询出来的故障信息为实际故障信息。返回值说明类型描述int处理结果成功返回0。失败返回码请参见return_codes。异常处理无。约束说明调用该接口查询到的信息仅代表当前芯片设计了这种错误码类型具有上报这种故障类型的能力但不代表当前已经使用这个错误码。当前芯片已经支持的错误码请按照参数说明表中error_code参数的描述获取。表 1不同部署场景下的支持情况产品形态物理机场景裸机root用户物理机场景裸机运行用户组非root用户物理机普通容器场景root用户Atlas 900 A2 PoD 集群基础单元YYYAtlas 800T A2 训练服务器YYYAtlas 800I A2 推理服务器YYYAtlas 200T A2 Box16 异构子框YYYA200I A2 Box 异构组件YYYAtlas 300I A2 推理卡YYYAtlas 300T A2 训练卡YYY注Y表示支持N表示不支持NA表示不涉及当前未规划此场景。调用示例#define ERROR_CODE_MAX_NUM (128) #define BUF_SIZE (256) … int ret 0; int card_id 0; int device_id 0; int errorcount 0; unsigned int error_code_list[ERROR_CODE_MAX_NUM] {0}; unsigned char error_info[BUF_SIZE] {0}; ret dcmi_get_device_errorcode_v2(card_id, device_id, errorcount, error_code_list, ERROR_CODE_MAX_NUM); if ((ret ! 0) || (errorcount 0)){ //todo:记录日志 return ret; } ret dcmi_get_device_errorcode_string(card_id, device_id, error_code_list[0], error_info, BUF_SIZE); if (ret ! 0) { //todo:记录日志 return ret; } …【免费下载链接】driver本项目是CANN提供的驱动模块实现基础驱动和资源管理及调度等功能使能昇腾芯片。项目地址: https://gitcode.com/cann/driver创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2598099.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!