Atlas300I推理卡驱动适配Linux 6.12+内核
Ascend 310 NPU 驱动适配 Linux Kernel 6.12.43 修复记录概述目前华为官方的提供的所有AI卡驱动都未支持高版本Linux内核6.8以上博主花了大量时间去研究华为驱动源码最终功夫不负有心人成功将Atlas300I卡以及Atlas300I Pro的驱动适配到了Linux-6.12.43内核版本按道理来讲6.8以上的版本都可以进行驱动包安装适配工作不易请大家点个关注在此小编谢谢大家的支持了编译好的驱动包我也会开源有需要的小伙伴自行获取即可。资源获取修复清单1.do_exit()/complete_and_exit()→kthread_complete_and_exit()原因Kernel 6.12 移除了do_exit()和complete_and_exit()的导出符号仅保留kthread_complete_and_exit()。修改文件文件修改内容driver/kernel/drv_davinci_intf_host/davinci_intf_init.c在#include linux/version.h之后添加条件编译宏将do_exit(0)替换为kthread_complete_and_exit(NULL, 0)driver/kernel/drv_devmng/drv_devmng_host/ascend910/devdrv_manager.c同上driver/kernel/dms/status/dms_osc_freq.c同上修改方式以davinci_intf_init.c为例// 在 #include linux/version.h 之后添加#ifLINUX_VERSION_CODEKERNEL_VERSION(6,0,0)#ifndefdo_exit#definedo_exit(x)do{kthread_complete_and_exit(NULL,x);}while(0)#endif#endif同时将源文件中的do_exit(0);调用替换为kthread_complete_and_exit(NULL, 0);。2.profile_event_register()/profile_event_unregister()移除原因Kernel 6.12 完全移除了profile_event_register和profile_event_unregister及PROFILE_TASK_EXIT。修改方式一—Makefile_mini全局宏替换# driver/kernel/Makefile_mini 中添加 ccflags-y -Dprofile_event_register\(a,b\)0 ccflags-y -Dprofile_event_unregister\(a,b\)0 ccflags-y -DPROFILE_TASK_EXIT0修改方式二— 源文件级别替换Makefile 宏对部分编译单元不生效时需要文件修改内容driver/kernel/drv_devmng/drv_devmng_host/ascend910/devdrv_manager.cprofile_event_register(...)→ret 0;driver/kernel/dbl/uda/uda_access.cprofile_event_register/unregister(...)→(void)0;driver/kernel/ts_drv_common/tsdrv_nvme/logic/logic_cq.c同上driver/kernel/soft_fault/soft_fault.c同上driver/kernel/dms/core/dms_init.c同上3.pte_offset_map()→ 内联宏替换原因Kernel 6.12 中pte_offset_map()变为static inline函数内部调用未导出的__pte_offset_map()外部函数。由于pte_offset_map()在#include linux/mm.h时已展开为内联调用在 include 之后定义__pte_offset_map宏无效必须#undef pte_offset_map并重新定义。修改文件3 个devmm_dev.c文件driver/kernel/svmdrv/common/devmm_dev.cdriver/kernel/svmdrv/pmaster/devmm_dev.cdriver/kernel/svmdrv/pmaster/common/devmm_dev.c修改方式在所有#include之后、第一个非 include 行之前添加#ifLINUX_VERSION_CODEKERNEL_VERSION(6,0,0)/* pte_offset_map() in kernel 6.12 calls unexported __pte_offset_map(); override it */#undefpte_offset_map#definepte_offset_map(pmd,addr)((pte_t*)pmd_page_vaddr(*(pmd))pte_index(addr))#endif注意此修复块必须放在#ifdef CFG_FEATURE_VFIO块之外确保所有编译路径都能生效。4.PDE_DATA()→pde_data()原因Kernel 5.17 移除了PDE_DATA()宏替换为pde_data()内联函数。修改方式一—Makefile_mini全局宏仅对部分模块生效不推荐作为唯一方案ccflags-y -DPDE_DATA\(inode\)pde_data\(inode\)修改方式二— 源文件级别替换推荐更可靠在以下 11 个文件的#include区域之后添加#ifndefPDE_DATA#definePDE_DATA(inode)pde_data(inode)#endif修改文件清单文件driver/kernel/event_sched/comm/soft_sched/irq_sched/esched_table_proc_fs.cdriver/kernel/drv_devmng/drv_devmng_host/ascend310/drv_log.cdriver/kernel/drv_devmng/drv_devmng_host/ascend910/drv_log.cdriver/kernel/ts_drv_common/tsdrv_dev/tsdrv_id_config_dfx.cdriver/kernel/ts_drv_common/tsdrv_dev/tsdrv_ctx_dfx.cdriver/kernel/ts_drv_common/tsdrv_dev/tsdrv_event_id_dfx.cdriver/kernel/queue/common/queue_proc_fs.cdriver/kernel/svmdrv/pmaster/comm/svm_master_proc_fs.cdriver/kernel/svmdrv/pmaster/common/svm_proc_fs.cdriver/kernel/svmdrv/pmaster/svm_shmem_procfs.cdriver/kernel/svmdrv/common/svm_proc_fs.c注意使用#ifndef PDE_DATA而非#if LINUX_VERSION_CODE KERNEL_VERSION(5,17,0)因为部分文件未包含linux/version.h使用版本号检查会导致编译错误。5.follow_pfn()→follow_pfnmap_start/end()原因Kernel 6.12 移除了follow_pfn()导出符号替换为follow_pfnmap_start()/follow_pfnmap_end()API。修改文件已在华为官方代码中修复文件修改内容driver/kernel/dev_inc_open/inc/devdrv_interface.h提供兼容的内联follow_pfn()实现内部调用follow_pfnmap_start/enddriver/kernel/dev_inc/inc/devdrv_interface.h同上6..ko.xz解压 __versions段剥离原因Kernel 6.12 DKMS 编译后可能产生.ko.xz压缩格式需要解压后才能操作Intewell 内核未启用CONFIG_MODVERSIONS.ko中的__versions段 CRC 校验会失败需用objcopy移除修改文件driver/script/run_driver_install.sh修改内容在driver_dkms_insmod()函数约 line 612中添加# Decompress .ko.xz files and strip __versions (needed for Intewell kernel 6.12)for__koxzin${sys_path}/*.ko.xz;do[-f$__koxz]||continuelog[INFO]Decompressing${__koxz##*/}unxz$__koxz2/dev/null__ko${__koxz%.xz}[-f$__ko]objcopy --remove-section__versions$__ko2/dev/nulldonefor__koin${sys_path}/*.ko;do[-f$__ko]objcopy --remove-section__versions$__ko2/dev/nulldonedepmod-a/dev/null217. grep 警告修复原因makeself-header.sh中grep -o -E \-\-[^ ]导致 grep 报错 多余的 和 “unrecognized option”。修改文件driver/script/makeself-header.shline 354修改# 修改前grep-o-E\-\-[^ ]# 修改后grep-o-E-e--[^ ]*使用-e标志显式传递模式避免 grep 将--[^ ]*解析为选项。8. GCC 内置头文件路径原因内核编译使用-nostdinc导致 GCC 内置头文件stdarg.h,stdbool.h等找不到。修改文件driver/kernel/Makefile_miniccflags-y -isystem /usr/lib/gcc/aarch64-linux-gnu/12/include ccflags-y -isystem /usr/lib/gcc/aarch64-openEuler-linux/12/include9. 警告抑制原因Kernel 6.12 头文件变化导致原有代码触发大量-Werror警告。修改文件driver/kernel/Makefile_miniexport CUSTOM_OS_CCFLAGS : -Wno-errormissing-prototypes -Wno-undef -Wall -Werror \ -Wno-errorvla -funsigned-char -Wno-errorimplicit-function-declaration \ -Wno-errorunused-variable -Wno-errorreturn-typeCANN 层面修复非驱动10.Ascend310.ini平台配置缺失原因CANN 8.3.RC1 将Ascend310.ini重命名为Ascend031.iniatc 使用--soc_versionAscend310时找不到配置文件。修复创建符号链接cd/usr/local/Ascend/ascend-toolkit/latest/aarch64-linux/data/platform_config/ln-sfAscend031.ini Ascend310.ini# 如有其他 platform_config 目录也需处理cd/usr/local/Ascend/ascend-toolkit/8.3.RC1/compiler/data/platform_config/ln-sfAscend031.ini Ascend310.ini11. Python_ctypes模块缺失原因自定义编译的 Python 3.12 编译时未正确链接libffi-devel导致_ctypes模块未构建。修复重新全量编译 Python 3.12确保安装了libffi-devel、xz-devel等开发库并设置正确的编译环境变量。完整修改文件清单#文件路径修复内容1driver/kernel/Makefile_miniGCC include 路径、profile_event 宏、PDE_DATA 宏、警告抑制2driver/kernel/drv_davinci_intf_host/davinci_intf_init.cdo_exit → kthread_complete_and_exit3driver/kernel/drv_devmng/drv_devmng_host/ascend910/devdrv_manager.cdo_exit、profile_event 替换4driver/kernel/dms/status/dms_osc_freq.cdo_exit → kthread_complete_and_exit5driver/kernel/dbl/uda/uda_access.cprofile_event 替换6driver/kernel/ts_drv_common/tsdrv_nvme/logic/logic_cq.cprofile_event 替换7driver/kernel/soft_fault/soft_fault.cprofile_event 替换8driver/kernel/dms/core/dms_init.cprofile_event 替换9driver/kernel/svmdrv/common/devmm_dev.cpte_offset_map 重定义10driver/kernel/svmdrv/pmaster/devmm_dev.cpte_offset_map 重定义11driver/kernel/svmdrv/pmaster/common/devmm_dev.cpte_offset_map 重定义12driver/kernel/event_sched/comm/soft_sched/irq_sched/esched_table_proc_fs.cPDE_DATA → pde_data13driver/kernel/drv_devmng/drv_devmng_host/ascend310/drv_log.cPDE_DATA → pde_data14driver/kernel/drv_devmng/drv_devmng_host/ascend910/drv_log.cPDE_DATA → pde_data15driver/kernel/ts_drv_common/tsdrv_dev/tsdrv_id_config_dfx.cPDE_DATA → pde_data16driver/kernel/ts_drv_common/tsdrv_dev/tsdrv_ctx_dfx.cPDE_DATA → pde_data17driver/kernel/ts_drv_common/tsdrv_dev/tsdrv_event_id_dfx.cPDE_DATA → pde_data18driver/kernel/queue/common/queue_proc_fs.cPDE_DATA → pde_data19driver/kernel/svmdrv/pmaster/comm/svm_master_proc_fs.cPDE_DATA → pde_data20driver/kernel/svmdrv/pmaster/common/svm_proc_fs.cPDE_DATA → pde_data21driver/kernel/svmdrv/pmaster/svm_shmem_procfs.cPDE_DATA → pde_data22driver/script/makeself-header.shgrep 警告修复23driver/script/run_driver_install.sh.ko.xz 解压 __versions 剥离打包 .run 文件前提条件所有上述修改已应用到Ascend_hdk_310_npu_driver_24.1.1.3/目录系统已安装pigz用于压缩打包命令cd/home/xt/Ascend_Drv_asc310p_Rebuild/Ascend_hdk_310_npu_driver_24.1.1.3 ./driver/script/makeself.sh\--header./driver/script/makeself-header.sh\--help-header ./driver/script/help.info\--pigz\--complevel4\--nomd5\--sha256\/home/xt/Ascend_Drv_asc310p_Rebuild/Ascend_hdk_310_npu_driver_24.1.1.3\/home/xt/Ascend_Drv_asc310p_Rebuild/output_rebuild/Ascend-hdk-310-npu-driver_24.1.1.3_linux-aarch64_k6.12.43.run\ASCEND DRIVER RUN PACKAGE\./driver/script/install.sh输出打包完成后.run文件位于output_rebuild/Ascend-hdk-310-npu-driver_24.1.1.3_linux-aarch64_k6.12.43.run安装与验证# 卸载旧驱动./Ascend-hdk-310-npu-driver_24.1.1.3_linux-aarch64_k6.12.43.run--uninstall# 安装新驱动./Ascend-hdk-310-npu-driver_24.1.1.3_linux-aarch64_k6.12.43.run--full--install-for-all# 验证模块加载lsmod|grepascend# 应看到 ascend_queue、drv_devmm_host 等所有模块# 验证 ACLpython3-cimport acl; acl.init(); ret acl.rt.set_device(0); print(set_device ret , ret); acl.finalize()# 预期输出: set_device ret 0Kernel 6.12 API 变更参考旧 API新 API / 替代方案影响模块do_exit()kthread_complete_and_exit()davinci_intf, devmng, dmscomplete_and_exit()kthread_complete_and_exit()(未导出同上)profile_event_register()无替代设为 no-opdevmng, uda, tsdrv, soft_fault, dmsprofile_event_unregister()无替代设为 no-op同上__pte_offset_map()内联实现pmd_page_vaddr() pte_index()svmdrv (devmm_dev)PDE_DATA(inode)pde_data(inode)queue, svmdrv, event_sched, devmng, tsdrvfollow_pfn()follow_pfnmap_start/end()svmdrv (devmm_dev) — 已在 devdrv_interface.h 中处理注意事项Makefile_minivs 顶层MakefileDKMS 编译使用的是顶层Makefile从dkms.conf中MAKE[0]指定不是Makefile_mini。确保两个文件的 ccflags 保持同步。#ifndefvs#if LINUX_VERSION_CODE在未包含linux/version.h的源文件中使用#ifndef PDE_DATA比#if LINUX_VERSION_CODE KERNEL_VERSION(...)更安全避免LINUX_VERSION_CODE未定义导致的编译错误。objcopy --remove-section__versionsIntewell 内核编译时未启用CONFIG_MODVERSIONS但驱动模块中的__versions段包含 CRC 校验值加载时校验不通过。必须剥离该段。驱动适配结果联系方式VX-GZHCrazyNET资源获取回复“ascend310drv”即可。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2594050.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!