CANN/pyasc算子编程接口
asc.language.adv.get_special_mdl_config【免费下载链接】pyasc本项目为Python用户提供算子编程接口支持在昇腾AI处理器上加速计算接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyascasc.language.adv.get_special_mdl_config(intrinsics_limit: bool | None False, batch_loop: bool | None False, do_mte2_pre_load: int | None 0, is_vec_nd2_nz: bool | None False, is_per_tensor: bool | None False, has_anti_quant_offset: bool | None False) → MatmulConfig用于配置SpecialMDL模板的参数获取自定义SpecialMDL模板。对应的Ascend C函数原型__aicore__ constexpr MatmulConfig GetSpecialMDLConfig(const bool intrinsicsLimit false, const bool batchLoop false, const uint32_t doMTE2Preload 0, const bool isVecND2NZ false, bool isPerTensor false, bool hasAntiQuantOffset false)参数说明intrinsics_limit: 用于设置参数intrinsicsCheck。参数取值如下False当左矩阵或右矩阵在单核上内轴大于等于65535时不使能循环执行数据的搬入默认值。True当左矩阵或右矩阵在单核上内轴大于等于65535时使能循环执行数据的搬入。do_mte2_pre_load: 用于设置参数enVecND2NZ。参数取值如下False不使能通过vector指令进行ND2NZ默认值。True使能通过vector指令进行ND2NZ。is_vec_nd2_nz: 用于设置参数enVecND2NZ。参数取值如下False不使能通过vector指令进行ND2NZ默认值。True使能通过vector指令进行ND2NZ。batch_loop: 用于设置参数isNBatch。参数取值如下False不使能多Batch默认值。True使能多Batch。is_per_tensor: 用于设置参数isPerTensor。参数取值如下Trueper tensor量化。Falseper channel量化。has_anti_quant_offset: 用于设置参数hasAntiQuantOffset。返回值说明MatmulConfig结构体。调用示例mm_cfg asc.adv.get_special_mdl_config() mm asc.adv.Matmul(a_type, b_type, c_type, bias_type, mm_cfg) asc.adv.register_matmul(pipe, workspace, mm, tiling) mm.set_tensor_a(gm_a) mm.set_tensor_b(gm_b) mm.set_bias(gm_bias) mm.iterate_all(gm_c)【免费下载链接】pyasc本项目为Python用户提供算子编程接口支持在昇腾AI处理器上加速计算接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2599910.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!