CANN/ops-tensor API 实现状态
ops-tensor API 实现状态【免费下载链接】ops-tensorops-tensor 是 CANN Compute Architecture for Neural Networks算子库中提供张量类计算的基础算子库采用模块化设计支持灵活的算子开发和管理。项目地址: https://gitcode.com/cann/ops-tensor版本信息当前版本: v1.0.0更新日期: 2026-03-20开发阶段: Phase 1 - Elementwise Binary (Add)✅ 已实现接口 (Phase 1)1. 句柄管理acltensorCreate- 创建库句柄acltensorDestroy- 销毁库句柄2. 张量描述符acltensorCreateTensorDescriptor- 创建张量描述符acltensorDestroyTensorDescriptor- 销毁张量描述符3. 操作描述符acltensorCreateElementwiseBinary- 创建二元元素操作描述符acltensorDestroyOperationDescriptor- 销毁操作描述符4. Plan 管理acltensorCreatePlanPreference- 创建 Plan 偏好acltensorDestroyPlanPreference- 销毁 Plan 偏好acltensorCreatePlan- 创建执行 PlanacltensorDestroyPlan- 销毁 Plan5. 执行函数acltensorElementwiseBinaryExecute- 执行二元元素操作6. 辅助工具acltensorGetErrorString- 获取错误字符串acltensorGetVersion- 获取库版本号7. 已实现算子Add(张量加法) -src/add/8. 支持范围数据类型: FP32 (ACLTENSOR_R_32F)一元操作符: IDENTITY (ACLTENSOR_OP_IDENTITY)二元操作符: ADD (ACLTENSOR_OP_ADD)算法: DEFAULT (ACLTENSOR_ALGO_DEFAULT)⏸️ 待实现接口Phase 2 - Elementwise 扩展必须实现acltensorCreateElementwiseTrinary- 三元元素操作描述符acltensorElementwiseTrinaryExecute- 执行三元元素操作重要功能acltensorEstimateWorkspaceSize- 估算工作空间大小acltensorOperationDescriptorSetAttribute- 设置操作描述符属性acltensorOperationDescriptorGetAttribute- 获取操作描述符属性可选功能acltensorHandleResizePlanCache- 调整 Plan 缓存acltensorHandleWritePlanCacheToFile- 写入缓存到文件acltensorHandleReadPlanCacheFromFile- 从文件读取缓存acltensorPlanPreferenceSetAttribute- 设置 Plan 偏好属性acltensorPlanGetAttribute- 获取 Plan 属性Phase 3 - Contraction Reduction必须实现acltensorCreateContraction- 创建张量收缩描述符acltensorContract- 执行张量收缩 (D αA·B βC)acltensorCreateReduction- 创建张量归约描述符acltensorReduce- 执行张量归约Phase 4 - Permutation可选功能acltensorCreatePermutation- 创建张量排列描述符acltensorPermute- 执行张量排列/转置⏸️ 待实现操作符一元操作符 (21个)必须实现SQRT, RELU, SIGMOID, TANH, EXP, LOG, ABS, GELU, SILU重要功能CONJ, RCP, NEG可选功能SIN, COS, TAN, SINH, COSH, ASIN, ACOS, ATAN, CEIL, FLOOR二元操作符 (6个)必须实现MUL, MAX, MIN重要功能SUB, DIV可选功能POW⏸️ 待支持数据类型必须实现FP16 (ACLTENSOR_R_16F)BF16 (ACLTENSOR_R_16BF)重要功能FP64 (ACLTENSOR_R_64F)可选功能INT8, UINT8, INT32, UINT32Complex FP32 (ACLTENSOR_C_32F)Complex FP64 (ACLTENSOR_C_64F) 实现进度统计类别已实现待实现总计API 接口151934操作符22628数据类型1910算子1--总体完成度: Phase 1 (Elementwise Binary - Add) ✅ 开发路线图Phase 1: Elementwise Binary - Add ✅ (已完成)基础架构搭建句柄管理张量描述符FP32Add 算子实现Add 算子测试打包流程Phase 2: Elementwise 扩展 (下一步)多数据类型支持 (FP16/BF16/FP64)更多一元操作符SQRT, RELU, SIGMOID, TANH, EXP, LOG, ABS, GELU, SILU更多二元操作符MUL, MAX, MINElementwise TrinaryPlan 缓存机制工作空间估算属性查询接口Phase 3: Contraction ReductionContraction 接口与实现Reduction 接口与实现复数数据类型支持性能优化Phase 4: Permutation 高级特性Permutation 接口与实现JIT 编译支持Auto-tune 机制多 GPU 支持 当前限制数据类型: 仅支持 FP32操作符: 仅支持 IDENTITY 和 ADD操作类型: 仅支持 Elementwise Binary算子: 仅实现 Add 算子不支持: workspace 复用、Plan 缓存、属性查询 设计参考API 设计: 参考 hiptensor/cuTensor算子注册机制: 参考 rocFFT测试框架: 自研轻量级测试框架文档维护: 请在实现新接口时及时更新本文档【免费下载链接】ops-tensorops-tensor 是 CANN Compute Architecture for Neural Networks算子库中提供张量类计算的基础算子库采用模块化设计支持灵活的算子开发和管理。项目地址: https://gitcode.com/cann/ops-tensor创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2599825.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!