面试真题集(三):CUDA核心概念与内存优化专题
引言进阶篇的核心是让你从“会写”到“会优化”。本专题精选20道面试真题,聚焦CUDA内存层次、合并访问、共享内存、寄存器压力等进阶篇核心内容,帮你系统检验学习成果。一、选择题(6题)1.1 关于CUDA内存层次,下列说法正确的是?(⭐⭐)A. 寄存器的访问速度比共享内存慢B. 全局内存的访问延迟约400周期,共享内存约30周期C. 常量内存的容量比全局内存大D. 本地内存(local memory)位于片上存储正确答案:B深度解析:寄存器最快(1周期),共享内存约30周期,全局内存约400周期。本地内存虽然线程私有,但物理上位于全局内存(显存),访问速度与全局内存相当。常量内存容量仅64KB,远小于全局内存。本题考察对内存层次速度的基本认知。1.2 关于寄存器溢出,下列说法错误的是?(⭐⭐⭐)A. 寄存器溢出会导致变量被存入本地内存B. 编译时加-Xptxas=-v可以查看是否溢出C. 寄存器溢出后,访问速度从1周期降到约400周期D. 寄存器溢出通常发生在每个线程使用寄存器太少时正确答案:D深度解析:寄存器溢出发生在每个线程需要的寄存器超过
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2496036.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!