背景
vtune
,perf
, nsight system
等基础测试工具,都是用过的,但是没有记录,都逐渐忘了。所以写这篇博客总结记录一下,只要以后发现新的用法,就记得来编辑补充一下
perf
比较基础的用法:
先改这个环境变量,改成
1
1
1似乎就够用,这条命令据说是只影响当前窗口?
直接运行可执行程序,加上-g
为了显示符号信息
sudo sysctl -w kernel.perf_event_paranoid=1
sudo perf record -g ./../BenchBF3/bin_dpu/test_cpu
sudo perf report
report
进入之后,包含children
:当前函数所有成员cpu
占用率,以及self
:当前函数占用率
这里很可能你都看不到到底是在哪个函数花的时间。这时候需要你不断zoom out
,不停点进去就能看到。