使用perf查看热点函数和系统调用最大延迟函数

1、安装perf工具

1.1、ubuntu 18.04 x86下的安装

安装sudo apt install linux-source

sudo apt install linux-tools-`uname -r` # ubuntu 18.04虚拟机实操可行

1.2、ubuntu 18.04 ARM下的安装

  • 参考 Nvidia Jetson系列产品安装Perf

  • ​ARM64版本的Ubuntu上安装perf

与参考文章不同之处:

  • 须使用4.9内核版本的NVIDIA L4T 32.7.1:​Jetson Linux R32.7.1 Release Page

因为内核ARM机器的内核版本为:

linux系统如何查看内核版本、操作系统版本等信息

  • 最好安装sudo apt install linux-source

  • 安装依赖包文件到如此程度

到kernel/kernel-4.9/tools/perf目录下执行make,编译器会自动检测依赖项。缺少的依赖项可通过apt安装。

perf ARM可执行文件和运行脚本已上传,下载路径

2、perf使用介绍(查找CPU热点函数。

性能调优时,我们通常需要分析查找到程序CPU占比高的热点代码片段,这便需要使用 perf record 记录单个函数级别的统计信息,并使用 perf report 来显示统计结果;

主要使用到perf的这两个指令

perf record 和 perf report

2.1、获取XXX进程的perf数据:

首先启动XXX进程,使用ps -ef | grep XXX查看进程号

  • sudo perf record -e cpu-clock -g -p 67925

-g 选项是告诉perf record额外记录函数的调用关系

-e cpu-clock 指perf record监控的指标为cpu周期

-p 指定需要record的进程pid

程序运行完之后,perf record会生成一个名为perf.data的文件,如果之前已有,那么之前的perf.data文件会被覆盖

  • 获得这个perf.data文件之后,就需要perf report工具进行查看

perf report -i perf.data

-i 指定要查看的文件

 以诊断XXX进程为例,report结果:

$sudo perf report  -i perf.data

可以看到crc32_do函数使用cpu 20.58%

2.2、使用火焰图

  • 火焰图下载仓库地址:​编辑GitHub - brendangregg/FlameGraph: Stack trace visualizer

  • 下载火焰图工程代码,并添加至Linux系统环境变量,如/opt/FlameGraph

  • 使用参考 arm linux 生成火焰图 

  • 基于perf运行火焰图脚本,需要root权限

online cpu火焰图

On-CPU生成脚本 

#!/bin/bash

export PATH=/tmp:$PATH

rm -f perf.*
ppid=`ps -ef | grep "XXX" | grep -v "grep" | awk '{print $1}'`
if [[ -z "${ppid}" ]]; then
  echo "XXX not running"
  exit -1
fi
echo "pid is $ppid"

./perf record -F 99  -e cpu-clock -p ${ppid} -g -- sleep 60
./perf script -i perf.data &> perf.unfold
offline火焰图
offline火焰图

Off-CPU生成脚本

#!/bin/bash

export PATH=$PATH:/opt/FlameGraph

rm -f perf.*
ppid=`ps -ef | grep -i "XXX" | grep -v "grep" | awk '{print $2}'`
if [[ -z "${ppid}" ]]; then
  echo "app not running"
  exit -1
fi
echo "pid is $ppid"

sudo offcputime-bpfcc -df -p ${ppid} 120 > out.stacks # 120s
flamegraph.pl --color=io --title="Off-CPU Time Flame Graph" --countname=us out.stacks > perf_offline.svg

3、查看系统调用延迟

perf sched latency -s max是一个用于查看系统调度延迟的命令。具体而言,它用于查看最大的调度延迟。系统调度延迟是指在操作系统中,从一个任务被触发到它被实际执行之间的时间延迟。

perf sched latency命令可以解析当前目录下的perf.data文件。“-s”表示进行排序,后接参数“max”表示按照最大延迟时间大小排序。

其它参考

C++:perf + Flame Graph火焰图生成

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/602555.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

24年考研管综199真题PDF共18页

整理了24年考研管综199真题PDF共18页,包含问题求解,条件充分性判断,逻辑推理,写作,几个部分,希望对大家有所帮助 一、问题求解 这部分包含15道小题,每题3分,共45分。题目类型为选择…

一文搞懂大厂商品中心设计!

点击下方“JavaEdge”,选择“设为星标” 第一时间关注技术干货! 免责声明~ 任何文章不要过度深思! 万事万物都经不起审视,因为世上没有同样的成长环境,也没有同样的认知水平,更「没有适用于所有人的解决方案…

linux的寻找文件

题目 介绍 有一个非常重要的文件 sources.list)但是你忘了 它在哪了,你依稀记得它在 /etc/ 目录下,现在要你 把这个文件找出来,然后设置成自己(shiyanlou 用 户)可以访问,但是其他用户并不能访问。 目标 1.找到 sources.list 文件…

vue3 element-plus表单form验证规则设置的require:true无效

必填项为空校验&#xff0c;valid第一次为true&#xff0c;再点值为false 引入FormInstance &#xff0c;校验代码改为以下&#xff1a; import { ElMessage, FormInstance } from element-plus const ruleFormRef ref<FormInstance>()const submitForm async (formEl:…

23.右值引用_c++11(左值引用的使用场景、右值引用的使用场景、左值引用和右值引用的对比、移动构造、移动赋值、右值引用完美转发)

传统的C语法中就有引用的语法&#xff0c;而C11中新增了的右值引用语法特性&#xff0c;所以从现在开始我们之前学习的引用就叫做左值引用。无论左值引用还是右值引用&#xff0c;都是给对象取别名。 4.右值引用 4.1 左值引用和右值引用 什么是左值&#xff1f;什么是左值引…

AI助力制造行业探索创新路径

近期&#xff0c;著名科技作家凯文凯利&#xff08;K.K.&#xff09;来到中国&#xff0c;发表了一场演讲,给广大听众带来了深刻的启示。他在演讲中强调了人工智能&#xff08;AI&#xff09;对全球经济的重大影响&#xff0c;并提出了AI发展的多个观点&#xff1a; AI的多样性…

Llama 3 超级课堂

https://github.com/SmartFlowAI/Llama3-Tutorial/tree/main 第一节作业 streamlit run web_demo.py /root/share/new_models/meta-llama/Meta-Llama-3-8B-Instruct

计算机网络-IPv6地址配置

前面我们学习了IPv6地址的类型、ICMPv6在IPv6中的应用&#xff0c;现在来看下具体到IPv6的地址配置方式与路由配置。 一、IPV6地址配置过程 前面我们知道单播地址包括&#xff1a;全球单播地址、唯一本地地址、链路本地地址等&#xff0c;一般情况下日常使用较多的是链路本地地…

4000定制网站,因为没有案例,客户走了

接到一个要做企业站点的客户&#xff0c;属于定制开发&#xff0c;预算4000看起来是不是还行的一个订单&#xff1f; 接单第一步&#xff1a;筛客户 从客户询盘的那一刻开始就要围绕核心要素&#xff1a;预算和工期&#xff0c;凡是不符合预期的一律放掉就好了&#xff0c;没必…

基于springboot的校园食堂订餐系统

文章目录 项目介绍主要功能截图&#xff1a;部分代码展示设计总结项目获取方式 &#x1f345; 作者主页&#xff1a;超级无敌暴龙战士塔塔开 &#x1f345; 简介&#xff1a;Java领域优质创作者&#x1f3c6;、 简历模板、学习资料、面试题库【关注我&#xff0c;都给你】 &…

基于参数化建模的3D产品组态实现

我们最近为荷兰设计师家具制造商 KILO 发布了基于网络的 3D 配置器的第一个生产版本。我们使用了 Salsita 3D 配置器&#xff0c;这是一个内部 SDK&#xff0c;使新的 3D 配置器的实施变得轻而易举。虽然它给我们带来了巨大帮助&#xff0c;但我们仍然面临一些有趣的挑战。 NSD…

新一代智慧音视频平台,企业必备新基建

随着5G、云计算、实时音视频、多模态、大模型、数字人等前沿技术的发展&#xff0c;企业与客户的交互方式正加速趋于移动化、视频化。 国家有关部门也相继出台系列政策法规&#xff0c;确保线上业务安全合规&#xff0c;以保障消费者权益。如&#xff0c;针对保险、银行、证券…

思维导图怎么画?一文掌握绘制技巧

思维导图怎么画&#xff1f;你是不是还在为不知道怎么绘制思维导图而困惑&#xff1f;别担心&#xff0c;看完这篇文章就可以掌握绘制思维导图的基础步骤了。一起来看看吧&#xff01; 一、思维导图的基本结构 思维导图通常由中心节点、分支节点和子节点组成。中心节点是思维导…

【基于 PyTorch 的 Python深度学习】5 机器学习基础(1)

前言 文章性质&#xff1a;学习笔记 &#x1f4d6; 学习资料&#xff1a;吴茂贵《 Python 深度学习基于 PyTorch ( 第 2 版 ) 》【ISBN】978-7-111-71880-2 主要内容&#xff1a;根据学习资料撰写的学习笔记&#xff0c;该篇主要介绍了机器学习的基本任务、机器学习的一般流程&…

活动预约小程序源码系统 自定义预约表单+收费项目 带完整的安装代码包以及系统部署教程

数字化时代的快速发展&#xff0c;活动预约管理已经成为许多企业和个人不可或缺的一部分。为满足这一需求&#xff0c;我们特别开发了一款活动预约小程序源码系统&#xff0c;该系统不仅具备自定义预约表单的功能&#xff0c;还支持收费项目&#xff0c;旨在为用户提供更加便捷…

Garden Planner for Mac/win:打造您专属的绿意空间

随着城市化进程的加速&#xff0c;绿色空间对于现代人来说愈发珍贵。为满足人们对美好生活的追求&#xff0c;我们特推出了一款功能强大的园林绿化设计软件——Garden Planner for Mac/win。这款软件将帮助您轻松规划和设计您的花园、菜园或庭院&#xff0c;让绿意成为您生活的…

刷代码随想录有感(59):二叉搜索树的最近公共祖先

题干&#xff1a; 代码&#xff1a; class Solution {递归实现 public:TreeNode* traversal(TreeNode* root, TreeNode* p, TreeNode* q){if(root NULL)return NULL;if(root->val > p->val && root->val > q->val){TreeNode* left traversal(root…

高速开箱机价格与性能解析:如何挑选适合您的开箱解决方案?

随着电商和物流行业的迅猛发展&#xff0c;高效、自动化的包装设备成为了提升工作效率、减少人工成本的必备利器。高速开箱机作为其中的重要一环&#xff0c;其性能与价格成为了许多企业和个人关注的焦点。星派将深入探讨高速开箱机的价格与性能之间的关系&#xff0c;帮助您在…

视频封面一键提取:从指定时长中轻松获取您想要的帧图片

在数字媒体时代&#xff0c;视频已成为人们获取信息、娱乐和沟通的主要形式之一。而一个好的视频封面&#xff0c;往往能够吸引观众的眼球&#xff0c;增加视频的点击率和观看量。然而&#xff0c;对于很多视频创作者和编辑者来说&#xff0c;如何从视频中快速、准确地提取出合…

代码随想录算法训练营第二十天:二叉树成长

代码随想录算法训练营第二十天&#xff1a;二叉树成长 110.平衡二叉树 力扣题目链接(opens new window) 给定一个二叉树&#xff0c;判断它是否是高度平衡的二叉树。 本题中&#xff0c;一棵高度平衡二叉树定义为&#xff1a;一个二叉树每个节点 的左右两个子树的高度差的绝…