什么是 WPR/WPA?
Windows 性能记录器 (WPR) 和 Windows 性能分析器 (WPA) 是 Windows 性能工具包中提供的性能监控工具。它们是免费的工具,可以通过下载和安装 Windows 评估和部署工具包 (ADK) 来获得。
WPR 是一个工具,允许用户动态部署事件跟踪基础架构 (ETW),以捕获内核和应用程序事件。WPR 作为会话控制器,使用户能够启动和停止所有正在运行的应用程序的事件跟踪,并收集指标以诊断性能问题。
WPA 是一个工具,使用户能够可视化由 WPR 生成的事件跟踪日志 (ETL) 文件,并对记录的应用程序进行分析。
重要提示:用户需要访问正在剖析的应用程序相应的符号 (PDB),因为它们对于 WPA 确定进程所处的函数是必需的。PDB 文件在 AFSIM 发布时并未随附提供,但如果源代码可访问,则可以生成。
如何安装 WPR/WPA
如果测试机器上未安装 Windows ADK,可以通过访问下载页面选择适合所用 Windows 版本的安装程序来获取。
以下是运行 Windows 性能工具包的系统要求:
- WPR:Windows 8 或更高版本。
- WPA:Windows 8 或更高版本,且需要安装 Microsoft .NET Framework 4.5 或更高版本。
运行安装可执行文件时,用户应禁用发送匿名消息,并选择 Windows 性能工具包,其中包含 WPR 和 WPA。
注意:Windows 性能工具包为以前的命令行工具 Xperf 提供支持。然而,Xperfview 已不再支持,所有使用 Xperf 进行的录制必须通过 WPA 打开和分析。
一旦安装完成,性能工具就可以开始进行性能测试了。
如何使用 WPR
可以通过在任务栏搜索框中输入“Windows Performance Recorder”或在点击“开始”按钮后从 Windows Kits 中找到 WPR UI。开始录制会话之前,用户必须配置 WPR。以下是推荐的设置:
将性能场景设置为“通用”
这将 WPR 设置为在计算机运行时进行通用目的的录制。
将详细级别设置为“详细”
“轻量”模式耗费的资源更少,对系统的干扰也更小;然而“详细”录制对于全面分析更为有用。
设置日志记录
选择文件模式以进行简短和有针对性的分析会话。这将数据记录到顺序文件中,这些文件会不断增大,因此建议进行简短的会话,以避免生成不必要的大文件。
对于无法确定的分析会话,选择内存模式;即用户可以保持录音机运行,直到他们发现值得注意的事项或到达他们希望分析的应用程序的确切点(即,在加载脚本后通过向导 UI 启动任务)。这将数据记录到循环缓冲区中,当数据大小超过缓冲区大小时,将开始丢弃最旧的事件。
警告:文件模式如果会话运行过长,可能导致录制文件过大,以至于 WPA 无法打开。
选择配置文件
- CPU 使用情况
- 堆使用情况和 VirtualAlloc 使用情况(用于内存分析)
有关 WPR 功能的更详细说明,请参阅 WPR 文档页面。
配置 WPR 后,用户可以点击“开始”以开始录制会话,这将捕获所有在 CPU 上运行的内容。此时,用户可以运行需要分析的应用程序(向导、任务等)。点击“保存”将停止会话并保存配置文件数据;这将生成事件跟踪日志。
WPR 还可以通过命令提示符运行。性能工具在使用时需要提升的权限,因此用户必须以管理员身份运行命令提示符。以下是开始分析的示例命令:
wpr -start CPU.Verbose -recordtempto C:\<PATH>\wpr_test_temp
这个示例命令指定将记录 CPU 使用情况,并将所需的详细级别设置为“详细”。同时,还必须指定一个临时目录,WPR 将在生成最终 ETL 时用于存储中间文件。要停止 WPR 并保存录制,请使用以下命令:
wpr -stop C:\<PATH>\test.etl "问题描述" -skipPdbGen
路径和文件名必须指定,同时还需提供报告的描述。skipPdbGen
标志告诉 WPR 不生成任何缓存的符号文件。
有关如何通过命令行使用 WPR 的更多信息,用户可以使用以下命令:
wpr -help <option>
或查阅 Microsoft Devblog。
如何使用 WPA
以下是一个简要示例,演示如何查看特定应用程序(mission.exe)并分析其 CPU 使用情况。
当 WPA 打开 ETL 文件时,用户会看到一个空白的分析选项卡和左侧窗格中的图形浏览器。图形浏览器包含基于选择的性能配置文件记录的所有数据。
通过双击图表或将其拖入分析选项卡,用户可以查看记录的信息。每个信息面板的大小可以通过点击并拖动灰色分隔线进行调整。此示例展示了 CPU 使用情况(采样)图表,该图表测量每个函数在 CPU 上的聚合停留时间。默认采样率为每秒 1000 次计数,因此每次计数大约相当于 CPU 上的 1 毫秒。
为了隔离特定应用程序(如 mission.exe)的输出,用户可以通过右键单击目标应用程序并选择“禁用 > 除所选项外的所有内容”来过滤掉所有其他捕获的信息。
这将从图表窗口中移除所有其他采样进程。为了在底部的详细信息窗口中隔离该应用程序,用户可以右键单击它并选择“过滤到所选项”。
这将导致 WPA 看起来有些空白。
用户可以通过点击进程名称旁边的右指三角形来开始浏览进程树,并展开节点。堆栈列将开始显示该进程的函数堆栈,可以以相同的方式展开。此时,用户可能会看到 [Root] 下的节点标记为
<lib name>.dll!<Symbols disabled>
如果应用程序的符号未正确加载到 WPA 中,就会出现这种情况。
加载符号
要加载符号,用户需要点击 WPA 窗口左上角菜单中的“跟踪”,并选择“配置符号路径”。这将打开“配置符号”菜单,可能已经包含预选的启用路径;根据 WPR 的配置,它将自动生成并包含其他应用程序的缓存符号。如果用户只关心 AFSIM 应用程序,他们可以移除自动生成的路径,并添加 AFISM PDB 文件所在的路径。
添加路径后,用户应确保勾选框已启用,然后点击“确定”。接下来,必须再次点击“跟踪”,并选择“加载符号”选项。
注意:启用 WPA 符号自动加载会将以前会话的符号路径聚合到“配置符号”菜单中,这可能导致冗余和更长的加载时间。
现在,当用户返回详细信息窗口时,堆栈列中的节点将正确识别应用程序的函数名称。
分析:入门
WPA 按照最大采样计数对堆栈节点进行排序,这有助于识别哪些函数调用花费的时间最长。
仅凭采样计数可能会产生误导,因为表现不佳的函数可能发生得不频繁,相对于整个应用程序可能具有较小的采样计数;采样计数是整个应用程序运行时的聚合值。为了检测性能下降,可以利用图表窗口检查运行时的特定区间。通过点击图表并横向拖动光标,用户可以选择一个区间进行扩展。
右键单击所选区间并点击“缩放”将该区间扩展以填充图表窗口,并更新堆栈列中的采样计数,以反映在所选区间内最活跃的函数。
此外,可以选择单个函数调用以绘制到图表上。要启用此功能,用户可以点击图例列中的相应方框。下面的图表显示,尽管所选函数调用的采样计数相对于其他兄弟函数较小,但仍是图表中突然性能峰值的部分原因。
WPA 中有许多分析工具和功能,从保存特定配置设置到过滤特定信息。有关如何使用 WPA 及其功能的更多详细信息,可以在 WPA 文档页面中找到。
错误
在 2021 年 6 月,微软发布了一个修复程序,解决了一个 Windows Defender 错误,该错误导致 WPR 无法生成 CPU 使用情况(采样)报告。如果 WPA 中没有录制会话的采样图,可能需要运行 Windows 更新(可能需要几次)来修复此问题。
不幸的是,这仅修复了 Windows Defender 引起的多个问题中的一个。如果更新未能解决问题,临时的解决方法是在运行 WPR 时在 Windows 安全设置中禁用实时保护,然后在之后重新启用它。