简介
McPAT用的很多,大多只是写个python或perl脚本替换xml文件.没有深入到为什么xml脚本这些值要换,以及这写填进去xml的值是怎么影响计算的.本问从源代码一步步读下来,解释每一步是如何计算的.
power 构成: 动态功耗其实更相关于energy
McPAT的power 核心是两类,动态和静态的power. 其中动态的power的核心是energy与执行时间executiontime,一除就得到了 dynamic power.
也就是说,动态的功耗dynaic power 并不是功耗的累加,而是将enenrgy算完后除以时间. 这个时间是填xml表得到的.
所以复杂的部分是energy的计算
energy是单次的energy 乘以accesstime
对noc功耗来说,accesstime 是xml填进去的,和gem5联动的话,则是2倍的l2 demand access.
例如下图, 4.4e-8 J 来自于1.0987e-12J和40470相乘. 1.0987e-12J是根据物理参数和微架构算出来的单次accessEnergy,accessnum是自己填进去xml表格的.
单次accessEnergy计算
port级别的相加
是做了两次arbitration, 第一次是input处,5个inport 做了vc之间的竞争. 第二次是outport出,决定那个inport可以使用当前的这个outport.
port内部,则和电容电压有关
port内部具体的计算: req, pri, grant, int
这里是非常经典的电容能量公式,高中的知识:电容器的电势能公式 CU^2/2. 这里的 C是电容,分别是arb_req等值,来自于电容计算函数的返回值,这里的u是电压也就是 vdd.
我们把 VDD^2/2 放在图里的后边,就可能清楚的看到, 后面都是vdd^2/2 是一致的,不同的是前方的系数 和电容的值.
前方的系数是两个R,对VcARBITER的话,是 VC per port. 这里可以改xml中的值来debug确认(改XML中的, 为一个奇怪的值,比如888, 改源代码打印这个R,输出值是888,印证了这个R是virtual_channel_per_port") .第三个值是固定的2,第四个系数是固定的1.
然后一个port的arbitration用的了4类 电容, 分别是req pri,grant, 和int.
四类电容的计算值来源 和 原理来源
计算值来源有
计算的原理依据暂无
为什么是这些电容被使用的,和哪些微架构相关?不知道.
但是他们是在cacti文件夹下的,显然和cacti有一些关系.但是和路由器微架构的关联还不清楚.
小结
mcpat的计算主要是根据计算的单次energy 和 输入的access 和执行时间(xml中的cycles数和频率决定) 算power. 单次的enegy来源于路由器微架构决定的4个电容组合类型和对应的系数.
电容组合的内部的计算值是有的,但是为什么是这么组合的,就需要看文献了,推测是cacti和arbiter微架构相关.