https://doi.org/10.1002/hbm.26714
背景
一般情况下,研究者通过评估统计量较大的脑区与功能网络重叠的情况,或者计算网络的体素占比,来确定行为和功能网络的相关性。NEST能检测行为表型和大脑表型的相关性是否富集在特定的功能网络中。例如下图👇(a)计算vertex-wise的皮层厚度与年龄相关得到相关系数图(vertex-wise),可以使用NEST检测这些相关富集在哪些功能网络(例如👇图b的Yeo2011)中。
方法
NEST思路(下图👇)借鉴了经典的GSEA算法(Subramanian et al 2005),先获取所有vertex的相关→排序→计算running sum→得到ES得分。
如何建立零模型计算显著性?第一可以考虑随机化被试(相当于self-contained零模型),另外还可以考虑对vertex进行随机化(相当于competetive零模型)。spin test似乎是将网络模板做rotation。
NEST的代码实现有Python和R两个版本:
https://github.com/smweinst/NEST/
假阳性和统计效力
把被试的行为数据打乱,随机选择子集检验假阳性的概率。这里的逻辑是用随机的行为数据,如果发现显著则认为是假阳性。作者使用的是随机化行为数据,另外可以考虑完全随机生成一组行为数据。
结果表明(👇图)使用vertex进行随机化建立零模型(competetive零模型)会增加假阳性概率。原因是在随机化vertex的时候并未考虑到vertex在相同网络之间的联系,也就是说同一个网络中的vertex相关性可能更强。这个问题是competetive零模型中普遍存在的,比如在做基因的富集分析时,未考虑基因之间的共表达,会导致假阳性的增加。
通过从原始数据(未置换数据)中提取多个子样本,并在这些子样本中反复应用NEST,可以观察到该方法在多大程度上能正确识别出显著结果(下图👇)。这里的假设是子样本中存在一些真实的信号,因此功效可以简单使用基于在给定显著性水平下拒绝原假设的比例进行估计。在真实数据中,尽管没有明确的Ground True来检验假阴性的概率,但通过这种经验性的方式评估NEST在不同数据变异下的稳健性和可靠性。
运用于真实数据
在真实数据(PNC)中应用该方法,结果如下(👇)。年龄与皮层厚度的相关主要富集于DA/VA/FP/DM网络,性别与皮层厚度的相关主要富集于VS/VA/FP/DM网络,年龄和性别对皮层厚度变化的交互作用富集于VA网络。目测交互作用的结果在vertex水平是无法通过矫正的,但使用NEST后能发现功能网络的相关(!)。
假设vertex-level的结果都不显著(比如T值都在2以下),但是通过NEST的排序方法,仍有可能检测到网络的特异性,可能有潜在的问题。此外作者文章中提及的两个局限也值得注意:1. 未考虑统计量符号的问题; 2. 该方法比较依赖于功能网络的定义,推荐用于结果的验证。
虽然这目前NEST还有亟待完善的地方,但是我同意作者最后的小结:
虽然在神经影像研究中评估脑-表型关联的网络、感兴趣区的特异性非常常见,但现有方法要么过于主观,要么依赖于强烈的假设,实在令人头疼。NEST 是我们所知的第一个绕过这些限制的方法。