显著性检验是fMRI数据分析最为人诟病的一环。研究者主要提出了一下几种方法来解决这个问题:
1) The Sidak and Bonferroni Corrections:
原理简单,根据参与显著性检验的样本数量,提高检验标准。但标准太严格,拒真率太高,一般不采用。
2) Gaussian Random Fields:
实际上所有显著性检验都是基于高斯随机场理论,但该方法是直接采用了高斯随机场的研究成果,用欧拉示性数来确定P值的高低。
形象但不严格地说,就是求峰值-负峰值的数量,约等于该多维体的欧拉示性数,这个数等于假阳性结果概率。
我们首先规定一个t值,删除不显著的体素,然后计算剩余体素的欧拉示性数,在P值非常小的情况下,显著检验“淹没”的三维几何体将形成一个个沟谷和山峰,剩余的几何体有两个特征,一个是T值高低,一个是几何形状,在该方法中,我们只考虑几何形状(认为只要分布确定,T值变化梯度等已经反映在淹没后的形状中了)。Friston等证明了,山峰减去沟谷的数量比极值点的数量更能符合假阳性结果的分布,实际上,有人给出了各种分布各种维度中单位resel中欧拉示性数的期望值。这样我们只要计算淹没之后剩下的几何体的resel数量就行了。
将依赖高斯随机场的resel(Resolution unit)数(一般是ROI三个长度除以空间平滑用的三分方向的FWHM,然而实际上数据平滑之前的空间信号自相关才是原是信号的分布,我们简单地认为FWHM遵循了原始数据的的分布规律)乘以单位resel中欧拉示性数的期望值,就可以得到整个剩余几何体的欧拉示性数,就得到了假阳性结果的概率。
那么只要变换T值,假阳性结果概率就在可控范围之内,并保证最小拒真率。
这个方法向来是可靠的,因为数据的分布特征将由淹没后几何体的数量和形状决定。这就保证了针对不同的数据,我们可以计算出一个不同的T值来限定显著性。
3) False Dicovery Rate:
将体素激活值排序,通过排序后数据的斜率判断认假率。原理较为简单,效果较好。
4) Cluster-Based Methods:
该方法也没有随便设计Cluster数量那么简单。实际上也是另起了一套显著性检验的方法。较为有效。Cluster Size需要进行计算。
基本过程是,A:将整个大脑的激活假设为一个z分布。B:确定阈限值,即激活值大于多少可以被认为是显著地。C:统计所有的cluster,决定哪一个是显著的。
Cluster Based Methods 主要有三种:其一,定好一个T值,看“淹没”剩余的CLuster数量,该数量符合泊松分布,因为剩余Cluster的期望值等于该随机场欧拉示性数的期望值,因此就得到T值时谎报率的值。其二,考虑进CLuster数量和CLuster size的期望值,Mosko和Friston先后将它们统一到一个指数分布和适合高斯随机场的情境中。其三,同时考虑Cluster Size和Cluster Z值的期望,将它们的分布勾勒出来,找到降低谎报率的最佳区间。
5) 其它还有PBS方法(专门为Multiple comparisons设计),Voodoo Correlations方法。
一早上分享了几个比较简单,基础的功能磁共振成像的数据处理步骤及其原理。希望大家来讨论,指正。下一步想写写核磁成像的物理原理的数学解析(我对于量子物理完全不了解,不过已经有用bloch方程解析这个过程的成熟方法可以借用),以及数据预处理的那些步骤。
目前自己的主要工作:基于核磁数据的大脑连接方法的原理和处理程序,PPI的工作已经完成,DCM的基本原理也差不多了。