《平衡性检验.docx》由会员分享,可在线阅读,更多相关《平衡性检验.docx(5页珍藏版)》请在课桌文档上搜索。
1、平衡性检验什么是平衡性检验?Ba1.ancetests也称randomisationchecks,是种普遍的显著性检验。例如,一位研究者希望将一种新的词汇学习方法和传统方法进行比较。他随机分配40名被试到控制组(传统方法)和实验组(新方法)中。4周后,他检查所有被试的词汇知识,让我们假定他发现了一个支持实验组的显著差异(egt(38)=2.7zP=0.01)o为了有人避免批评,两组之间的差异是由于学习方法之外的其他因素导致的,周密的研究应该进行一次t检验和卡方检验以核查实验组与控制组成员在年龄上和性别比例上是否有显著差异。这些检验是为了确保研究者能够主张随机化分组使得在这些变量上,两组是平衡的
2、,因此我们所观察到的组间差异并不能归因于这些可能的混淆变量。如果一个平衡性检验的结果是显著的,研究者可能试图将该混淆变量作为协变量再进行一次分析。为什么这类显著性检验是多余的?尽管该策略看上去非常合理,但是平衡性检验存在以下几个问题。平衡性检验不能提供能多信息:统计检验是用来对总体而非特定样本进行推断的。诚然,实际中会出现实验组中有3名男性,而控制组有14名男性的情况;卡方检验将会产生一个显著结果。但是我们会真的认为男性更有可能出现在控制组吗?当然不会。因为我们已经随机将所有被试分配至各个条件中,我们知道关于这个变量的零假设(两组成员之间没有性别差异)是真的,因此我们明白男性进入实验组和控制组
3、的机会是均等的。故每一次显著的平衡性检验都是由于完全随机所导致的错误警报。一次平衡性检验不能告诉我们任何我们还不知道的信息。平衡性检验也是多余的:那些同意上述观点的研究者可能继续认为,他们使用平衡性检验不是为了推断总体,而是想了解组间不平衡程度。但是,组间的完美平衡并不是做出有效统计推断的先决条件。因此平衡性检验也是不必要的。平衡性检验使得显著性检验失效:因为p值只有在未进行平衡性检验的条件下才有它确切含义。实际上p值是一个条件概率:如果零假设为真,那么观察到如此极端、甚至更极端的数据模式的概率。一旦进行了平衡性检验,我们为P值增加了一个前提条件:如果零假设为真并且平衡性检验产生一个特定结果,
4、我们能观察到如此极端、甚至更极端的数据模式的概率。虽然看起来并未增加很多限制,实际上它是一种数据依赖性分析模式,这使得显著性检验失效。通过R语言进行模拟实验:我们性检验一个处理效应,随机分配40名被试到实验组和控制组。被试的年龄分布在20-40之间。年龄变量并不是我们感兴趣的,但它与结果变量呈线性相关。假如处理效应为0,即零假设为真。我们的分析策略如下。我们对年龄变量进行一次显著性检验,以确定实验组和控制组在被试年龄方面是否平衡。如果检验结果不显著,可以断定我们拥有平衡的群组,并对结果变量进行一次t检验。我们模拟IOoOO次该场景,并将来自于有条件的分析策略的p值分布与不管平衡性检验结果的t检
5、验和协方差分析所提供的p值分布进行比较。下面的直方图显示,这三种检验策略的P值分布。由于在本例中,零假设为真,因此P值的分布应该是均匀的,例如所有的bars应该一样高。左侧和中间的直方图正如如此,表明当分析不受平衡性检验影响时,P值是正确地分布。简言之,在此情况下P值有其预期的含义。右侧直方图表明,当分析受到平衡性检验影响时,低P值太罕见:对处理效应的检验太过于保守,即它的P值没有反映其预期含义。最近有一些文章还是强调,data-dependentana1.ysis会导致anti-conservative/va1.ues,例如当不存在处理效应时,非常有可能观测到一个显著效应(egGe1.man
6、&1.oken2013andSimmonseta1.2011)o因此本文表明data-dependentana1.ysis可能产生overconservativeresu1.ts似乎有些奇怪。但我的主要观点是,平衡性检验会产生本可以轻松避免的不准确结果不论错误方向。这就是说,overconservatism也有实践上的缺陷,即更低的统计功效:当处理效应真实存在时,它不太可能观察到一个在统计上显著的效应。下面的直方图显示了当存在一个相对较小的处理效应时,P值的分布情况。很明显,只有ANCOVA策略的统计功效表现最好,反之使用平衡性检验策略甚至比不上单纯的使用t检验的方法。解决办法解决办法很简单:
7、justdontuseba1.ancetests0在分析随机试验的数据时,平衡性检验只会把研究报告弄得乱七八糟而不能提供任何明显的优势。当我们有理由假定存在一个影响结果变量的协变量时,最好的办法就是将它纳入到主要分析中,而不管实验组和控制组在该变量上是否平衡。实际上,MUtZandPemantIe(2013)发现,当组间是平衡时,加入一个协变量会更加有效。尽管本文只关注随机实验,但我认为在分析非随机的准实验时,该策略也是最明智的选择。或者在实验设计时就考虑协变量也是非常有意义的,例如在随机分组之前(seethepartinmyana1.ysispaperonb1.ocking:pp.6-7)0