![统计学习理论与方法:R语言版](https://wfqqreader-1252317822.image.myqcloud.com/cover/449/34061449/b_34061449.jpg)
4.3 威尔科克森符号秩检验
威尔科克森符号秩检验(Wilcoxon signed-rank test)由美国化学家、统计学家弗兰克·威尔科克森(Frank Wilcoxon)于1945年提出的。该方法是在成对观测数据的符号检验基础上发展起来的,它不仅利用了观察值和原假设中心位置的差的正负,还利用了差值的大小信息,因此比传统的单独用正负号的检验更加有效。
如果两个总体的分布相同,每个配对数值的差应服从以0为中心的对称分布。也就是将差值按照绝对值的大小编秩(排顺序)并给秩次加上原来差值的符号后,所形成的正秩和与负秩和在理论上是相等的(满足差值总体中位数为0的假设),如果两者相差太大,超出界值范围,则拒绝原假设。
在正式介绍威尔科克森符号秩检验之前,先来了解一下秩的概念。当数据按照某个标准进行排序之后,秩是按照一个样本项在排序中的次序而分配给该样本项的一个数字。第一项被赋与秩1,第二项被赋与秩2,依此类推。
例如数字12、10、35、30、18可以按从小到大的顺序排列为10、12、18、30、35。那么给这些数字编秩后的结果如下
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-P107_33502.jpg?sign=1738855370-hbCXyHa4lyONnsb5ELqMTOE63oagM1MZ-0-7da6b216c5f9772b5697a1bbffa5c069)
如果在秩中出现一个同级的情况,一般是算出所涉及之秩的均值后把这个平均秩赋与每一个同级项,例如数字12、10、35、12、18中因为有两个12,所以秩2和秩3同级,于是就把2和3的平均值2.5赋给这两个12,即
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-P107_33504.jpg?sign=1738855370-rfMx47MvxcYAFGEJis1lYCXiiCsgyG1v-0-2bc642446b47f1676e3bf27798f3345c)
在应用威尔科克森符号秩检验时,通常假设样本数据是随机选择的,而且总体或者(由配对数据算出的)差值总体服从一个近似对称的分布,但并不要求数据服从正态分布。
威尔科克森符号秩检验可以用于检验一个样本是否来自于一个具有指定中位数的总体。例如下面是10个欧洲城镇每人每年平均消费的酒类(相当于纯酒精数),数据已经按升序排列
4.12 5.81 7.63 9.74 10.39 11.92 12.32 12.89 13.54 14.45
人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升,试用上述数据检验这种看法。
通过数据可以看出,中位数为11.155,明显大于8,因此可以建立如下假设
H0:M=8; H1:M>8
然后根据每个样本值与中位数的差来计算相应的秩和符号,中间结果如表4-15所示。
表4-15 中间计算结果
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-T108_33514.jpg?sign=1738855370-BYX6ErPafQidwfx9qauEkXB4UzJTAUPC-0-68d383df550b26f09cb7509be0171b38)
分别求出带正号的秩和以及带负号的秩和如下
T+=2+4+6+7+8+9+10=46
T-=5+3+1=9
用T来表示两个秩和中的较小者,两个和中的任何一个都可以使用,但为了简化步骤,通常选择其中的较小者。令n为差值D不为0的样本数据的数量,对于n≤30,则检验统计量为T,如果n>30,则统计量为
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-P108_33513.jpg?sign=1738855370-FCUnMN42AMU83eaWYlvP5J4y0d6vSkLH-0-38d0534ced1d8a58e148eff507335a5d)
如果n≤30,可以从威尔科克森统计量临界值表中查得T的临界值。如果n>30,则从正态概率分布表中查得z的临界值。在本例中T=9,n=10,从威尔科克森统计量临界值表中查得单尾α=0.05的临界值为11,因为T=9小于临界值11,拒绝原假设。也可以直接从威尔科克森符号秩检验统计量表中可以查得P值为0.032<α=0.05,同样可以拒绝原假设。最终得出结论欧洲人均酒精年消费(中位数)多于8升。
现给出在R中执行以上检验的代码如下。
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-P108_33515.jpg?sign=1738855370-YLNQauawe394MuENJo65DLsmPWIgWD1X-0-40bcecf915560457e0094b394fcd4365)
对于配对数据而言,威尔科克森符号秩检验也可用以检验总体分布之间的差异,所以这时的原假设和备择假设通常为
H0:两个样本来自于相同分布的总体。
H1:两个样本来自于不同分布的总体。
来看一个例子。表4-16记录了9名混合性焦虑和抑郁症患者在开始接受一种镇静剂治疗后第一次和第二次抑郁程度评估的结果。现在请考虑这种疗法是否使患者的情况得到了改善。
表4-16 治疗效果数据
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-T109_33521.jpg?sign=1738855370-zw0nG0195NCwaL8RfF5FvzPkU8DQb0DM-0-3879c90dca77612b2b28fd0061ad2c7c)
在R中执行配对数据的威尔科克森符号秩检验的方法与前面单一样本的检验方法十分相像。下面给出的两种写法将会得到相同的结果。
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-P109_33518.jpg?sign=1738855370-3hNQvOEHJnETMYoLJaz7hIPDipzUMfU8-0-b2964189500afdbd66bfbbe17639e482)
由于P值为0.019 53<α=0.05,所以拒绝原假设,进而得出这种疗法使患者的情况得到了改善的结论。
当数据对较多时,可以计算一个近似的P值,为此需要将参数exact的值置为FALSE。此外,参数correct用于控制是否对P值的正态近似计算应用连续性修正。来看下面这段示例代码。
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-P109_33516.jpg?sign=1738855370-gxjnJxWDIzvWrGypovL729IWUA2JQwxE-0-a833113239c14ef18b63f8f3fd122ee7)
读者可以尝试将同样的问题分别用符号检验和威尔科克森符号秩两种方法进行分析,确实有些情况,他们所得的结论是相悖的。对同一问题用符号检验法和符号秩检验法,如果出现矛盾的结果,应该更倾向于相信符号秩检验法的结果,因为它既考虑差值的符号,也考虑其大小,利用了更多的信息,所以结果相对可靠些。
最后来考虑一下当n>30时使用的检验统计量为何是那样一种形式的。所有秩的和1+2+3+…+n等于n(n+1)/2;如果这个秩和在正负两类之间等分,则两个和中的每一个都应该接近n(n+1)/2的一半,即n(n+1)/4。回想前面给出的检验统计量表达式,其中的分母代表了T的标准差,并且使用了下面的等式关系
![](https://epubservercos.yuewen.com/0D99D6/18225431901802606/epubprivate/OEBPS/Images/Figure-P110_33523.jpg?sign=1738855370-ND1oPJ4Jt89N9iLkxEqEoehPnK9UuUQP-0-bd8eba0fba46da483b3619327bdf3af9)
这个等式可以由数学归纳法来证明,此处不再详述。