第十三章 非参数检验

第一节 Chi-Square过程

13.1.1 主要功能

13.1.2 实例操作

第二节 Binomial过程

13.2.1 主要功能

13.2.2 实例操作

第三节 Runs过程

13.3.1 主要功能

13.3.2 实例操作

第四节 1-Sample K-S过程

13.4.1 主要功能

13.4.2 实例操作

第五节 2 Independent Samples过程

13.5.1 主要功能

13.5.2 实例操作

第六节 k Independent Samples过程

13.6.1 主要功能

13.6.2 实例操作

第七节 2 Related Samples过程

13.7.1 主要功能

13.7.2 实例操作

第八节 K Related Samples过程

13.8.1 主要功能

13.8.2 实例操作

 

    许多统计分析方法的应用对总体有特殊的要求,如t检验要求总体符合正态分布,F检验要求误差呈正态分布且各组方差整齐,等等。这些方法常用来估计或检验总体参数,统称为参数统计。

    但许多调查或实验所得的科研数据,其总体分布未知或无法确定,这时做统计分析常常不是针对总体参数,而是针对总体的某些一般性假设(如总体分布),这类方法称非参数统计(Nonparametric tests)。

    非参数统计方法简便,适用性强,但检验效率较低,应用时应加以考虑。

 

第一节 Chi-Square过程

 

13.1.1 主要功能

       调用此过程可对样本数据的分布进行卡方检验卡方检验适用于配合度检验,主要用于分析实际频数与某理论频数是否相符。

 

返回目录  返回全书目录

 

13.1.2 实例操作

    [例13-1]某地一周内各日死亡数的分布如下表,请检验一周内各日的死亡危险性是否相同?

 

 

死亡数

11

19

17

15

15

16

19

 

13.1.2.1  数据准备

    激活数据管理窗口,定义变量名:各周日day,死亡数为death。按顺序输入数据, 结果见图13.1。激活Data菜单选Weight Cases...命令项,弹出Weight Cases对话框(如图13.2),选death点钮使之进入Frequency Variable框,定义死亡数为权数,再点击OK钮即可。

 

 

13.1  数据录入窗口

 

 

13.2  数据加权对话框

 

13.1.2.2  统计分析

   激活Statistics菜单选Nonparametric Tests中的Chi-Square...命令项,弹出Chi-Square Test对话框(图13.3)。现欲对一周内各日的死亡数进行分布分析,故在对话框左侧的变量列表中选day,点击钮使之进入Test Variable List框,点击OK钮即可。

 

 

13.3  卡方检验对话框

 

13.1.2.3  结果解释

    在结果输出窗口中将看到如下统计数据:

    运算结果显示一周内各日死亡的理论数(Expected)为15.71,即一周内各日死亡均数;还算出实际死亡数与理论死亡数的差值(Residual);卡方值χ2 = 3.4000,自由度数(D.F.)= 6 ,P = 0.7572 ,可认为一周内各日的死亡危险性是相同的。

 

DAY

                    Cases

       Category  Observed  Expected  Residual

           1.00        11     15.71     -4.71

           2.00        19     15.71      3.29

           3.00        17     15.71      1.29

           4.00        15     15.71      -.71

           5.00        13     15.71     -2.71

           6.00        16     15.71       .29

           7.00        19     15.71      3.29

                      ---

          Total       110

 

          Chi-Square            D.F.         Significance

             3.4000               6              .7572

 

 

 

返回目录  返回全书目录

 

第二节 Binomial过程

 

13.2.1 主要功能

    有些总体只能划分为两类,如医学中的生与死、患病的有与无。从这种二分类总体中抽取的所有可能结果,要么是对立分类中的这一类,要么是另一类,其频数分布称为二项分布。调用Binomial过程可对样本资料进行二项分布分析。

 

返回目录  返回全书目录

 

13.2.2 实例操作

    [例13-2]某地某一时期内出生40名婴儿,其中女性12名(定Sex=0),男性28名(定Sex=1)。问这个地方出生婴儿的性比例与通常的男女性比例(总体概率约为0.5)是否不同?

 

13.2.2.1 数据准备

    激活数据管理窗口,定义性别变量sex。按出生顺序输入数据,男性为1 ,女性为0。

 

13.2.2.2 统计分析         

    激活Statistics菜单选Nonparametric Tests中的Binomial Test...命令项,弹出 Binomial Test对话框(图13.4)。在对话框左侧的变量列表中选sex,点击钮使之进入Test Variable List框,在Test Proportion框中键入0.50,再点击OK钮即可。  

 

 

13.4  二项分布检验对话框

 

13.2.2.3  结果解释

    在结果输出窗口中将看到如下统计数据:

    二项分布检验表明,女婴12名,男婴28名,观察概率为0.7000(即男婴占70%),检验概率为0.5000,二项分布检验的结果是双侧概率为0.0177,可认为男女比例的差异有高度显著性,即与通常0.5的性比例相比,该地男婴比女婴明显为多。

 

SEX

      Cases

                                 Test Prop. =   .5000

         28    = 1.00            Obs. Prop. =   .7000

         12    =  .00

         --                      Z Approximation

         40   Total              2-Tailed  P = .0177

 

 

 

返回目录  返回全书目录

 

第三节 Runs过程

 

13.3.1 主要功能

    依时间或其他顺序排列的有序数列中,具有相同的事件或符号的连续部分称为一个游程。调用Runs过程可进行游程检验,即用于检验序列中事件发生过程的随机性分析。

 

返回目录  返回全书目录

 

13.3.2 实例操作

     [例13-3]某村发生一种地方病,其住户沿一条河排列,调查时对发病的住户标记为“1”,对非发病的住户标记为“0”,共17户:

0  1  1  0  0  0  1  0  0  1  0  0  0  0  1  1  0  0  1  0  0  0  0  1  0  1

 

问病户的分布排列是呈聚集趋势,还是随机分布?

 

13.3.2.1  数据准备

    激活数据管理窗口,定义住户变量epi。按住户顺序输入数据,发病的住户1 ,非发病的住户0。

 

13.3.2.2  统计分析         

    激活Statistics菜单选Nonparametric Tests中的Runs Test...项,弹出 Runs Test对话框(图13.5)。在对话框左侧的变量列表中选epi,点击钮使之进入Test Variable List框。在临界割点Cut Point框中有四个选项:

 

 

13.5  游程检验对话框

 

    1、Median:中位数作临界割点,其值在临界割点之下的为一类,大于或等于临界割点的为另一类;

    2、Mode:众数作临界割点,其值在临界割点之下的为一类,大于或等于临界割点的为另一类;

    3、Mean:均数作临界割点,其值在临界割点之下的为一类,大于或等于临界割点的为另一类;

    4、Custom:用户指定临界割点,其值在临界割点之下的为一类,大于或等于临界割点的为另一类;

    本例选Custom项,在其方框中键入1(根据需要选项,本例是0、1二分变量,故临界割点值用1),再点击OK钮即可。

 

13.3.2.3  结果解释

    在结果输出窗口中将看到如下统计数据:

    检验结果可见本例游程个数为14,检验临界割点值(Test value) = 1.00,小于1.00者有17个案例,而大于或等于1.00者有9个案例。Z = 0.3246,双侧 P = 0.7455。 所以认为此地方病的病户沿河分布的情况无聚集性,而是呈随机分布。

 

EPI

           Runs:   14           Test  value  =  1.00

 

           Cases:  17   LT 1.00

                    9   GE 1.00            Z =   .3246

                   --

                   26   Total     2-Tailed  P =   .7455  

 

 

 

返回目录  返回全书目录

 

第四节 1-Sample K-S过程

 

13.4.1 主要功能

    调用此过程可对单样本进行Kolmogorov-Smirnov Z检验,它将一个变量的实际频数分布与正态分布(Normal)、均匀分布(Uniform)、泊松分布(Poisson)进行比较。

 

返回目录  返回全书目录

 

13.4.2 实例操作

    [例13-4]某地正常成年男子144人红细胞计数(万/立方毫米)的频数资料如下,问该资料的频数是否呈正态分布?

 

红细胞计数

人数

红细胞计数

人数

420-

440-

460-

480-

500-

520-

2

4

7

16

20

25

540-

560-

580-

600-

620-

640-

24

22

16

2

6

1

 

13.4.2.1  数据准备

    激活数据管理窗口,定义频数变量名为f,依次输入人数资料

 

13.4.2.2  统计分析         

    激活Statistics菜单选Nonparametric Tests中的1-Sample K-S ...命令项,弹出One-Sample Kolmogorov-Smirnov Test 对话框(图13.6)。在对话框左侧的变量列表中选f,点击钮使之进入Test Variable List框,在Test Distribution框中选Normal项,表明与正态分布形式相比较,再点击OK钮即可。

 

 

13.6  单样本Kolmogorov-Smirnov Z检验对话框

 

13.4.2.3  结果解释

    在结果输出窗口中将看到如下统计数据:

  K-S正态性检验的结果显示,Z值=0.7032,双侧P值=0.7060,可认为该地正常成年男子的红细胞计数符合正态分布。

 

F

     Test distribution  -  Normal                     Mean:  12.0000

                                        Standard Deviation:   9.3808

              Cases:  12

              Most extreme differences

        Absolute        Positive      Negative         K-S Z       2-Tailed P

         .20298         .20298        -.16509          .7032          .7060

 

 

返回目录  返回全书目录

 

第五节 2 Independent Samples过程

 

13.5.1 主要功能

    调用此过程可对两个独立样本的均数、中位数、离散趋势、偏度等进行差异比较检验。

 

返回目录  返回全书目录

 

13.5.2 实例操作

    [例13-5]调查某厂的铅作业工人7人和非铅作业工人10人的血铅值(μg / 100g)如下,问两组工人的血铅值有无差别?

 

非铅作业组

铅作业组

5    5    6    7    9    12    13    15    18    21

    17   18   20   25   34    43    44

 

13.5.2.1 数据准备

    激活数据管理窗口,定义分组变量group(非铅作业组为1,铅作业组为2,血铅值为Pb。按顺序输入数据。

 

13.5.2.2 统计分析         

    激活Statistics菜单选Nonparametric Tests中的2 Independent Samples...命令项,弹出Two-Independent-Samples-Test对话框(图13.7)。在对话框左侧的变量列表中选Pb,点击钮使之进入Test Variable List框;选group,点击钮使之进入Grouping Variable框,点击Define Groups...钮,在弹出的Two Independent Samples:Define Groups对话框内定义Group 1为1,Group 2为2,之后点击Continue钮返回Two-Independent-Samples-Test对话框;在Test Type框中有四种检验方法:

 

 

13.7  两独立样本检验对话框

 

    Mann-Whitney U:主要用于判别两个独立样本所属的总体是否有相同的分布;

    Kolmogorov-Smirnov Z:推测两个样本是否来自具有相同分布的总体;

    Moses extreme reactions:检验两个独立样本之观察值的散布范围是否有差异存在,以检验两个样本是否来自具有同一分布的总体;

    Wald-Wolfowitz runs:考察两个独立样本是否来自具有相同分布的总体。

    本例选Mann-Whitney U检验方法,之后点击OK钮即可。

 

13.5.2.3  结果解释

    在结果输出窗口中将看到如下统计数据:

    结果表明,第1组的平均秩次(Mean Rank)为5.95,第2组的平均秩次为13.36,U = 4.5,W = 93.5,精确双侧概率P = 0.0012,可认为铅作业组工人的血铅值高于非铅作业组。

 

PB  by  GROUP

     Mean Rank    Cases

          5.95       10    GROUP = 1

         13.36        7    GROUP = 2

                     --

                    17  Total

                                  Exact             Corrected for ties

           U             W      2-Tailed P           Z      2-Tailed P

           4.5          93.5       .0012         -2.9801       .0029

 

 

返回目录  返回全书目录

 

第六节 k Independent Samples过程

 

13.6.1 主要功能

    调用此过程可对多个独立样本进行中位数检验和Kruskal-Wallis H检验。

 

返回目录  返回全书目录

 

13.6.2 实例操作

    [例13-6]随机抽样得以下三组人的血桨总皮质醇测定值(μg / L),试比较有无差异?