第四章 摘要性分析
摘要性分析是对原始数据进行描述性分析,这是统计工作的出发点。统计学的一系列基本描述指标,不仅让人了解资料的特征,而且可启发人们对之作进一步的深入分析。通过调用摘要性分析的诸个过程,可完成许多统计学指标,对于计量资料,可完成均数、标准差、标准误等指标的计算;对于计数和一些等级资料,可完成构成比、率等指标的计算和χ2 检验。本章将介绍其操作方法。
第一节
Frequencies过程
4.1.1
主要功能
调用此过程可进行频数分布表的分析。频数分布表是描述性统计中最常用的方法之一,此外还可对数据的分布趋势进行初步分析。
4.1.2
实例操作
[例4-1]调查100名健康女大学生的血清总蛋白含量(g%)如下表,试作频数表分析。
7.43 7.88 6.88 7.80 7.04 8.05 6.97 7.12 7.35 8.05 7.95 7.56 7.50 7.88 7.20 7.20 7.20 7.43 7.12 7.20 7.50 7.35 7.88 7.43 7.58 6.50 7.43 7.12 6.97 6.80 7.35 7.50 7.20 6.43 7.58 8.03 6.97 7.43 7.35 7.35 7.58 7.58 6.88 7.65 7.04 7.12 8.12 7.50 7.04 6.80 7.04 7.20 7.65 7.43 7.65 7.76 6.73 7.20 7.50 7.43 7.35 7.95 7.35 7.47 6.50 7.65 8.16 7.54 7.27 7.27 6.72 7.65 7.27 7.04 7.72 6.88 6.73 6.73 6.73 7.27 7.58 7.35 7.50 7.27 7.35 7.35 7.27 8.16 7.03 7.43 7.35 7.95 7.04 7.65 7.27 7.72 8.43 7.50 7.65 7.04 |
4.1.2.1 数据准备
激活数据管理窗口,定义血清总蛋白含量的变量名为X,然后输入血清总蛋白含量的原始数据,结果见图4.1。
图4.1 输入血清总蛋白含量值 |
4.1.2.2 统计分析
激活Statistics菜单,选Summarize中的Frequencies...命令项,弹出Frequencies对话框(图4.2)。现欲对血清总蛋白含量值进行频数表分析,故在对话框左侧的变量列表中选x,点击钮使之进入Variable(s)框。同时可点击Format...钮弹出Frequencies:Format对话框,在Order
by栏中有四个选项:Ascending values为根据数值大小按升序从小到大作频数分布;Descending
values为根据数值大小按降序从大到小作频数分布;Ascending counts为根据频数多少按升序从少到多作频数分布;Descending
counts为根据频数多少按降序从多到少作频数分布。在Page Formal栏中可定义结果输出的格式。本例选Ascending
values项后点击Continue钮返回Frequencies对话框。
图4.2 频数表分析对话框 |
点击Statistics...钮,弹出Frequencies:Statistics对话框(图4.3),可点击相应项目,要求系统在作频数表分析的基础上,附带作各种统计指标的描述,特别是可进行任何水平的百分位数计算。本例要求计算四分位数(Quartiles)、均数(Mean)、中位数(Median)、众数(Mode)、总和(Sum)、标准差(Std.deviation)、方差(Variance)、全距
(Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)、偏度系数(Skewness)和峰度系数(Kurtosis),选好后点击Continue钮返回Frequencies对话框。
图4.3 频数表分析的统计指标对话框 |
点击Charts...钮,弹出Frequencies:Charts对话框,用户可选两种图形,一是直条图(Bar
chart),适用于非连续性的变量;另一是直方图(Histogram),适用于连续性的变量。本例要求对变量x绘制直方图,故选择Histogram项,并要求绘制正态曲线(With
normal curve),点击Continue钮返回Frequencies对话框,再点击OK钮即可。
4.1.2.3 结果解释
在输出结果窗口中将看到如下统计数据:
系统对变量x的原始数据作频数分布表,Value为原始值、Frequency为频数、Percent为各组频数占总例数的百分比、Valid
percent为各组频数占总例数的有效百分比、Cum Percent为各组频数占总例数的累积百分比。
X
Valid Cum Value Label
Value Frequency Percent Percent Percent
6.43
1 1.0 1.0 1.0
6.50
2 2.0 2.0 3.0
6.72
1 1.0 1.0 4.0
6.73
4 4.0 4.0 8.0
6.80
2
2.0 2.0 10.0
6.88
3 3.0 3.0 13.0
6.97
3 3.0 3.0 16.0
7.03
1 1.0 1.0 17.0
7.04 7 7.0 7.0 24.0
7.12
4 4.0 4.0 28.0
7.20
7 7.0 7.0 35.0
7.27
7 7.0 7.0 42.0
7.35 11 11.0 11.0 53.0
7.43
8 8.0 8.0 61.0
7.47
1 1.0 1.0 62.0
7.50
7 7.0 7.0 69.0
7.54
1 1.0 1.0 70.0
7.56
1 1.0 1.0 71.0
7.58
5 5.0 5.0 76.0
7.65
7 7.0 7.0 83.0
7.72
2 2.0 2.0 85.0
7.76
1 1.0 1.0 86.0
7.80
1
1.0 1.0 87.0
7.88
3 3.0 3.0 90.0
7.95
3 3.0 3.0 93.0
8.03
1 1.0 1.0 94.0
8.05 2 2.0 2.0 96.0
8.12
1 1.0 1.0 97.0
8.16
2 2.0 2.0 99.0
8.43
1 1.0 1.0 100.0
------ ------- -------
Total 100 100.0
100.0 |
接着输出各基本统计指标,其中均数为7.366, 标准误为0.039,
中位数为7.350, 众数为7.350, 标准差为0.394, 方差为0.155, 峰度系数为0.034,
峰度系数的标准误为0.478, 偏度系数为0.06, 偏度系数的标准误为0.241,
全距为2.000, 最小值为6.430, 最大值为8.430, 25%位数为7.120, 50%位数为7.350,
75%位数为7.580,共100个观察值,无缺失值。
Mean
7.366 Std
err .039 Median 7.350 Mode
7.350 Std
dev .394 Variance .155 Kurtosis
.034 S
E Kurt .478 Skewness .060 S E Skew
.241 Range 2.000 Minimum 6.430 Maximum
8.430 Percentile Value
Percentile Value
Percentile Value 25.00 7.120 50.00 7.350 75.00 7.580 Valid cases
100 Missing
cases 0 |
最后系统输出带有正态曲线的直方图(图4.4),由图中可见,数据基本呈现正态分布形状。
图4.4 频数分布的直方图 |
从上述内容可知,系统在未特别指定的情形下,频数分布表是按照原始数值逐一作频数分布的,这与日常需要的等距分组、且组数保持在8~15组的要求不符。为此,在调用Frequencies过程命令之前,可先对原始数据进行算术处理:已知最小值为6.430,最大值为8.430,全距为2.000,故可要求分成10组,起点为6.4,组距为0.2。选Transform菜单Recode项的Into
Different Variable...命令项,在弹出的Recode Into Different Variable对话框中选x点击钮使之进入Numeric Variable®Output Variable框,在Output Variable栏的Name处输入x1,点击Change钮表示新生成的变量名为x1。点击Old
and New Values钮弹出Recode Into Different Variable:Old and New Values对话框,在Old
value栏内选Range项,输入第一个分组的数值范围:6.4~6.599,在New value栏内输入新值:6.4,点击Add钮,依此将各组的范围及对应的新值逐一输入,最后点击Continue钮返回Recode
Into Different Variable对话框,再点击OK钮即完成。系统在原数据库中生成一新变量为x1,这时调用Frequencies过程命令将输出等距分组且组数为10的频数分布表。
X1
Valid Cum Value Label
Value Frequency Percent Percent Percent
6.40
3 3.0 3.0 3.0
6.60
5 5.0 5.0 8.0
6.80
8 8.0 8.0 16.0
7.00 12 12.0 12.0 28.0
7.20 25 25.0 25.0 53.0
7.40 23 23.0 23.0 76.0
7.60 10 10.0 10.0 86.0
7.80
7 7.0 7.0 93.0
8.00
6 6.0 6.0 99.0
8.40
1 1.0 1.0 100.0
------- -------
-------
Total 100 100.0 100.0 Valid cases
100 Missing
cases 0 |
第二节
Descriptives过程
4.2.1
主要功能
调用此过程可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,且可将原始数据转换成标准Z分值并存入数据库,所谓Z分值是指某原始数值比其均值高或低多少个标准差单位,高的为正值,低的为负值,相等的为零。
4.2.2
实例操作
[例4-2]调查20名男婴的出生体重(克)资料如下,试作描述性统计。
2770 2915 2795 2995 2860 2970 3087 3126 3125 4654 2272 3503 3418 3921 2669 4218 3707 2310 2573 3881 |
4.2.2.1 数据准备
激活数据管理窗口,定义男婴出生体重的变量名为X,然后输入男婴出生体重的原始数据。
4.2.2.2 统计分析
激活Statistics菜单选Summarize中的Descriptives...命令项,弹出Descriptives对话框(图4.5)。现欲对男婴出生体重进行描述性分析,故在对话框左侧的变量列表中选x,点击钮使之进入Variable(s)框;本例要求将原始数据转换成z分值,故选Save
standardized value as variables项。
图4.5 描述性统计对话框 |
点击Options...钮,弹出Descriptives:Options对话框(图4.6)。框中各指标的意义请读者参阅本章第一节。选好项目后点击
Continue钮返回Descriptives对话框,再点击OK钮即可。
图4.6 描述性统计指标对话框 |
4.2.2.3 结果解释
在结果输出窗口中将看到如下统计数据:均数为3188.450, 标准误为140.681, 标准差为629.146, 方差为395824.997,
峰度系数为0.118, 峰度系数的标准误为0.992, 偏度系数为0.732,
偏度系数的标准误为0.512, 全距为2382.000, 最小值为2272, 最大值为4654,
有效例数为100,无缺失值。
Number of valid observations (listwise) = 20.00 Variable X Mean
3188.450
S.E. Mean
140.681 Std Dev
629.146
Variance 395824.997 Kurtosis
.118
S.E. Kurt
.992 Skewness
.732
S.E. Skew
.512 Range
2382.000
Minimum 2272 Maximum
4654
Sum
63769.000 Valid observations - 20 Missing
observations - 0 |
此外,系统以zx为变量名将原始数据转换成标准z分值,存放在原数据库中(图4.7)。例如,已知均数为3188.450,
标准差为629.146,故原始值2770的Z分值为
= - 0.66511;原始值2770的Z分值为
= 1.10078。新变量具有均值为0、标准差为1的特征,亦即变量的标准化过程。
图4.7 原始数据及其标准Z分值 |
第三节
Explore过程
4.3.1
主要功能
调用此过程可对变量进行更为深入详尽的描述性统计分析,故称之为探索性统计。它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户思考对数据进行进一步分析的方案。
4.3.2
实例操作
[例4-3]下表为30名10岁少儿的身高(cm)资料,试作探索性分析。
编号 |
身高 |
|
男孩 |
女孩 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
121.4 131.5 132.6 129.2 134.1 135.8 140.4 136.0 128.2 137.4 135.5 129.0 132.2 140.9 129.3 |
133.4 132.7 130.1 136.7 139.7 133.0 140.3 124.0 125.4 137.5 120.9 138.8 138.6 141.4 137.5 |
4.3.2.1 数据准备
激活数据管理窗口,定义少儿身高的变量名为X,然后再定义一个变质为SEX,用于作性别分组。顺序输入少儿身高的原始数据,在变量SEX中,男孩输入1、女孩输入2。
4.3.2.2 统计分析
激活Statistics菜单选Summarize中的Explore...项,弹出Explore对话框(如图4.8),现欲对少儿身高资料进行分组的探索性分析,故在对话框左侧的变量列表中选x点击钮使之进入Dependent List框,再选sex点击钮使之进入Factor List框。
图4.8 探索性分析对话框 |
点击Statistics...钮,弹出Explore:Statistics对话框(图4.9),有如下选项:
1、Descriptives:输出均数、中位数、众数、5%修正均数、标准误、方差、标准差、最小值、最大值、全距、四分位全距、峰度系数、峰度系数的标准误、偏度系数、偏度系数的标准误;
2、M-estimators:作中心趋势的粗略最大似然确定,输出四个不同权重的最大似然确定数;
3、Outliers:输出五个最大值与五个最小值;
4、Percentiles:输出第5%、10%、25%、50%、75%、90%、95%位数;
5、Grouped
Frequency tables:输出分组的例数与数值范围表。
本例全部选择,之后点击Continue钮返回Explore对话框。
图4.9 探索性分析统计对话框 |
点击Plot...钮弹出Explore:Plot对话框(图4.10),在Boxplot栏内选Factor
levels together项要求按组别进行箱图绘制;在Descriptive栏内选Stem-and-leaf项要求作茎叶情形描述。之后点击Continue钮返回Explore对话框,再点击OK钮即可。
图4.10 探索性分析绘图对话框 |
4.3.2.3 结果解释
在结果输出窗口中将看到如下统计数据:
先输出男孩的数据。共15例,无缺失值,其均数为132.9,中位数为132.6,5%修正均数为133.0944,均数的95%置信区间为130.0706~132.7294,标准误为1.3192,方差为26.1043,标准差为5.1092,最小值为121.4,最大值为140.9,全距为19.5,四分位全距为6.8,偏度系数为-0.4239,偏度系数的标准误为0.5801,峰度系数为0.4961,峰度系数的标准误为1.1209。
接着输出四个不同权重下作中心趋势的粗略最大似然确定数,对于伴有长拖尾的对称分布数据或带有个别极端数值的数据,用粗略最大似然确定数替代均数或中位数,结果更准确。系统还进行数据的茎叶情形描述。如系统指出男孩的身高资料中,有一个数值是茎为12,叶为1,其实该数值是121.4;有四个数值是茎为12,叶为8999,其实这些数值是129.2、128.2、190.0、129.3。
再接着输出百分位数:第5%位数是121.4,第10%数是125.48,第25%位数是129.2,第50%位数是132.6,第75%位数是136,第90%位数是140.6。并输出最大五个数和最小五个数:最大五个数是140.9,140.4,137.4,136.0,135.8;最小五个数是121.4,128.2,129.0,129.2,129.3。
最后输出频数分布表。
X By SEX
1 Valid
cases: 15.0 Missing cases: .0
Percent missing: .0 Mean
132.9000 Std Err 1.3192 Min
121.4000 Skewness -.4239 Median
132.6000 Variance 26.1043
Max 140.9000 S E Skew .5801 5%Trim
133.0944 Std Dev 5.1092 Range
19.5000 Kurtosis .4961 95% CI for Mean (130.0706, 135.7294) IQR 6.8000 S E Kurt 1.1209
M-Estimators
------------ Huber ( 1.339)
132.9127 Tukey ( 4.685)
133.0901 Hampel
( 1.700, 3.400, 8.500) 133.0153 Andrew
( 1.340 * pi ) 133.0904 Frequency Stem & Leaf
1.00 12
* 1
4.00 12
. 8999
4.00 13
* 1224
4.00 13
. 5567
2.00 14
* 00 Stem
width: 10.0 Each
leaf: 1
case(s)
Percentiles
----------- Percentiles
5.0000 10.0000 25.0000
50.0000 75.0000 90.0000
95.0000 Haverage
121.4000 125.4800 129.2000 132.6000 136.0000 140.6000 Tukey's Hinges
129.2500 132.6000 135.9000
Extreme Values
------- ------
5 Highest Case #
5 Lowest Case #
140.9 Case: 14
121.4 Case: 1
140.4 Case: 7
128.2 Case: 9
137.4 Case: 10
129.0 Case: 12
136.0 Case: 8
129.2 Case: 4
135.8 Case: 6
129.3 Case: 15
Frequency Table
--------- -----
Bin
Valid Cum
Center
Freq Pct Pct Pct
126.4
5.00 33.33 33.33 33.33
136.4 10.00 66.67
66.67 100.00 |
下一部分为系统输出的女孩资料分析结果,其意义同上述。
X By SEX
2 Valid cases: 15.0 Missing cases: .0
Percent missing: .0 Mean 134.0000 Std Err 1.6428 Min
120.9000 Skewness -.8937 Median 136.7000
Variance 40.4829 Max
141.4000 S E Skew .5801 5% Trim 134.3167
Std Dev 6.3626 Range
20.5000 Kurtosis -.2747 95% CI for Mean
(130.4765, 137.5235) IQR 8.7000 S E Kurt
1.1209
M-Estimators
------------ Huber (
1.339)
135.4183 Tukey ( 4.685)
136.2104 Hampel ( 1.700, 3.400, 8.500) 135.1852 Andrew ( 1.340 * pi ) 136.2327 Frequency
Stem & Leaf 2.00 12 * 04 1.00 12 . 5 4.00 13 * 0233 6.00 13 . 677889 2.00 14 * 01 Stem width:
10.0 Each leaf:
1 case(s) Percentiles
----------- Percentiles 5.0000
10.0000 25.0000 50.0000
75.0000 90.0000 95.0000 Haverage 120.9000
122.7600 130.1000 136.7000 138.8000 140.7400 Tukey's Hinges
131.4000 136.7000 138.7000
Extreme Values
------- ------ 5
Highest Case #
5 Lowest Case # 141.4 Case: 29
120.9 Case: 26 140.3 Case: 22
124.0 Case: 23 139.7 Case: 20
125.4 Case: 24 138.8 Case: 27
130.1 Case: 18 138.6 Case: 28
132.7 Case: 17
Frequency Table
--------- -----
Bin
Valid Cum
Center
Freq Pct Pct Pct
125.9
4.00 26.67 26.67 26.67
135.9
10.00 66.67 66.67 93.33
145.9
1.00 6.67 6.67 100.00 |
此外,按用户要求,系统输出箱图。图中方箱为四分位数,中心粗线为中位数,两端线为最大值与最小值。
图4.11 性别分组少儿身高资料的箱图 |
第四节
Crosstabs过程
4.4.1
主要功能
调用此过程可进行计数资料和某些等级资料的列联表分析,在分析中,可对二维至n维列联表(RC表)资料进行统计描述和χ2 检验,并计算相应的百分数指标。此外,还可计算四格表确切概率(Fisher’s Exact Test)且有单双侧( One-Tail、
Two-Tail),对数似然比检验(Likelihood Ratio)以及线性关系的Mantel-Haenszelχ2 检验。
4.4.2
实例操作
[例4-4]用两组大白鼠诱发鼻咽癌的动物实验中,一组单纯用亚硝胺鼻注,另一组附加维生素B12 ,
生癌率如下表,问两组生癌率有无差别?
动物分组 |
生癌鼠数 |
未生癌鼠数 |
合计 |
生癌率(%) |
亚硝胺组 亚硝胺+B12组 |
52 39 |
19 3 |
71 42 |
73.2 92.9 |
合计 |
91 |
22 |
113 |
80.5 |
4.4.2.1 数据准备
激活数据管理窗口,定义变量名:count为频数变量(行列对应的频数值),group为组变量(行),test为试验结果变量(列)。按顺序输入相应的变量(图4.12)。
图4.12 原始数据的输入 |
4.4.2.2 统计分析
在进行计数资料的分析前,应对频数变量的值进行加权处理。先激活Data菜单,
选Weight Cases...项,弹出Weight Cases对话框,选Weight cases by,再选变量count点击钮使之进入Frequence Variable框中,点击OK钮完成加权。
激活Statistics菜单,选Summarize中的Crosstabs...项,弹出Crosstabs对话框(如图4.13示)。在Crosstabs对话框中,选group点击钮使之进入Row(s)框,选test点击钮使之进入Column(s)框。点击Statistics...钮,弹出Crosstabs:Statistics对话框(图4.14),
其中Chi-square即为读者所熟悉的χ2 检验。由于在实际研究中,变量间的依赖强度和特征也是需要考虑的,χ2 值不是列联强度的好的度量,故用户可根据实际需要选择其他相关的指标:
图4.13 列联表分析对话框 |
图4.14 列联表统计方法对话框 |
1、定距变量的关联指标
Correlations:可作列联表行、列两变量的Pearson相关系数或作伴随组秩次的Spearman相关系数。
2、定类变量的关联指标
Contingency
coefficient:列联系数,其值 =
,界于0~1之间,其中N为总例数;
Phi
and Cramer's V:ψ系数 =
,用于描述相关程度,在四格表χ2 检验中界于-1~1之间,在RC表χ2 检验中界于0~1之间;Cramer's V =
,界于0~1之间,其中k为行数和列数较小的实际数;
Lambda:λ值,在自变量预测中用于反映比例缩减误差,其值为1时表明自变量预测应变量好,为0时表明自变量预测应变量差;
Uncertainty
coefficient:不确定系数,以熵为标准的比例缩减误差,其值接近1时表明后一变量的信息很大程度来自前一变量,其值接近0时表明后一变量的信息与前一变量无关。
3、定序变量的关联指标
Gamma:γ值
=
,P为同序对子数,Q为异序对子数,界于0~1之间,所有观察实际数集中于左上角和右下角时,其值为1;
Somers'D:Somers'D值
=
,T
为独立变量上不存在同分的偶对中,同序对子数超过异序对子数的比例;
Kendall's
tau-b:Kendall τ
=
,T
为在V1变量上是同序在V2变量上不是的对子数,
T
为在V2变量上是同序在V1变量上不是的对子数,Kendall
τ
值界于-1~1之间;
Kendall's
tau-c:Kendall τ
=
,m为行数和列数较小的实际数,Kendall
τ
值界于-1~1之间。
4、其他指标
Kappa:内部一致性系数;
Eta:Eta值,其平方值可认为是应变量受不同因素影响所致方差的比例;
Risk:相对危险度。
点击Cells...钮,弹出Crosstabs:Cells对话框(图4.15),用于定义列联表单元格中需要计算的指标。Observed为实际观察数,Expected为理论数,Row为行百分数,Column为列百分数,Total为合计百分数,Raw为实际数与理论数的差值,Standardized为实际数与理论数的差值除理论数,Adj.
Standardized为由标准误确立的单元格残差。选择后点击Continue钮返回Crosstabs对话框,再点击OK钮即可。
图4.15 列联表单元对话框 |
4.4.2.3 结果解释
在结果输出窗中,系统先输出四格表资料,包括实际观察数、理论数、行百分数、列百分数和合计百分数。
TEST by GROUP
GROUP
Count |
Exp Val |
Row Pct |
Col Pct |
Row
Tot Pct | 1| 2| Total TEST
--------+--------+--------+
1 |
52 |
39 |
91
| 57.2
| 33.8 | 80.5%
| 57.1% | 42.9% |
| 73.2% | 92.9% |
| 46.0% | 34.5% |
+--------+--------+
2 |
19 |
3 |
22
| 13.8
| 8.2 | 19.5%
| 86.4% | 13.6% |
| 26.8% | 7.1% |
| 16.8% | 2.7% |
+--------+--------+
Column 71 42 113
Total 62.8% 37.2%
100.0% |
接着输入有关统计数据,Pearson
χ2值为6.47766,P值为0.01092,可认为亚硝胺+B12组的生癌率较高;校正χ2值为5.28685,P值为0.02149;M-T检验χ2值为 6.42034,P值为0.01128;最小理论数为8.177,故不需作精确概率计算。(如果四格表中有理论频数小于5时,Crosstabs命令会自动进行Fisher精确概率计算)。
内部一致性系数为-0.21731,Pearson相关系数和Spearman相关系数均为0.23943。
第一组对第二组的相对危险性RR值为21%左右(0.21053),即可认为第二组生癌的相对危险性为第一组的4.75倍。
Chi-Square
Value
DF
Significance -------------------- ----------- ----
------------ Pearson
6.47766
1
.01092 Continuity Correction 5.28685 1
.02149 Likelihood Ratio
7.31007
1
.00686 Mantel-Haenszel test for 6.42034 1
.01128 linear
association Minimum Expected Frequency - 8.177
Approximate Statistic
Value ASE1 Val/ASE0 Significance -------------------- ---------
------- -------- ------------ Kappa
-.21731 .07083 -2.54513 Pearson's R
-.23943 .07447 -2.59807 .01065 *4 Spearman Correlation -.23943 .07447
-2.59807 .01065 *4 *4 VAL/ASE0 is a t-value based on a normal
approximation, as is the significance
Statistic
Value
95% Confidence Bounds -------------------- -------- ----------------------- Relative Risk Estimate (TEST 1 / TEST 2) : case
control
.21053
.05816
.76211 cohort
(GROUP 1 Risk) .66165
.51872
.84397 cohort
(GROUP 2 Risk) 3.14286 1.06940 9.23654 Number of Missing Observations: 0 |