当前位置 > 第七章 方差分析 > 第二节 单因素方差分析
第二节 单因素方差分析
单因素方差分析,其目标是检验水平均值μj是否相等,如果相等,则我们说该因素对X不产生影响,反之,就认为该因素对X存在影响。单因素方差分析的步骤如下文所述。
一、建立假设
方差分析的第一步是建立假设。以饮料颜色对销售量的影响为例,针对我们关心的问题提出原假设和备择假设。
H0:μ1=μ2=μ3=μ4颜色对销售量没有影响
H1:μ1,μ2,μ3,μ4 不全相等,颜色对销售量有影响。
注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等。
二、计算水平均值
令表示第j种水平的样本均值,则
式中:xij为第j种水平下的第I个观察值;nj第j种水平的观察值个数。
计算总均值的一般表达式为:
总均值:是所有观察值的总和除以观察值的总数,即
(注:各个样本容量相等)
三、计算离差平方和
在单因素方差分析中,离差平方和有三个,它们分别是总离差平方和,误差项离差平方和以及水平项离差平方和。
1.总离差平方和。用SST(Sum of Squares for Total)代表,即
2.误差项离差平方和(组内),用SSE(Sum of Squares For Error)代表,有时也用Within来表示组间即SSW,以SSE为例其计算公式为:
SEE或SSW反映的是水平内部,或组内观察值的离散状况,实质上反映了随机因素带来的影响。
3.水平项离差平方和(组间)
若把单因素方差分析中的因素称为A或b,则水平项离差平方可以用SSA(Sum of Squares for factor A)或中间(bossom)即SSb表示。以SSA为例的计算公式为:
说明:用各组均值?? 减去总均值? 的离差的平方,乘以各组观察值个数nj,然后加总,即可得到SSA,它的表现的是组间差异,其中即包括随机因素,也包括系统因素。
SST,SSE,SSA之间的关系:SST=SSE+SSA
证明:∵在各组同为正态分布,等方差条件下,等式右边 最后一项为零。则有:
SST=SSE+SSA
四、计算平均平方
用离差平方和除以自由度即可得到平均平方。对SST来说,其自由度为n-1。对SSA来说,其自由度为r-1,这里r表示水平的个数。对SSE来说,其自由度为n-r。SST、SSA、SSE之间的自由度也存在着如下的关系:
n-r=(r-1)+(n-r)
所以:对于SSA或SSb,其平均平方MSA或MSb为:
对于SSE,其平均平方MSE或MSW为:
五、方差分析表
F值的计算为:
把前面一系列有关计算结果列成表格的形式,称为方差分析表。
表7-1 方差分析表
方差来源 |
高差平方和 |
自由度 |
平均平方 |
F值 |
组间 |
SSA |
r-1 |
MSA |
MSA/MSE |
组内 |
SSE |
n-r |
MSE |
— |
总差异 |
SST |
n-1 |
— |
— |
六、统计决策
把F值与Fa值比较:
若F>Fa拒绝原假设,则接受备择假设。
若F<Fa接受原假设。