一、总体平均数的区间估计
(一)总体正态分布,总体标准差已知
这时样本平均数抽样分布服从正态分布,样本平均数与总体平均数的差异为。当置信度是95%时,P(
≤
≤
)=0.95。即总体平均数
落在区间(
,
)内的可能性有95%;其中
为上置信界限,
为下置信界限。
当置信度为99%时,则相应的置信区间为[,
],其中,
为上置信界限,
为下置信界限。
如已知学生综合测试成绩服从正态分布,从中随机抽取=25和
=36两个样本,其平均数分别为
=68,
=69.2。已知总体的标准差为10.6,试估计总体平均数
的置信度为95%和99%的置信区间。
解:先用=25样本的估计总体平均数
。当置信度为95%时:
=
63.84
=
72.16
当置信度为99%时:
=
62.53
=
73.47
所以,总体平均数有95%的把握出现在63.84~72.16之间,在这区间之外的可能性只有5%;有99%的把握出现在62.53~73.47之间,犯错误的概率为 1%。
同理,根据=36的样本估计总体平均数
。
0.95的置信区间为:<
<
,即65.74<
<72.66。
0.99的置信区间为:<
<
,即64.64<
<73.76。
总体平均数置信度为0.95的置信区间是(65.74,72.66),置信度为为0.99的置信区间是(64.64,73.76)。即总体平均数有95%的把握出现在65.74~72.66之间,有99%的把握出现在64.64~73.76之间,犯错误的概率为 1%。
以上可以看出,当样本容量是一定时,置信区间的大小与置信度有关,置信度越高,则置信区间越大;置信度低,置信区间也低。当置信度一定时,置信区间的大小与样本容量有关,随着样本容量增大,置信区间也会随着减小,样本平均数的值也更接近总体平均数。因此,在条件允许的情况下,用较大样本的统计量估计总体参数更具有优越性。
(二)总体正态分布,总体标准差未知
1.当n≥30时,平均数的抽样分布为渐进正态分布,用样本标准差代替总体标准差
,所以总体平均数置信度为0.95的置信区间为(
,
);置信度为0.99的置信区间为(
,
)。
如果设置信度为1-α,α为小概率(常取值为0.05和0.01)。当总体标准差已知,或总体标准差未知但大样本时,区间估计公式为:
下置信界限:
上置信界限:
如从某区初三学生的数学推理测试成绩中随机抽取81名学生的成绩,其平均数为72分,标准差为=9.4分。已知全区初三学生的数学推理成绩服从正态分布。试以95%置信度估计该区初三学生数学推理测试平均水平的置信区间。
解:由于学生数学推理测试成绩服从正态分布,n=81,所以,按正态分布的理论对总体平均数进行估计。由于α=-0.95=0.05,所以
下置信界限:=
=69.95
上置信界限:=
=74.05
即该区初三学生数学推理测试平均成绩在[69.95,74.05]范围的可能性为95%,犯错误的概率为0.05。
2.当n<30时,样本平均数的抽样分布为t分布,某一可靠度下总体平均数的区间估计要依据t分布来进行。可以通过t值表查出,
的置信度为1-α的置信区间为:
下置信界限:
上置信界限:
如从某区小学四年级学生的自学能力测验中随机抽取17名学生的测试分数,求得其平均数为75分,标准差为=12.3分。已知四年级学生的自学能力服从正态分布,请以99%置信度估计该区四年级学生自学能力平均水平的置信区间。
解:由于总体标准差未知,而且n<30,样本平均数服从t分布,自由度为n-1;由于置信度为0.99,则α=0.01;查t分布表,t(16)=2.921,所以
=
=66.02
=
=83.98
即全区四年级学生自学能力的平均水平出现在[66.02,83.98]这一区间的可能性有99%,而在此区间以外的可能性只有0.01。
(三)总体非正态分布
无论总体方差已知与否,当总体非正态分布时,只有样本容量n≥30时,才能用样本平均数的抽样分布理论来估计总体平均数。由于此时样本平均数的抽样分布近似正态分布,所以可采用正态分布理论对总体平均数进行区间估计。
二、总体比率的区间估计
问题导入中用64名学生成绩的优秀率估计320名学生的优秀率属于总体比率的区间估计。总体比率的区间估计一般在较大样本情况下才有意义。
比率抽样分布的标准差也称为标准误,记作。当总体比率
、
已知时,比率的标准误为:
当总体比率、
未知时可用
和
代替,标准误为:
当≥5或
≥5(
和
中较小者)时,样本比率近似服从正态分布,此时总体比率区间估计的公式为:
下置信界限:
上置信界限:
如某小学要研究小学生的智力水平与学生学习成绩的关系,随机抽取二年级学生80名,用韦克斯勒智力测验量表测量他们的智力水平,结果智商成绩在110分以上的有58名,试以95%的可靠性估计全校二年级学生智力测验分数总体在110分以上者占总体比例的置信区间。
解:已知0.725,
=0.275,n=40,则
=0.05
置信度为0.95时,,所以
总体比率的上置信界限为:
0.823
总体比率的下置信界限为:
0.627
即有95%的把握认为,全校二年级学生智力测验分数在110分以上的比率会在62.7%~82.3%之间,在这一区间以外的可能性只有5%。