当前位置:课程学习>>第四章>>知识讲解>>文本学习>>知识点五

第四章  概率分布与参数估计



知识点五:总体平均数与总体比率的区间估计


一、总体平均数的区间估计

(一)总体正态分布,总体标准差已知

这时样本平均数抽样分布服从正态分布,样本平均数与总体平均数的差异为。当置信度是95%时,P()=0.95。即总体平均数落在区间()内的可能性有95%;其中为上置信界限,为下置信界限。

当置信度为99%时,则相应的置信区间为[],其中,为上置信界限,为下置信界限。

如已知学生综合测试成绩服从正态分布,从中随机抽取=25和=36两个样本,其平均数分别为=68,=69.2。已知总体的标准差为10.6,试估计总体平均数的置信度为95%和99%的置信区间。

解:先用=25样本的估计总体平均数。当置信度为95%时:

=63.84

=72.16

当置信度为99%时:

=62.53

=73.47

所以,总体平均数有95%的把握出现在63.84~72.16之间,在这区间之外的可能性只有5%;有99%的把握出现在62.53~73.47之间,犯错误的概率为 1%。

同理,根据=36的样本估计总体平均数

0.95的置信区间为:<<,即65.74<<72.66。

0.99的置信区间为:<<,即64.64<<73.76。

总体平均数置信度为0.95的置信区间是(65.74,72.66),置信度为为0.99的置信区间是(64.64,73.76)。即总体平均数有95%的把握出现在65.74~72.66之间,有99%的把握出现在64.64~73.76之间,犯错误的概率为 1%。

以上可以看出,当样本容量是一定时,置信区间的大小与置信度有关,置信度越高,则置信区间越大;置信度低,置信区间也低。当置信度一定时,置信区间的大小与样本容量有关,随着样本容量增大,置信区间也会随着减小,样本平均数的值也更接近总体平均数。因此,在条件允许的情况下,用较大样本的统计量估计总体参数更具有优越性。

(二)总体正态分布,总体标准差未知

1.当n≥30时,平均数的抽样分布为渐进正态分布,用样本标准差代替总体标准差,所以总体平均数置信度为0.95的置信区间为();置信度为0.99的置信区间为()。

如果设置信度为1-αα为小概率(常取值为0.05和0.01)。当总体标准差已知,或总体标准差未知但大样本时,区间估计公式为:

下置信界限:

 

上置信界限:

  


如从某区初三学生的数学推理测试成绩中随机抽取81名学生的成绩,其平均数为72分,标准差为=9.4分。已知全区初三学生的数学推理成绩服从正态分布。试以95%置信度估计该区初三学生数学推理测试平均水平的置信区间。

解:由于学生数学推理测试成绩服从正态分布,n=81,所以,按正态分布的理论对总体平均数进行估计。由于α=-0.95=0.05,所以

下置信界限:==69.95

上置信界限:==74.05

即该区初三学生数学推理测试平均成绩在[69.95,74.05]范围的可能性为95%,犯错误的概率为0.05。

 

2.当n<30时,样本平均数的抽样分布为t分布,某一可靠度下总体平均数的区间估计要依据t分布来进行。可以通过t值表查出,的置信度为1-α的置信区间为:

下置信界限:

 

上置信界限:

  

如从某区小学四年级学生的自学能力测验中随机抽取17名学生的测试分数,求得其平均数为75分,标准差为=12.3分。已知四年级学生的自学能力服从正态分布,请以99%置信度估计该区四年级学生自学能力平均水平的置信区间。

解:由于总体标准差未知,而且n<30,样本平均数服从t分布,自由度为n-1;由于置信度为0.99,则α=0.01;查t分布表,t(16)=2.921,所以

==66.02

==83.98

即全区四年级学生自学能力的平均水平出现在[66.02,83.98]这一区间的可能性有99%,而在此区间以外的可能性只有0.01。

(三)总体非正态分布

无论总体方差已知与否,当总体非正态分布时,只有样本容量n≥30时,才能用样本平均数的抽样分布理论来估计总体平均数。由于此时样本平均数的抽样分布近似正态分布,所以可采用正态分布理论对总体平均数进行区间估计。

二、总体比率的区间估计

问题导入中用64名学生成绩的优秀率估计320名学生的优秀率属于总体比率的区间估计。总体比率的区间估计一般在较大样本情况下才有意义。

比率抽样分布的标准差也称为标准误,记作。当总体比率已知时,比率的标准误为:

  

当总体比率未知时可用代替,标准误为:

  

≥5或≥5(中较小者)时,样本比率近似服从正态分布,此时总体比率区间估计的公式为:

下置信界限:

 

上置信界限:

  


如某小学要研究小学生的智力水平与学生学习成绩的关系,随机抽取二年级学生80名,用韦克斯勒智力测验量表测量他们的智力水平,结果智商成绩在110分以上的有58名,试以95%的可靠性估计全校二年级学生智力测验分数总体在110分以上者占总体比例的置信区间。

解:已知0.725,=0.275,n=40,则

=0.05

置信度为0.95时,,所以

总体比率的上置信界限为:0.823

总体比率的下置信界限为:0.627

即有95%的把握认为,全校二年级学生智力测验分数在110分以上的比率会在62.7%~82.3%之间,在这一区间以外的可能性只有5%。

 

进入知识点六的学习