当前位置:课程学习>>第四章>>知识讲解>>文本学习>>知识点一

第四章 概率分布与参数估计



知识点一:概率与二项分布


一、随机事件

问题导入中在320名学生中随机抽取一名学生,可能是男生,也可能是女生;64名学生的成绩有高有低,等等。像这样的现象是随机现象。概率论是从量的方面研究随机现象的统计规律的科学。随机现象中出现的各种可能的结果,叫做随机事件,简称事件。常用大写字母A、B、C……表示。如随机抽取的 64名学生,结果可能是没有不及格,可能是有一个不及格,也可能是有两个不及格,或者不及格数不多于4等等。其中每一个结果都是一个事件。“没有不及格”、“有一个不及格”、“有两个不及格”等叫做基本事件(不能分解为其他事件的最简单事件);而不及格数不多于4个等叫做复合事件(由若干个基本事件复合而成)。一般来说,在试验条件下必然发生的结果叫做必然事件,不可能发生的结果叫做不可能事件。

二、事件的概率

(一)频率

在抽取的64名学生中,女生30名,抽取学生为女生这一事件的频率就是30/64。所以对于随机事件A,如果在N次试验中出现次,则A发生的频率为:    

(二)经验概率

某事件在试验中发生的次数与试验总次数的比值为频率。试验次数越多,该事件发生的频率会在某个常数上下波动,当试验次数无穷时该事件发生的频率会与这个常数相等,这个常数称为该事件的概率。

一个事件的频率是变量。这是因为在n次试验中,事件A发生的次数不是一个固定的常数,它可以随机地取0、1、2、……n中的任何一个值。但多次试验,会发现频率具有稳定性。历次统计学家抛掷硬币正面向上的试验结果可以说明这一点。

历次统计学家抛掷硬币的试验结果

试验者

掷币次数

正面出现频率

蒲丰

4040

0.5069

棣莫根

4092

0.5005

杰万斯

20480

0.5068

皮尔逊

24000

0.5005

罗曼诺夫斯基

80640

0.4979

费   勤

10000

0.4923

(三)先验概率

也称古典概率。如果试验满足各种可能结果(基本事件)是有限的、各种可能结果发生的可能性不变这两个条件,则称此试验为古典型试验。设试验的一切基本事件有N个,而事件A所包含的基本事件有K个,则事件A的概率定义为:

         

如“问题导入”中随机抽取一名学生为女生的概率为150/320。

(四)概率的性质

频率是大量试验的结果,是一个随试验次数变化而变化的数值,是事件发生的外在表现,是一个变量;概率是一个确定值,体现了事件发生的内在实质,是一个常量。概率的性质有以下三条:

(1)对于任何事件A,总有0≤≤1。

(2)若U为必然事件,则=1 。

(3)若V为不可能事件,则=0 。

(五)小概率事件

如果某一事件发生的概率很小,即在多次重复试验的情况下,发生的概率小于或等于0.05,则称其为小概率事件。比如买彩票中大奖就是一个小概率事件。小概率事件在一次试验中几乎不可能发生,这是在统计推断时所依据的基本原理。

三、概率的两个法则

(一)概率的加法法则

事件A和事件B是两个互不相容的随机事件,则事件A与事件B之和的概率等于这两个事件分别发生的概率的和,即

(A+B)=P(A)+P(B) 

互不相容事件是指事件A与事件B不可能在一次试验中同时发生。如做一道是非判断题,要么做对,要么做错。两事件和的概率是指两事件中有一个发生,则第三件事(A+B)发生的概率(A发生或B发生)。

如某幼儿园中班有122名幼儿,其中朝鲜族幼儿10人,回族6人,蒙族3人,其余是汉族学生,若从中班幼儿中随机抽取一个孩子,问抽到少数民族的孩子的概率是多少?

解:设A、B、C分别表示朝鲜族、回族和蒙族孩子三个事件,而A+B+C则表示少数民族孩子这一事件,在122名孩子中随机抽取一个孩子恰是少数民族学生的概率是

(A+B+C)=(A)+P(B)+(C)==0.156

注意互不相容事件和对立事件的区别。两个互不相容事件的概率之和不一定为1,而两个对立事件的概率之和必然等于1,对立事件是互不相容事件的一种特殊情况。

(二)概率的乘法法则

若事件A和事件B相互独立,则这两个事件之积的概率等于这两个事件分别发生的概率之积,即P(A·B)=P(A)·P(B)

相互独立事件是指其中任何一个事件发生与否,都不影响另一个事件发生的可能性。而两个事件之积的概率是两个事件分别发生的概率的积。如凭猜测做两道是非判断题,第一题猜对与否和第二题没有关系。第一题猜对且第二题也猜对的概率即是两道题猜对的概率之积。

如某校二年级共有学生90人,其中一班有学生48人,二班有学生42人,在一次语文考试中,共有70人在80分以上。假如两班学生学习成绩是均衡的,那么从全年级随机抽取1名得80分以上且是二班学生的概率是多少?

解:设A和B分别表示80分以上和二班这两个事件,由于A和B是独立的,因此这个问题的解决符合概率的乘法法则。随机抽取一个学生,抽到80分以上而且是二班学生的概率就是A、B两个事件同时发生的概率P(A·B),由于

P(A)=,P(B)=

所以P(A·B)=P(A)·P(B)

从全年级随机抽取1名学生,抽得80分以上而且是二班学生的概率是0.36。

四、二项分布的概念

二项分布是二项试验中各种可能结果的概率分布,是教育研究与管理中常用的一种离散型随机变量的概率分布。

(一)二项试验

凡满足下列条件的试验称为二项试验:(1)任何一次试验的结果只有两种可能,即成功或失败,如判断正误题、选择题等;(2)若成功的概率为 p,失败的概率为 q,则 p+q=1;(3)每次试验中成功或失败的概率不变,即成功的概率在第一次试验中为p,则在n次试验中的概率都是p;(4)各次试验结果相互独立。

(二)二项分布

二项分布是指在二项试验中,如果n次试验中事件A可能出现的次数kk=0,1,…,n)是随机的,也就是n +1个概率值,则事件A出现各种可能结果的概率分布。二项分布中事件A出现k次及其概率与二项展开式的各项相对应。

当学生完全凭猜测回答两道是非题时,其可能结果有三种:全猜对、一对一错、全猜错。若猜对事件为A,猜错事件为B,则

全猜对的概率为:

一对一错的概率:

全错的概率为:

,即

当学生凭猜测回答三道是非题时,可能结果有四类:全猜对、猜对两道错一道、猜对一道错两道、全猜错,共八种可能情况,各种情况的概率为: 、。这八种情况的概率分布如下图所示:

由上图可知,学生做三道是非题,做对不同题目数量的概率分布可以用三次二项式的展开式来表达。同样可推知,当学生做四道是非题时,做对不同题目数量的概率之和可表示为:

由此可见,二项试验的各种可能结果出现的概率,恰是二项展开式各项的值,试验的次数就是二项式的指数。二项展开式的一般形式是:

 

展开式中任何一项 表示在n次试验中某事件发生 k次的概率,而系数表示在所有可能结果中,这种结果出现的次数为。因此,

n次试验中某事件发生k 次的概率可概括为一个通式:

(k=0,1,2,…,n)

这个通式叫二项分布函数式,运用这一函数式可以直接求出n次试验中A事件出现k次的概率。

某中学生凭猜测做7道是非题,问7道题中答对2道、3道、4道的概率各是多少?

解:本题试验次数为n=7,做对的概率p =,做错的概率q=,则试验7次,做对2道的概率为:

7道题中答对3道的概率是:

五、二项分布的平均数和标准差

二项分布的平均数,是指二项分布中随机变量k的算术平均数,实质上它是以k为原始数据,以概率p(成功事件)为权数的加权算术平均数。二项分布的平均数为

           

二项分布的标准差,是指二项分布中随机变量k的标准差(成功次数的离散程度)。二项分布的标准差为

         

六、二项分布的应用

利用二项分布可以估计带有机遇性的实际问题。

如英语考试共有20道选择题,均为四选一题。规定每题答对得1分,答错或不答得0分。有一个学生说他过去没有学过英语,全凭猜测答题,问:

(1)凭猜测,他得18分以上的概率是多少?

(2)答对多少道题可以认为他不是猜的?

解:做答20道选择题,可以看成是做20次试验。每次试验只有两个结果,每题猜对的概率为,猜错的概率为

(1)求该学生凭猜测得18分以上的概率,实际上是求他得18分或者19或者20分的概率是多少,即三种获得分数的概率之和: 

此概率非常小,说明完全凭猜测想得高分是不可能的。

(2)判断该学生答对多少道题可以认为他不是猜的,只需知道他答对多少题时属于小概率事件,则可判定他答对该题数时就认为不是猜的。由于本题,答题的各种可能结果近似服从正态分布,因此可依据正态分布理论解决此问题。当答题得分为Z=1.64时,P=0.05,属于小概率事件,此时,已知,

所以

即当该学生答对9道题时,可以认为他不是猜的。

 

进入知识点二