如何求解正态概率?

像处理其他连续概率分布一样,可通过计算分布曲线下方的面积求出概率.曲线代表概率密度,概率则以特定范围内的曲线面积表示.例如,如果你想求出介于a和b之间的变量X的概率,则需要求出曲线下方介于a点和b点之间的面积.

似乎很复杂?别担心,这比你想象的要容易.
如果全靠自己计算正态曲线下方的面积,难度很大.不过,幸运的是,你可以借助概率表进行查找.只要算出要求其面积的范围,再在概率表中查相应的概率就行了.

正态概率计算三步法:
1.确定分布
我们要做的第一件事是确定数据分布.
朱莉已得知统计邦适龄男生的身高均值和标准差:均值71英寸,方差20.25
即,如果用X表示男生的身高,则X~N(71,20.25)

我们还需要知道哪个数值范围能得出正确的概率面积,在本例中,我们要求出与朱莉相亲的男生具有足够身高的概率.
朱莉身高64英寸,于是我们将求出与她相亲的男生比她高的概率.

2.标准化为N(0,1)
下一步是让变量X标准化,使均值为0,标准差为1,据此得出标准正态变量Z,而Z~N(0,1).

概率表仅给出N(0,1)的概率.
概率表主要废除了N(0,1)分布的概率,因为不可能为每一条正态分布曲线制定概率表.μ和σ²的可能值无穷无尽,当正态曲线用这些数值做为参数表示曲线的中间位置和分布情况时,可能的正太分布曲线也无穷无尽.

能够利用标准正态分布意味着能够为μ和σ²的所有可能数值使用同一概率表.只有一个问题:如何将正态分布转变为标准形式?

欲完成标准化,先移动均值
让我们先进行正态分布转化,使得均值为0,而不是71,为此,将曲线向左移动71.
这样就得到一个新分布: X-71~N(0,20.25)

然后收窄
我们还需要调整方差,为此,通过除以标准差”挤窄”我们的分布.已知方差为20.25,所以标准差为4.5
于是得到X-71/4.5~N(0,1)
或Z~N(0,1),其中:
Z=X-71/4.5

看着眼熟吗?这正式我们在第三章首次讲到标准差时出现过的标准分.通常,通过下式可求出任何正态变量X的标准分:
Z=X-μ/σ

现在,为要计算出其概率的特定数值求出Z
前面讲过如何对概率分布进行标准化,从而令X~N(μ,σ²)变为Z~N(0,1).
我们最感兴趣的是实际概率,我们要做的是为需要求概率的数值找出数值范围,然后求出这个范围的限值的标准分,最后可以通过正态分布查找求得标准分的概率.
在我们的例子中,需要求朱莉的约会对象比朱莉高的概率.由于朱莉的身高是64英寸,因此我们要求P(X>64),这个数值范围的限制是64,所以只要算出64的标准分z,就能据此求出概率.

让我们求出64的标准分:
z=x-μ/σ
=64-71/4.5
=-1.56

所以,根据统计邦男生身高均值和标准差,算得64的标准分为-1.56
得出这个结果后,我们就可以进入最后一步:通过概率表查找概率.

3.用方便易用的概率表查找概率
既然已经得出了标准分,就可以用概率表求概率了.利用标准正态概率表可以查找任何z值,进而查出相应概率P(Z<z)

如何使用概率表
先算z,保留两位小数,这就是你要在表中查找的数值.
查找概率时,需要用第一列和第一行找出数值z,第一列为z值的第一位小数,不进行四舍五入,第一行为第二位小数,两行的交叉即为概率.

朱莉该算的个概率就在表中
让我们回头看朱莉的问题,我们需要求P(Z>-1.56),因此,让我们在概率表中查找-1.56,得出概率0.0594,即P(Z<-1.56)=0.0594,这表示:

P(Z>-1.56)=1-P(Z<-1.56)
=1-0.0594
=0.9406

也就是说,朱莉的约会对象比她高的概率是0.9406.