再谈正态分布的运用

但愿所有的概率分布都是正态分布
有了正态分布–可以一口气查出整个范围的概率,接下来我们将学习如何闪电般的解决更复杂的问题,还将懂得如何将正态分布的便利运用到其他概率分布上.

确保新郎和新娘的综合体重不超过380磅
新郎和新娘的体重都符合正态分布,新郎为N(190,500),新娘为N(150,400)
我们需要设法通过这两个概率分布算出一对新郎新娘的体重低于过山车允许的最大载荷的概率,如果算出的概率足够高,我没你就可以满怀信心的说,坐过山车举行婚礼的想法是可行的.

正态新郎+正态新娘
如你所知,新郎和新娘的体重都符合正态分布,不过我们真正要求的确实新郎和新娘的综合概率分布.即,新郎与新娘体重之和的概率分布.

新娘体重+新郎体重~?

终究还是体重问题
还记得我们最开始讲到连续数据的时候吗?那时我们讲过身高,体重之类的数据往往符合什么分布?我们那时讲到,身高,体重之类的数据是连续数据,且往往符合正态分布.

这一次,我们研究的是一对新婚佳偶的综合体重.综合体重也是体重,同时我们已经知道一种的分布趋势:综合体重依然是连续数据,而且,综合体重依然符合正态分布.也就是说,新娘加新郎的体重符合正态分布.

新娘加新郎的综合体重符合正态分布这个结论对我们大有用处,这说明我们可以像前面一样,利用概率表查找概率,即,我们可以长处综合体重低于380磅的概率.

只有一个问题–在动手查找概率之前,我们需要知道新娘新郎综合体重的均值和方差.该怎么求呢?
新娘+新郎~N(?,?)

E(X+Y)=E(X)+E(Y)
Var(X+Y)=Var(X)+Var(Y)
E(X-Y)=E(X)-E(Y)
Var(X-Y)=Var(X)-Var(Y)

这些简捷算法也适用于连续数据
我们最初讲到这些简捷算法的时候,用的是离散数据.幸运的是,同样的计算规则和简捷算法也适用与连续数据.

综合体重符合哪种分布?
前面已经讲过,新郎新娘的综合体重符合正态分布,这说明我们可以利用概率表查找综合体重低于某个特定值的概率.
让我们试试用X和Y表示新郎新娘的体重分布,如果用X代表新娘的体重,用Y代表新郎的体重,则X和Y是独立的,然后要求求出μ和σ,其中:

X+Y~N(μ,σ²)

也就是说,在进一步计算之前,我们需要求出X+Y的期望和方差,怎么求?
查看前一个练习的答案,可以看出,当我们处理离散概率分布时,只要X和Y是独立变量,就可以用下列算式计算E(X+Y)和Var(X+Y):

E(X+Y)=E(X)+E(Y)
Var(X+Y)=Var(X)+Var(Y)

于是,只要知道X和Y的期望和方差,就能用上面的式子计算X+Y的期望和方差

我们可以用已知求未知
由于我们已知新娘体重和新郎体重的概率分布,因此能求出新郎新娘综合体重的概率分布.
在研究综合正态变量的时候,想办法求出X+Y的分布是十分有用的.如果独立随机变量X和Y符合正态分布,那么X+Y也符合正态分布,另外,你还可以使用X和Y的均值和方差计算X+Y的概率分布.

为了求出X+Y的均值和方差,可以使用离散概率分布的相同计算公式,即:

如果
X~N(μx,σ²x) 且 Y~N(μy,σ²y)

X+Y~N(μ,σ²)

其中
μ=μx+μy
σ²=σ²x+σ²y

X+Y的方差大于X的方差,也大于Y的方差,这使得X+Y的曲线比X的曲线和Y的曲线都拉的长,这一点对于任何正态X和Y都成立.在将这两个变量相加之后,实际上增大了变异性,于是使得分布形状拉长;随着圆形拉成,图形还会变得更扁,这样才能使图形下方的总面积依然为1.

有时候,X+Y并不是你要求的概率,如果所求的是两个变量之差的概率,则需要计算X-Y

如果X和Y是独立随机变量,且都符合正态分布,则X-Y符合正态分布,这一点和X+Y的规律完全一样.
为了求出均值和方差,我们再次使用离散概率分布的同一组简捷算法,只要:

X~N(μx,σ²x) 且 Y~N(μy,σ²y)

X-Y~N(μ,σ²)

其中
μ=μx-μy
σ²=σ²x-σ²y

即,X-Y的均值等于X的均值减去Y的均值,X-Y的方差等于X的方差加上Y的方差

求解概率
1.算出分布和范围

X+Y~N(340,900)

2.将分布标准化

Z=(X+Y)-μ/σ
=1.33

3.查找概率

P(X+Y<380)=0.9082