泊松分布

统计邦电影院遇到了问题

爆米花机每一周的平均故障次数为3.4,或者说爆米花机的故障率为3.4,爆米花机下一周不发生故障的概率是多大?

这是另一种分布
这次的问题与我们遇到过的问题不同.
这一次不存在一系列试验,相反,这一次的情况是这样的:已知故障发生几率,且故障是随机发生的.

那么我们如何求出概率?
这一类问题的难点在于,尽管我们知道爆米花机每周的平均故障次数,但实际的故障次数却不是固定的,从总体上看,我们可以期望的故障次数是每周3次或4次,但在倒霉的某一周,故障会多得多,而在顺利的某一周,故障则根本不会发生.

我们需要求出爆米花机下周不发生故障的概率.
听起来挺难,但有一种概率分布是专门用来应付这种情况的,叫做泊松分布.

泊松分布包括以下条件:
1.单独事件在给定区间内随机,独立的发生,给定区间可以是时间或空间,例如可以是一个星期,也可以是一英里.
2.已知该区间的事件平均发生次数(或者叫发生率),且为有限数量,该事件平均发射和那个次数通常用λ(lambda)表示.

让我们用X表示给定区间内的事件发生次数,例如一个星期内损坏次数.如果X符合泊松分布,且每个区间内平均发生λ次,或者说发生率为λ,则写作:

X~Po(λ)

在求给定区间内发生r次的概率时:

P(X=r)=e(-λ次方)xλ(r次方)/r!

例如,如果X~Po(2),则:

P(X=3)=e(-2次方)x2(3次方)/3!
=e(-2次方)x8/6
=e(-2次方)x1.333 (e是一个数学常数,一般为2.718)
=0.18

泊松分布的期望和方差
求泊松分布的期望和方差比求凄然分布的期望和方差更容易.
如果X~Po(λ),则E(X)为我们在给定区间内能够期望的事件发生次数,对于爆米花机来说,则为我们在普通一周内能够期望的机器损坏次数,也就是说,E(X)是非定区间内事件平均发生次数.
现在,如果X~Po(λ),则事件平均发生次数以λ表示,即E(X)等于λ,这个参数决定我们的泊松分布.
泊松分布更简洁的地方在于.它的方差也是λ,因此,如果X~Po(λ),则:

E(X)=λ
Var(X)=λ

即,如果给你一个泊松分布Po(λ),你根本不用做任何计算就能得出期望和方差–泊松分布的参数本身就是期望和方差.

概率分布是怎么样的
我们有两种机器,爆米花机和饮料机,每种机器在一周内的平均故障次数已知,求下一周不出故障的概率.
下面是两种机器的分布:
X~Po(3.4)
Y~Po(2.3)
如果X代表爆米花机每周发生故障的次数,Y代表饮料机每周发生故障的次数,则X和Y都符合泊松分布,另外X和Y的独立的,即爆米花机是否发生故障对饮料机发生故障的概率没有影响,而饮料机是否发生故障也对爆米花机发生故障的概率没有影响.

我们需要求出下个星期故障总次数为0的概率,即:

P(X+Y=0)

组合泊松变量
前面的章节讲过,如果X和Y是独立随机变量,则:
P(X+Y)=P(X)+P(Y)
E(X+Y)=E(X)+E(Y)

则如果X~Po(λx),且Y~Po(λy),则:

X+Y~Po(λx+λy)

即.如果X和Y都符合泊松分布,则X+Y也符合泊松分布,也就是说,可以利用X和Y的分布情况求出X+Y的概率.

λx+λy=3.4+2.3
=5.7
X+Y~Po(5.7)

P(X+Y=0)=e(-λ次方)xλ(r次方)/r!
=e(-5.7次方)xλ(0次方)/0!
=2.718(-5.7次方)
=0.003

即两台机器下周都不出问题的概率是0.003