拟合优度检验

X²分布

有时候事实与期望并不相符
当以一种特定的概率分布为某种情况建模时,对于事物的长期可能结果,你有十分清晰的想法.可如果期望与事实存在差别呢?–这些差别是正常波动,还是说明概率模型与事实存在差别?

让我们从老虎机开始
下面是某台老虎机的期望概率分布,其中X代表每一局游戏的净收益:

-2 0.977
23 0.008
48 0.008
73 0.006
98 0.001

下面是观察到的每局净收益的频数

-2 965
23 10
48 9
73 9
98 7

我们需要以某种方法判定:这些结果能否说明老虎机受到操纵

我们需要进行某种个假设检验,以此检验观察频数和期望频数之间的差别,这样一来,我们就有办法判定:老虎机是否被人动过手脚–以致这些机器不断的进行大额赔付

用X²检验评估差异
有一种概率分布正合我们的心意–X²分布,x读作”卡”,是希腊字母chi的大写.这种分布通过一个检验统计量来比较期望结果和实际结果之间的差别,然后得出观察频数的发生概率.

让我们先求检验统计量,为此,首先画一张表,填入相应问题的观察频数和期望频数,然后,用观察频数和期望频数计算下列统计量,其中O代表观察频数,E代表期望频数

X²=∑(O-E)²/E

即,对于概率分布中的每一个概率,取期望频数和实际频数的差,求差的平方数,再除以期望频数,然后将所有结果相加.
由此可得
X²=38.272

检验统计量代表什么?
检验统计量X²提供了一种对观察频数和期望频数之间的差异进行量度的办法,X²的数值越小,观察频数和期望频数之间的总差值越小.

除数E为期望频数,于是所得结果与期望频数成反比例
X²大到什么程度才算得上显著呢?我们需要指出:在什么情况下才能拿十分肯定的判定老虎机出了问题–而且这个问题已经超出了”合理偶然性”的范围.
为此我们需要讲讲X²分布

X²分布的两个主要用途
X²概率分布主要用于检查实际结果与期望结果之间何时存在显著性差别,该概率分布使用前面讲到的检验统计量X²进行检验.

X²分布有两个主要用途
第一是用于检验拟合优度,也就是可以检验一组给定的数据与指定分布的吻合程度,例如,可以用他检验老虎机收益的观察频率与我们所期望的分布的吻合程度.
X²分布的另一个用途是检验两个变量的独立性,通过这个方法可以检查,变量之间是否存在某种关联.
X²分布用到一个参数–希腊字母v,读作纽,让我们看看v如何影响概率分布的形状.

当v等于1或2
当v等于1或2时,X²分布为一条先高后低的平滑曲线,其形状像一个倒立的.检验统计量等于较小数值的概率远远高于等于较大数值的概率,这就是说,观察频数有可能接近期望频数

当v大于2
当v大于2时,X²分布的形状发生变化–随着X²递增,图形先低,后高,再低,其外型沿着正向扭曲,但当v很大时,图形接近正态分布

所你正在使用具有特定参数v的X²分布以及检验统计量X²,可简单记作:
X²~X²(v)

v表示自由度
前面讲到v如何影响x²分布的形状,如何求出v呢?

v为自由度数目,即用于计算检验统计量X²的独立变量的数目,或可以说是独立信息段的数目.让我们结合实际进行说明.
自由度数目等于我们要计算的期望频数的数目–计算时要考虑我们所受到的各种限制.
为了计算检验统计量X²,我们必须计算所有的期望频率,也就是必须考虑我们所受到的各种限制.

为了计算检验统计量X²,我们必须计算所有的期望频率,也就是必须计算5个期望频数.进行计算时要记住一点:期望频数综合与观察频数总和必须相同–也就是说,我们进行计算时受到一个限制.

那么v是多少?
为了算出v,我们取所计算过的信息的数目,减去所收到的限制的数目,为了算出检验统计量X²,我们必须计算5个独立信息,同时受到一个限制,于是,自由度的计算结果为:
v=5-1
=4

以上结果还可以这样理解,我们必须利用概率分布计算4个期望频数;至于最后一个频数,则可以先求出总期望频数,再求出最后一个频数.
v=组数-限制数

显著性是多少?
我们如何利用X²分布指出观察频数和期望频数之间的差异显著性?
和其他假设检验一样,这都取决于显著性水平.

用X²分布进行的检验为单尾,右尾被做为拒绝域,于是,通过查看检验统计量是否位于右尾的拒绝域以内,你就可以判定根据期望分布得出的结果的可能性.

如果用显著性水平α进行检验,则可以写作:
X²α(V)

那么如何求X²分布的拒绝域呢?我们可以使用X²概率表.

如何使用X²概率表
为了求出临界值,首先应找出自由度v以及显著性水平α,在第一列查找v,第一行查找α,交点即x值,从P(X²α(v)≥x)=α得出临界值

X²假设检验
下面是用X²分布进行假设检验的几个步骤

1.确定熬进行检验的假设及备择假设

H0:老虎机每局收益符合原定概率分布
H1:老虎机每局收益不符合原定概率分布

2.求出期望频数和自由度

v=4,α=5%
X²5%(4)=9.49,即拒绝域为X²>9.49的范围

3.确定用于做决策的拒绝域

检验统计量为X²=38.272

4.计算检验统计量X²

X²的数值为38.272,且由于拒绝域X²>9.49

5.查看检验统计量是否位于拒绝域以内

X²位于拒绝域内

6.作出决策

H1

总结

首先,我们得到了老虎机的一组观察频数,然后假定这些频数符合某种特定的概率分布并算出了期望频数,然后算出自由度和检验统计量X²,通过X²可以看出观察频数和期望频数之间的总偏差.

然后,你从X²概率表查出显著性为5%时的拒绝域,经过与检验统计量进行比较,你发现有足够的证据判定:老虎机被人动过手脚,所以才会多赔钱

这种假设检验称为拟合优度检验–他检验观察频数是否和假设的概率分布相吻合,若你有一组数据,并希望这组数据符合某种分布,为了看看这组数据是否确实符合这种分布,则可以用拟合优度检验.