肥弹遇到了新问题
肥弹觉得有一位骨折二十一点赌桌的庄家赔付的钱高于合理性,你能判断下是否有显著证据证明肥弹的怀疑没错?
下面是负责赌桌的三位庄家:
庄家A 赢43 平8 输47
庄家B 赢49 平2 输44
庄家C 赢22 平5 输30
我们需要找到某种方法,检验赌局结果是否取决于坐庄赌局的庄家
X²分布可以检验独立性
前面讲到X²分布可用于进行拟合优度检验,X²分布的用途不仅如此,他还能用于进行独立性检验.
独立性X²检验可用于判断两种因素是否相互独立,或两者是否看上去互有联系.这正合我们对庄家的检验要求–我们要检验在二十一点赌局中坐庄的庄家是否对赌局输赢有影响.换句话说,我们假定庄家的选择与输赢无关–除非有足够的证据可以反驳这一点.
独立性检验的过程与拟合优度的检验过程相同:设立一个假设,用观察频数和期望频数计算X²检验统计量,然后查看结果是否落在拒绝域以内.
为了计算检验统计量X²,我们需要知道期望频数
首先,算出赌局结果和庄家总频数以及各项的总和,例如可列出下表:
这叫做列联表
庄家A 赢43 平8 输47
庄家B 赢49 平2 输44
庄家C 赢22 平5 输30
合计 赢114 平15 输121
现在我们可以用以上信息求出每一位庄家的赢局期望频数.
让我们先求出庄家A的赢局期望频数
赢局概率
P(赢)=赢/总和
求出庄家A坐庄的概率
P(A)=合计A/总和
现在,按照我们的假设,如果庄家和赌局结果相互独立,那么,通过将两种概率相乘,可以求出庄家A坐庄时,出现赢局的概率,即:
P(A庄赢局)=赢局合计/总和 x A合计/总和
频数是多少?
前面求出了庄家A的赢局概率,我们希望通过这个结果求出赢局的期望频数.为此只要将庄家A的赢局概率乘以总和即可,于是:
期望频数=赢局合计xA总计/总和
将以上结果推而广之,可以得到一个求频数的通用公式:为了求出特定行和特定列形成的组合的期望频数,可用每行合计乘以每列合计,然后除以总和.
期望频数=行合计x列合计/总和
求出所有期望频数后,即可用他计算出来检验统计量X²–这与前面检验统计量相同,因此需要计算:
X²=∑(O-E)²/E
关键是:务必将每一个观察频数和每一个相应的期望频数都计算在内.
庄家A
赢43 期望44.688 0.064
平8 期望5.88 0.764
输47 期望47.432 0.004
庄家B
赢49 期望43.32 0.131
平2 期望5.7 2.402
输44 期望45.98 0.085
庄家C
赢22 期望25.992 0.613
平5 期望3.42 0.730
输30 期望27.588 0.211
我们还需要计算自由度
为了用X²分布求观察频数的显著性,还需求最后一个值:v,即自由度值.前面讲过,自由度是在我们考虑限制条件的情况下,可以自由选择的独立信息的数目,这说明我们要查看有多少个需要独立计算的期望频数,再减去限制条件数目.
首先,让我们求要计算的期望频数的总数目,我们必须算出三位庄家的期望频数以及三种可能结果,于是期望频数为3×3=9
对于每一行每一列,我们实际上只需要计算两个期望频数,我们已经知道总频数是多少,因此可以选择第三个频数,使得所有频数相加等于正确结果.也就是说,我们其实只需要计算其中4个期望频数,其余5个频数可以根据已知的总频数进行推导.
由于必须计算出4个期望频数,于是自由度就等于这个数目,即 v=4
1.确定要进行检验的假设及备择假设
H0:赌局输赢结果和坐庄的庄家没有关系
H1:赌局输赢结果和坐庄的庄家有关系
2.求出期望频数和自由度
v=4
庄家A
赢43 期望44.688 0.064
平8 期望5.88 0.764
输47 期望47.432 0.004
庄家B
赢49 期望43.32 0.131
平2 期望5.7 2.402
输44 期望45.98 0.085
庄家C
赢22 期望25.992 0.613
平5 期望3.42 0.730
输30 期望27.588 0.211
3.确定用于做决策的拒绝域
从概率表查出X²1%(4)=13.28,因此拒绝域由X²>13.28决定
4.计算检验统计量X²
∑(O-E)²/E=5.004
5.看看检验统计量是否位于拒绝域内
不在拒绝域
6.做出决策
H0