离散概率分布并非无所不能
我们接触到的都是可以指定确切数值的概率分布.然而并非所有数据集合都是如此,还有积累数据并不符合我们之前遇到的概率分布,我们将在这里讲解所谓的连续性改哦率分布,并介绍最重要的概率分布类型之一–正态分布.
离散数据可取确切值
前面讲到的概率分布涉及的都是离散分布,即数据由一个个单独的数值组成,其中的每一个数值都有相应概率.例如,在分析老虎机收益概率分布时,每一局赌局可能出现的收益数额是确定的,我们很清楚各种情况的赔率,也知道自己有机会赢到其中一种.
如果是离散数据,则为数值型数据,只能取确切值.离散数据往往能以某种方式进行计数,例如糖果机中的糖果数目,智力游戏答对问题的数目,或是机器在一个特定时段内的故障次数.
但并非所有数值型数据都是离散的
一一列举一个数据集中所有数值并不总是能够实现,有时候,数据涵盖的是一个范围,这个范围内的任何一个数值都有可能成为事件结果.例如,假定有人让你精确地测量几段丝线的长度,并且已知这些丝线的长度在10英寸到11英寸之间,你的测量结果可能会是10英寸,10.1英寸,10.01英寸等等,因为丝线长度可以是这个范围内任意值.
这样的数据叫做连续数据,连续数据往往通过测量得到,而不是通过计数得到,测量结果在很大程度上取决于测量精度要求.
数据类型会影响概率的方法
前面我们只讲过离散数据的概率分布,利用这些概率分布,我们可以求出确切的离散数值的概率.
问题是,现实生活中有不少问题所牵涉到的都是连续数据,离散概率分布对这类数据无能为力.为了求解连续数据的概率,你需要懂得连续数据以及连续概率分布.