使用全距区分数据集

前面讲过数据集平均数的计算方法,但平均数往往只能给出部分信息.平均数让我们有办法确定一批数据的中心,却无法知道数据的变动情况.在前面的例子中,虽然每一位球员的平均得分相同,但显然各个数据集之前存在差异,我们需要通过某种方法量度这些差异.

我们可以观察球员得分相对于平均数的分散情况,以此区分各个数据集.每位球员的得分分布各不相同,只要能够量度这些得分的分布情况,教练就能够做出更有依据的决策.

量度全距

通过计算全距(也叫极差),我们可以轻易获知数据分散情况.全距指出数据的扩展范围,有点儿像测量数据的宽度.全距的计算方法是:用数据集中的最大数减去数据集中的最小数.

最小值称为下界,最大数成为上界

让我们看看其中一个球员的得分,再看看如何运用全距.下面是得分

7,8,9,9,10,10,11,12,13

为了计算全距,我们用上界减去下界.从数据中看出,最小值为7,因为这是下界;同样可以看出上界,即最大值13.用上界减去下界得到:6
所以该数据集的全距为6.

全距是量度数据分散程度的既简单又方便的方法,于是,我们有了另一种对数据集进行比较的方法.