前面讲过如何通过全距和四分位距量度一批数据的数值的分散情况,全距是最大值和最小值之间的差距,而四分位距则关注数据中间部位的50%数值
除了全距和四分位距,还有别的距供我们使用
我们在最初使用全距时碰到的问题是:全距极易收到异常值的影响.为了解决这个问题,我们将数据一分为四,然后用四分位距形成一个经过剪裁的数据距
尽管四分位距十分常用,但它并不是构建迷你距的唯一方法.我们可以不把数据分成四份,而是分为其他的份数,以此形成我们需要的距.
例如,假设我们将数据分成十份,而不是四份,是的每一个数据块,包含10%的数据.于是我们就会得到如下结果:
11|12|22|23|33|33|44|44|55|510
如果你将一批数据按百分比进行分割,则起分割作用的数值被称为百分位数.在上例中,我们的数据被分成10份,因此起分割作用的数值被称为十分位数.
我们可以用百分位数构建一个新的距,称为百分位距.
什么是百分位数?
四分位数是将数据一分为四的数值,同理,百分位数是将数据一分为百的数值.每个百分位数按照它所分割出来的数据百分比进行命名,因此,第十百分位数就是位于数据范围10%处的数值.通常,第k百分位数就是位于数据范围k%处的数值,常用Pk来表示.
四份位数其实也是一种百分位数.下四分位数P25,上四分位数P75,中位数是P50.
百分位数用途
尽管百分位距不太常用,但百分位数本身却对于划分名次,排行很有用.你可以通过百分位数确定某个数值相对于其他数值的高低.例如:假定你听说过自己在统计学测验中得了50分,近看这个数字本身,你无法知道自己和别人相比是好是坏.可如果有人告诉你这次测验的第90百分位是50分,那么你就知道,你的分数高于或等于其他90%的人的分数.
求百分位数
1.首先将所有数值按升序排列
2.为了求出n个数字的第k百分位数的位置,先计算k(n/100)
3.如果结果为整数,则百分位数处于第k(n/100)位和下一位数之间,取这两个位置上的数字的平均值,得出百分位数.
4.如果k(n/100)不是整数,则将其向上去整,结果即百分位数的位置.
例如:有125个数,要求第10个百分位数,则先计算10X125/100=12.5,将此结果向上去整,得13,即第10百分位数处于第13位的数值.