下面是一组年龄数据
1,2,2,2,3,4,33,34,34,34,35,35
均值为:18.25
中位数:18.5
看来我们无论选择哪一个值作为平均年龄,总会出现误导.
我们该怎么处理这样的数据呢?
认识众数
除了均值和中位数,还有第三种平均数,称为众数.众数是一批数字中最常见的数值,即频率最大的数值.与均值和中位数不同,众数必须是数据集中的一个数值,而且是最频繁出现的数值.
有时候,数据的众数可以不止一个.如果有一个以上的数值具有最大频数,则每一个这样的数值都是众数.如果数据看上去体现了多种趋势或多批数据,那么我们就为每一批数据给出一个众数.如果一批数据有两个众数,则我们说这种数据是双峰众数.
众数甚至能用于类别数据
众数不仅能用于数值型数据,还能用于类别数据.事实上,众数是唯一能用于类别数据的平均数.在处理类别数据时,众数是最常出现的平均数类型.
你还可以用众数指定具有最高频数的数值组.最优最高频数的组被成为众数组.
那么这组年龄数据的众数为:
1,2,2,2,3,4,33,34,34,34,35,35
1:1
2:3
3:1
4:1
33:1
34:3
35:2
双峰众数:2,34
求众数三步法:
1.把数据中的不同类别或数值全部找出来
2.写出每个数值或类型的频数
3.条数具有最高频数的一个或几个数值,得出众数