均值和中位数出了什么问题:众数

下面是一组年龄数据

1,2,2,2,3,4,33,34,34,34,35,35

均值为:18.25
中位数:18.5

看来我们无论选择哪一个值作为平均年龄,总会出现误导.

我们该怎么处理这样的数据呢?

认识众数

除了均值和中位数,还有第三种平均数,称为众数.众数是一批数字中最常见的数值,即频率最大的数值.与均值和中位数不同,众数必须是数据集中的一个数值,而且是最频繁出现的数值.

有时候,数据的众数可以不止一个.如果有一个以上的数值具有最大频数,则每一个这样的数值都是众数.如果数据看上去体现了多种趋势或多批数据,那么我们就为每一批数据给出一个众数.如果一批数据有两个众数,则我们说这种数据是双峰众数.

众数甚至能用于类别数据

众数不仅能用于数值型数据,还能用于类别数据.事实上,众数是唯一能用于类别数据的平均数.在处理类别数据时,众数是最常出现的平均数类型.
你还可以用众数指定具有最高频数的数值组.最优最高频数的组被成为众数组.

那么这组年龄数据的众数为:

1,2,2,2,3,4,33,34,34,34,35,35

1:1
2:3
3:1
4:1
33:1
34:3
35:2

双峰众数:2,34

求众数三步法:
1.把数据中的不同类别或数值全部找出来
2.写出每个数值或类型的频数
3.条数具有最高频数的一个或几个数值,得出众数