样本的作用是用它判定总体情况,为了确保得到正确结果,需要明智的选择样本.让我们先来认清总体的实质,以便让样本尽量具有代表性.
确定目标总体
首先要弄清楚目标总体何在,才知道样本取自哪里.这里的目标总体指的是你正在研究的,并且打算为其采集结果的群体.你所喧杂的目标总体在很大程度上取决于你的研究目的.例如,你打算手机世界上所有的口香糖球的数据,还是手机某个特定品牌或某个特定类型的口香让球的数据?
目标总体要尽可能精确,这样能更为容易的得出尽可能代表总体的样本.
确定抽样单位
一旦确定目标总体,就需要决定要抽取哪一类对象,通常,要抽样的对象类型就是在确定目标总体时所描述的对象类型,例如,可以是一粒口香糖也可以是一盒口香糖.
确定抽样空间
最后,你需要列一张表,表中列出目标总体范围内的所有抽样单位,最好给每个抽样单位取个名或编个号.这张表被称为抽样空间,基本上,你可以从这张表选中选取样本.
有时候不可能得出涵盖整个目标总体的抽样空间表.例如,如果要收集生活在某个地区的居民观点,由于人口流动,表中列举的名字就会受到影响:如果所处理的是一些相似的对象,例如口香糖球,那么为每一粒糖球命名或编号恐怕是不可的,或者说是不现实的.
如果不好好设计,样本有可能不精确
设计样本需要额外付出不少准备事件,但是,比起费时,费钱的进行调查却换来一些错误结果,这要好多了.
设计不当的样本会引起偏倚,让我详细讲讲这一点.
样本有时会发生偏倚
并非每一个样本都能做到十分客观–除非极其小心,否则,样本中会嵌入这样那样的偏倚,使最终结果发生扭曲.你在无意间待遇样本的某种个人偏好就是偏倚,这时,你的样本不再是从中一中进行随机选择的结果.
如果一个样本无偏,则这个样本可以代表总体,是总体的客观反映.
无偏样本
无偏样本可以代表目标总体,即该样本与总体样本具有相似特性,我们可以利用这些相似特性对总体本身做出判断.
偏倚样本
偏倚样本无法代表目标总体,由于样本与总体的特性不相似,无法根据样本对总体做出判断.
偏倚的来源
1.抽样控件中条目不齐全,因此未包含目标总体中的所有对象.如果条目不出现在抽样空间中,那么也不会出现在样本中.
2.抽样单位不正确,例如,也许抽样单位不应该是一粒粒的口香糖球,而应该是一盒盒的口香糖球.
3.为样本选取的一个个抽样单位未出现在实际样本中.例如,你可能发出一份调查问卷,但并不是人人都给出回应.
4.调查问卷的问题设计不当,设计的问题要中性,要适合每个人回答.
5.样本缺乏随机性
如上所述,偏倚来源广泛,而其中发布分归咎于样本选取方法
我们需要检查样本的选取方法,使偏倚的发生几率降至最低程度