众所周知,一手数据需要发放问卷调查,二手数据可以文献查阅。
那么发放问卷的对象是如何选取的呢?
今天就来带大家学习统计学中的一个重要章节:抽样调查。
我们从上图“统计调查”分支来看,一般的统计年鉴都来源于全面调查,也就是普查,类似于全国人口普查数据分析这样的大型全民调查。
而非全民的调查又分为“抽样调查”和“典型调查”。
抽样调查的主要局限性:
只提供对总体目标量的估计,而较难提供划分过细的子总体,即小域估计。
抽样与调查
01
抽样和调查有什么区别?
• 抽样
既包括“按一定程序从所研究对象的全体抽取一部分”,即样本的抽取,也包括根据调查获取的样本,“对总体的目标量做出推断”。
分为概率抽样和非概率抽样。
• 调查
是指对样本“进行调查或观测,从而获得数据”的过程。
是通过问卷或专门的统计表进行的。
02
抽样中的概率抽样/非概率抽样的区别?
• 非概率抽样
分为随意抽样(便利抽样)、目的抽样、判断抽样和志愿者抽样
优点:快速、便利、节省费用
缺点:①不能从样本对总体进行推断。②不能根据样本计算抽样误差。
• 概率抽样
特点:按一定概率以随机原则抽取样本;按照给定的入样概率并通过一定的随机化程序来实现;考虑样本(样本单元)被抽中的概率。
优点:能得到总体未知目标量的可靠估计,并能估计抽样误差,因而能对总体进行推断。
缺点:复杂、费时费力、费用高。我们写论文在讨论抽样方法时一般都是指概率抽样。
随机原则
随机不是随意;随机不等同于等概率;一般要求总体中每个单元均有一个非零的概率被抽中。
总体与样本
搞清楚以上类别的区分,我们一起来学习一下,抽样调查中的“总体”、“样本”到底如何区分呢?
01
总体
总体(population):调查对象的全体。与数理统计研究的通常是抽象的总体不同,抽样调查中的总体一般都是具体明确的。
在抽样调查的实际中,有必要区分两种总体。上面所描述的总体称为目标总体(target population);实际抽样调查中所覆盖的总体称为抽样总体(sampling population)。需要特别指出的是,依据调查的结果所得出的结论仅适用于抽样总体。
总体是由个体(individual;item)组成的。我们可以将总体看成有限的,因为此时总可以将总体划分成互不重叠又穷尽的有限多个部分。每个这样的部分称为抽样单元(sampling unit)。
抽样单元可以分级:初级单元(primary sampling unit)、次级单元(second sampling unit)、……。最小的一级抽样单元也称为基本抽样单元。
抽样框(sampling frame):名录框、区域框(地域框)
好的抽样框应具有以下特征:抽样单元不应有重复或遗漏、有关单元的信息准确、使用方便、编制与更新的费用低廉。
总体指标分为以下几种类型:
①总体总量(population total)
②总体均值(population mean)
③具有某种特征的个体在全体中的比例(proportion)
④两个指标的总量或均值之比(ratio)
02
样本
样本(sample)是总体的一部分,它由从总体中按一定程序抽得的那部分个体或抽样单元组成。
样本中包含的抽样单元数n称为样本量(sample size)。
样本量n的对总体总单元数N的比称为抽样比(sampling fraction):f=n/N。
与一般数理统计所不同的是:在抽样调查中,获得的样本是复杂样本,不是独立同分布的“简单样本”。
抽样方法
那么抽样调查的时候又有哪些方法呢?
简单随机抽样(simple random sampling),也称单纯随机抽样
分层抽样(stratified sampling)
整样抽样(cluster sampling)
多阶段抽样(multi-stage sampling)
系统抽样(systematic sampling)
不等概率抽样(sampling with unequal probability)
好了,通过今天的学习,相信我们对于抽样已经有了一个明确清晰的认识,相信在之后撰写论文的实证数据分析时,我们都能做到胸有成竹!
转自:“云导师学术辅导平台”微信公众号
如有侵权,请联系本站删除!