我们已经知道,现代科学的一个最重要的标准就是实证——要通过观察和实验得出结论,不能只是猜想和推理。但事实是,我们通常都无法做到,比如:
要研究天鹅的颜色,我们不可能去观察每一只天鹅(总体),我们只能投机取巧,通过观察其中的一部分(样本)来推断。这就带来一个巨大的风险,可能我们看到100000只❶天鹅都是白色的,但你怎么知道剩下的更多的天鹅中就没有黑色的?
因此,选择谁来观察,就成了一个技术活,这就是我们今天的主角——抽样(sampling)。
通常我们以为:样本越大就越好,大样本等于好样本;其实不然,样本最重要的是:
代表性!(一遍)
代表性!(两遍)
代表性!(三遍)
举个栗子:我想研究一下某所大学最受欢迎的电影,我有时间、有精力、有资金,我调查10000名同学,调查结论是《泰坦尼克》;而我的同事只调查了10名同学,他的结论却是《泰坦尼克》和《碟中谍》两个。我因为按照宿舍楼抽样,所以调查的恰好都是女生;我的同事则是在男女生中各调查了5个人。
谁更可信?
看来样本容量固然重要(how many),但更重要的还是抽样方案(how)。一般来说,方案分为概率抽样(随机抽样)和非概率抽样两大类。两者的根本区别就是前者完全是经“上帝的手”在选择,比较公平、公正、公开;后者还有“凡人的手”在帮忙,当然有时是帮倒忙。
因为概率抽样中的每个个体都有一个确定的可能性(概率)被抽中,所以概率和统计技术就有了用武之地,我们可以计算出抽样带来的误差,对总体给出相当准确的推断。
01 非概率抽样(Non-probability sampling)
又称非随机抽样,指根据一定主观标准抽取样本,令总体中每个个体的被抽取不是依据其本身的机会,而是完全决定于调研者的意愿。
其特点为不具有从样本推断总体的功能,但能反映某类群体的特征,是一种快速、简易且节省的数据收集方法。当研究者对总体具有较好的了解时可以采用此方法,或是总体过于庞大、复杂,采用概率方法有困难时,可以采用非概率抽样来避免概率抽样中容易抽到实际无法实施或“差”的样本,从而避免影响对总体的代表度。
常用的非概率抽样方法有以下四类:
▷ 方便抽样(Convenience sampling)
指根据调查者的方便选取的样本,以无目标、随意的方式进行。例如:街头拦截访问(看到谁就访问谁);个别入户项目谁开门就访问谁。
优点:适用于总体中每个个体都是“同质”的,最方便、最省钱;可以在探索性研究中使用,另外还可用于小组座谈会、预测问卷等方面的样本选取工作。
缺点:抽样偏差较大,不适用于要做总体推断的任何民意项目,对描述性或因果性研究最好不要采用方便抽样。
▷ 判断抽样(Judgment sampling)
指由专家判断而有目的地抽取他认为“有代表性的样本”。例如:社会学家研究某国家的一般家庭情况时,常以专家判断方法挑选“中型城镇”进行;也有家庭研究专家选取某类家庭进行研究,如选三口之家(子女正在上学的);在探索性研究中,如抽取深度访问的样本时,可以使用这种方法。
优点:适用于总体的构成单位极不相同而样本数很小,同时设计调查者对总体的有关特征具有相当的了解(明白研究的具体指向)的情况下,适合特殊类型的研究(如产品口味测试等);操作成本低,方便快捷,在商业性调研中较多用。
缺点:该类抽样结果受研究人员的倾向性影响大,一旦主观判断偏差,则根易引起抽样偏差;不能直接对研究总体进行推断。
▷ 配额抽样(Quota sampling)
指先将总体元素按某些控制的指标或特性分类,然后按方便抽样或判断抽样选取样本元素。
相当于包括两个阶段的加限制的判断抽样。在第一阶段需要确定总体中的特性分布(控制特征),通常,样本中具备这些控制特征的元素的比例与总体中有这些特征的元素的比例是相同的,通过第一步的配额,保证了在这些特征上样本的组成与总体的组成是一致的。在第二阶段,按照配额来控制样本的抽取工作,要求所选出的元素要适合所控制的特性。例如:定点街访中的配额抽样。
优点:适用于设计调查者对总体的有关特征具有一定的了解而样本数较多的情况下,实际上,配额抽样属于先“分层”(事先确定每层的样本量)再“判断”(在每层中以判断抽样的方法选取抽样个体);费用不高,易于实施,能满足总体比例的要求。
缺点:容易掩盖不可忽略的偏差。
▷ 滚雪球抽样(Snowball sampling)
指先随机选择一些被访者并对其实施访问,再请他们提供另外一些属于所研究目标总体的调查对象,根据所形成的线索选择此后的调查对象。
第一批被访者是采用概率抽样得来的,之后的被访者都属于非概率抽样,此类被访者彼此之间较为相似。例如:如在目前中国的小轿车车主等。
优点:可以根据某些样本特征对样本进行控制,适用寻找一些在总体中十分稀少的人物。
缺点:有选择偏差,不能保证代表性。
02 概率抽样(Probability sampling)
又称随机抽样,指在总体中排除人的主观因素,给予每一个体一定的抽取机会的抽样。
其特点为,抽取样本具有一定的代表性,可以从调查结果推断总体;操作比较复杂,需要更多的时间,而且往往需要更多的费用。
常用的有以下六种类型:
▷ 简单抽样(Simple sampling)
简单随机抽样(simple random sampling)又称纯随机抽样,是概率抽样的最基本形式。它是按等概率原则直接从含有N个元素的总体中随机抽取n个元素组成样本(N>n)。
常用的办法类似于抽签,即把总体的每一个单位都编号,将这些号码写在一张张小纸条上,然后放入一容器(如纸盒、口袋)中,搅拌均匀后,从中任意抽取,直到抽够预定的样本数目。这样,由抽中的号码所代表的元素组成的就是一个简单随机样本。
比如,某系共有学生300人,系学生会打算采用简单随机抽样的办法,从中抽取出60人进行调查。为了保证抽样的科学性,他们先从系办公室得到一份全系学生的名单,然后给名单中的每个学生都编上一个号(从001到300)。抽样框编好后,他们又用300张小纸条分别写上001,002,…,300。他们把这300张写好不同号码的小纸条放在一个盒子里,搅乱后,随便摸出60张小纸条。然后,他们按这60张小纸条上的号码找到总体名单上所对应的60位同学。这60位同学就构成了他们本次的样本。这种方法简便易学。但当总体元素很多时,写号码的工作量就很大,搅拌均匀也不容易,因而此法往往在总体元素较少时使用。
对于总体元素很多的情形,我们则采用随机数表来抽样。本书后就附有一张随机数表,表中的数码和排列都是随机形成的,没有任何规律性(故也称为乱数表)。利用随机数表进行抽样的具体步骤是:
先取得一份总体所有元素的名单(即抽样框);
将总体中所有元素一一按顺序编号;
根据总体规模是几位数来确定从随机数表中选几位数码;
以总体的规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;
根据样本规模的要求选择出足够的数码个数;
依据从随机数表中选出的数码,到抽样框中去找出它所对应的元素。
▷ 系统抽样(Systematic random sampling)
将总体中的各单元先按一定顺序排列,并编号,然后按照不一定的规则抽样。其中最常采用的是等距离抽样,即根据总体单位数和样本单位计算出抽样距离(即相同的间隔),然后按相同的距离或间隔抽选样本单位。例如:从1000个电话号码中抽取10个访问号码,间距为100,确定起点(起点<间距)后每100号码抽一访问号码。
系统抽样的具体步骤是:
给总体中的每一个个体按顺序编号,即制定出抽样框。
计算出抽样间距。计算方法是用总体的规模除以样本的规模。假设总体规模为N,样本规模为n,那么抽样间距K就由下列公式求得:
K(抽样间距)=N(总体规模)n(样本规模)
在最前面的K个个体中,采用简单随机抽样的方法抽取一个个体,记下这个个体的编号(假设所抽取的这个个体的编号为A),它称做随机的起点。
在抽样框中,自A开始,每隔K个个体抽取一个个体,即所抽取个体的编号分别为A,A+K,A+2K,…,A+(n-1)K。
将这n个个体合起来,就构成了该总体的一个样本。
优点:兼具操作的简便性和统计推断功能,是目前最为广泛运用的一种抽样方法。如果起点是随机确定的,总体中单元排列是随机的,等距抽样的效果近似简单抽样;与简单抽样相比,在一定条件下,样本的分布较好。
缺点:抽样间隔可能遇到总体中某种未知的周期性,导致“差”的样本;未使用可能有用的抽样框辅助信息抽取样本,可能导致统计效率低。
▷ 分层抽样(Stratified random sampling)
是把调查总体分为同质的、互不交叉的层(或类型),然后在各层(或类型)中独立抽取样本。例如:调查零售店时,按照其规模大小或库存额大小分层,然后在每层中按简单随机方法抽取大型零售店若干、中型若干、小型若干;调查城市时,按城市总人口或工业生产额分出超大型城市、中型城市、小型城市等,再抽出具体的各类型城市若干。
优点:适用于层间有较大的异质性,而每层内的个体具有同质性的总体,能提高总体估计的精确度,在样本量相同的情况下,其精度高于简单抽样和系统抽样;能保证“层”的代表性,避免抽到“差”的样本;同时,不同层可以依据情况采用不同的抽样框和抽样方法。
缺点:要求有高质量的、能用于分层的辅助信息;由于需要辅助信息,抽样框的创建需要更多的费用,更为复杂;抽样误差估计比简单抽样和系统抽样更复杂。
在实际运用分层抽样的方法时,研究者需要考虑下列两个方面的问题
(1)分层的标准问题。同一个总体可以按照不同的标准进行分层,或者说,根据不同的标准可以将一个总体分成不同的类别或层次。那么,在实际抽样中究竟应该按什么标准来分层呢?通常采用的原则有:
第一,以所要分析和研究的主要变量或相关的变量作为分层的标准。比如,若要研究居民的消费状况和消费趋向,可以以居民家庭人均收入作为分层标准;又如,要了解社会研究中不同职业的人员对社会经济改革的看法,就可以以人们的职业作为分层的标准。
第二,以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。比如在工厂进行,可以以工作性质作为分层标准,将全厂职工分为干部、工人、技术人员、勤杂人员等几类来进行抽样。
第三,以那些已有明显层次区分的变量作为分层变量。比如在社会研究中,性别、年龄(当然是分段以后,如老、中、青)、文化程度、职业等等,就经常被用作分层的标准;其他如学生按年级、专业、学校类型分层,城市按人口规模分层等等。
(2)分层的比例问题。分层抽样中有按比例和不按比例分层两种方法。按比例分层抽样是指按总体中各种类型或层次的比例来抽取子样本的方法。即在单位多的类型或层次中所抽的子样本就大一些,在单位少的类型或层次中所抽的子样本就小一些。比如,某厂有工人600人,按性别分层则有男工500人,女工100人。总体中两类工人人数的比例为5∶1。因此,若要抽60人作样本,那么,按比例的抽法就是根据上述比例,分别从500名男工中随机抽取50人,而从100名女工中随机抽取10人。这样,样本中男女工人之比与总体中男女工人之比完全相同,均为5∶1。可以说,样本的性别结构是总体中性别结构的一种缩影。
采取按比例分层抽样的方法,可以确保得到一个在某种特征上与总体结构完全一样的样本。但是,在有些情况下,又不宜采用这种方法。例如,有时总体中有的类型或层次的单位数目太少,若以按比例分层的方法抽样,则有的层次在样本中个案太少,不便于了解各个层次的情况,这时往往要采取不按比例抽样的方法。比如上例中,样本中女工人数过少,此时我们可以采取不按比例抽样的方法,在500名男工中抽30人,在100名女工中也抽30人。这样,样本就能较好地反映出男女两类工人的一般状况,我们也能很好地对男女两类工人的情况进行比较和分析。
需要但注意的是,我们采用不按比例分层抽样的方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较,但若要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,即通过调整样本中各层的比例,使数据资料恢复到总体中各层实际的比例结构。比如上例中,若要用30个男工、30个女工的收入资料去推断全厂工人的平均收入时,就需要在男工的收入后乘以5/3,而在女工的收入后乘以1/3,再加总平均,否则就会导致推断的偏误。
▷ 整群抽样(Cluster sampling)
是先将调查总体分为群,然后从中抽取群,对被抽中群的全部单元进行调查。例如:入户调查,按地块或居委会抽样,以地块或居委会等有地域边界的群体为第一抽样单位,在选出的地块或居委会实施逐户抽样;市场调查中,最后一级抽样时,从居委会中抽取若干户,然后调查抽中户家中所有18岁以上成年人。
优点:适用于群间差异小、群内各个体差异大、可以依据外观的或地域的差异来划分的群体。
缺点:群内单位有趋同性,其精度比简单抽样为低。
▷ 多级抽样(Multistage sampling)
也叫多阶段抽样或阶段抽样,以二级抽样为例,二级抽样就是先将总分组,然后在第一级和第二中分别随机地抽取部分一级单位和部分二级单位。例如:以全国性调查为例,当抽样单元为各级行政单位时,按社会发展水平分层后(或按经济发展水平,或按地理位置分层),从每层中先抽几个地区,再从抽中的地区抽市、县、村,最后再抽至户或个人。
优点:具体整体抽样的简单易行的优点,同时,在样本量相同的情况下又整群抽样的精度高。
缺点:计算复杂。
▷ 抽中概率与规模成比例抽样(PPS)
是不等概率中最常用的一种方法,指在总体中参照各单位的规模进行抽样,规模大的被抽取的机会大,总体中每个个体被抽中的概率与该个体的规模成正比的抽样。例如:在进行企业调查时,根据PPS抽样方法抽取企业,令规模大的企业被抽取机会大。
优点:使用了辅助信息,可以提高抽样方案的统计效率。
缺点:如果研究指标与规模无直接关系时,不合适采取这种方法。
此外,在抽样方法划分上,还有多阶段抽样和两相抽样等,有兴趣的读者可参阅其他相关书籍。
前面谈到抽样方法的一些基本分类和各自特点,需要注意的是,在实际的运用中,一个调查方案常常不是只局限于使用某一种抽样方式,而根据研究时段的不同采用多种抽样方法的组鸽为实现不同的研究目的,有时甚至在同一时段综合运用几种抽样方法。
例如,设计一个全国城市的入户项目,在抽样上可以分为几个不同的步骤,包括:
在项目正式开始前,可以采用判断抽样法选出某一城市先作试点,在问卷设计初期可以采用任意抽样法选出部分人群进行问卷试访。
采用分层随机抽样法,确定全国要分别在多少个超大型市、多少个大型市、多少个中型市、多少个小型市实施(先分出城市的几个层次,再依据研究需要在各层用PPS法选取具体城市)
采用简单抽样法或PPS抽样法,确定抽出城市中应抽的地块或居委会;
采用整群抽样法,确定抽出地块或居委会应访问的家庭户;
在项目后期,可以采用判断抽样法选取某城市进行深入研究。
注:本文由量化研究编辑整合自风笑天:《社会研究方法》(第四版),中国人民大学出版社,2013;微信公号孤单、中国全科医学学术平台而成,仅作学术分享之用,文章版权归原作者所有。
转自:“量化研究方法”微信公众号
如有侵权,请联系本站删除!