第2章 数据的搜集与整理
【引例】 现实中的统计。
根据中国互联网中心《2009年中国青少年上网行为调查报告》,我国未成年网民具有如下规模和特征:互联网在未成年人中普及率较高,上网已经成为我国未成年人的重要生活内容之一。2009年,中国未成年网民占青少年网民总数的40.6%,规模达7917万人。
未成年网民在家庭上网比例最高,为81.1%;学校上网比例也达到42%,高于青少年整体36.3%的水平。但是仍然有37.6%的未成年网民在网吧上网,如图2-1所示。

图2-1 未成年网民和青少年网民上网地点对比
未成年网民使用台式机上网比例最高,为75%。有63%的未成年网民使用手机上网,这一比例低于整体青少年网民手机上网比例。随着低龄人群人均手机持有量的增加,手机上网的普及,未来未成年网民使用手机上网的比例还会进一步提高,如图2-2所示。

图2-2 未成年网民和青少年网民上网设备对比
从引例中的内容出发,在对许多实际问题的研究中,常常需要通过社会调查或科学实验,搜集一些客观现象的现实数据,用于描述和分析自然、社会、经济、政治、文化现象的变化情况。这也是统计学研究的基本内容。
统计学是一门关于大量数据资料如何进行收集、整理和分析的学科,其目的是发现数据内在的数量规律。相应地,统计研究主要由数据搜集、数据整理和数据分析几个阶段构成,其中,准确、及时、有效地进行统计数据的搜集是统计活动的起点,用科学的方法对搜集到的数据进行整理是数据处理和分析研究的基础和前提。
本章将介绍统计数据的搜集与整理的基础知识。
2.1 统计数据的搜集
统计数据的搜集是根据统计研究的目的,采用科学的方法,有计划、有组织地搜集统计资料的过程。统计资料的好坏将直接影响到整个统计工作成果的优劣,甚至影响到人们对客观事物的正确判断和认识,因此,统计数据的搜集必须做到准确、及时和全面。
2.1.1 统计数据的来源
统计数据是指统计工作过程中所取得的各项数字资料及与之相关的其他实际资料的总称,因此,从统计数据本身的角度看,统计数据最初都来源于直接的调查或实验。然而站在使用者的角度,统计数据的获取主要有两种渠道:数据的直接来源和数据的间接来源。
1.数据的直接来源
在统计研究中,为了获得关于特定研究问题的原始材料,调查人员需要通过直接的调查或科学实验获得统计数据,这种获得统计数据的渠道称为数据的直接来源,并称通过该渠道获得的数据为第一手或直接的统计数据。数据的直接来源包括调查和科学实验两种渠道。
调查通常是对社会现象而言的。对于社会经济现象,由于各种社会因素不可控性的存在,不能像自然科学现象一样在实验室人为控制下反复试验和观察,因此采用统计调查的方式来搜集资料。例如,经济学家通过搜集经济现象的数据来分析经济形势、某种经济现象的发展趋势、经济现象之间的相互联系和影响,管理学家通过搜集生产、经营活动的有关数据分析生产过程的协调和效率等。
2.数据的间接来源
对于某些研究问题,如果与研究内容相关的数据资料已经存在,所要做的只是将这些数据资料搜集起来,经过再加工处理使之变成可以使用的数据资料,这种获得统计数据的渠道称为数据的间接来源,其对应的数据为第二手数据或间接的统计数据。
间接获取数据的主要方式是文案调查,通过查阅图书、期刊、专利文献、档案文献、内部资料、照片、图片、录音、录像、电影、幻灯片等文献资料,获取统计研究所需的数据。通过文案调查法得到的数据主要是公开出版的或公开报道的数据,例如《中国统计年鉴》、《中国统计摘要》、《中国社会统计年鉴》、《中国工业经济统计年鉴》、《中国农村统计年鉴》、《中国市场统计年鉴》,以及各省、市、地区的统计年鉴等。另外,诸如《世界经济年鉴》、《国外经济统计资料》、世界银行各年度的《世界发展报告》等世界各国社会和经济数据等统计出版物也比较方便查阅。
除了公开出版或公开报道的统计数据外,还可以通过其他渠道使用一些尚未公开的统计数据,如系统内部资料,与业务经营活动有关的各种单据、记录,经营活动中的各种统计报表,各种财务、会计核算和分析资料等。
2.1.2 统计调查与统计调查体系
统计调查是根据统计研究的目的、要求和任务,采用科学的调查方法,有计划、有组织地收集统计资料的工作过程。统计调查是统计工作的基础环节,担负着统计数据的搜集任务,所有的统计处理、统计运算、统计分析、统计预测和统计决策等统计工作,都是建立在各种资料搜集工作的基础之上的,因此做好统计调查工作在整个统计工作过程中至关重要。
1.统计调查的方法
在统计调查时应该根据调查目的与被调查对象的特点,选用合适的调查方法获得统计数据。常用的统计调查的方法包括观察法、报告法、询问法和实验法四种方法。
(1)观察法
观察法就是由调查人员到现场对调查对象直接计数和计量以获得统计资料的方法。例如,乐购超市的资讯员经常以售货员的身份在商场从事销售工作,观察顾客的购买行为。
通过观察法获取数据时,调查人员不需要与调查对象有正面接触,而是利用感觉器官或设置一定的仪器,观察和记录人们的行为和举动。通过观察法搜集的数据受调查人员主观意识影响较少,相对比较客观准确,但却需要花费大量的人力、物力、财力和时间,具有一定的局限性。
(2)报告法
报告法是以各种原始记录或核算资料为基础,由调查单位按规定填写调查表,并按统一规定的时间上报调查资料的一种方法。例如,我国现行的统计报表制度就是采用报告法来搜集统计数据的。
由于具有统一的要求和上报程序,在原始数据健全、经济核算工作基础好的单位,用报告法可以获得比较准确的资料。
(3)询问法
询问法又称直接调查法,是指调查人员通过询问的方式,从调查对象的回答中获得统计资料的一种方法。根据询问方式的不同,询问法又分为访问调查法、电话调查法、被调查者自填法等。
访问调查法,又称采访法,是由调查人员直接询问被调查者,或者由调查人员召集相关人员开座谈会,并将搜集到的资料记录下来。通过这种方式获得的统计资料真实性较强,但所需费用(交通费等)较高,同时受调查人员主观意识影响较大。
电话调查法是调查人员通过电话同调查对象进行语言交流,从而获得统计资料的方法。电话调查具有速度快、费用低等特点,对于电话已经普及的地区,采用电话调查比较经济实用,但要注意问题的数量不宜过多。
被调查者自填法是指调查人员将调查表交给被调查者,由被调查者自己填写,然后将调查表寄回或由调查人员收回。通过这种方式获得的统计资料受调查人员主观意识影响较小,但由于调查人员不在场,容易造成理解上的误差,因此在设计调查表时要有一定的技巧。
(4)实验法
实验法起源于自然科学的实验法,是指在控制条件下操控某种变量来考察它对其他变量影响的研究方法。例如,为了确定在职技术培训对工人劳动效率是否有影响,华伦灯泡厂将第一车间的工人随机地分成了两组,对一组人员进行培训,另一组人员不进行培训,一段时间后观察两组人员的劳动效率。实验法获得的统计资料较为客观准确,但是在实施过程中对非研究因素的控制往往较难以实现。
另外,随着科学技术的不断进步,统计调查已经不再局限于上述几种方法,而是逐步将计算机、网络、光电技术和卫星遥感等高新技术引入到统计调查领域,并且予以灵活的运用,以更好地解决实际问题。
2.统计调查的种类
从不同的角度,统计调查可以有不同的分类方式。
(1)按搜集资料的组织方式不同,分为统计报表制度和专门调查。
统计报表制度是由政府主管部门根据统计法规,以统计表格形式和行政手段自上而下布置,而后由企、事业单位自下而上层层汇总、逐级上报,提供基本统计数据的一种调查方式。
专门调查是指为了研究某些特定的社会经济现象而专门组织的调查。例如,普查、抽样调查、重点调查和典型调查等。
(2)按调查对象所包括的范围不同,分为全面调查和非全面调查。
全面调查是对构成调查对象总体的全部单位无一例外地进行调查,如人口普查、工业普查等。全面调查能够掌握调查对象较为全面的、完整的统计资料,但工作量很大,需要花费较多的人力、物力、财力,组织工作比较困难。
非全面调查是对构成调查对象的部分单位进行调查。例如,重点调查、典型调查和抽样调查等。非全面调查工作量较小,需要花费的代价也较小,同时可以调查较多的内容,但搜集到的资料存在统计误差。
(3)按调查登记时间是否连续,分为经常性调查和一次性调查。
经常性调查是随着调查对象的变化,经常、连续不断地进行调查登记,以了解事物在一定时期内发展变化的全过程。例如,工业企业对产品的质量及原材料的消耗量调查。
一次性调查是指间隔一段时间,对调查对象进行不连续调查登记,以了解事物在一定时点上的状态,如我国的人口普查。
3.统计调查体系
为了适应社会主义市场经济的要求,国家统计局在1994年召开的全国统计工作会议上提出了建立一个以必要的周期性普查为基础,以经常性的抽样检查为主体,同时辅之以重点调查、科学推算和全面报表等多种方法综合运用的统计调查方法体系。下面,针对我国的统计调查方法体系,介绍一下五种常用的统计调查组织形式。
(1)统计报表制度
统计报表制度是一种以全面调查为主的调查方式,是由政府主管部门根据统计法规,以统计表格形式和行政手段自上而下布置,而后由企、事业单位自下而上层层汇总、逐级上报,提供基本统计数据的一种调查方式。它的任务是经常、定期地搜集反映国民经济和社会发展基本情况的资料,为各级政府和有关部门制定国民经济和社会发展计划,以及检查计划执行情况服务。
根据不同的划分标准,统计报表有如下类别:
① 根据报表内容和实施范围不同,可分为国家统计报表、业务部门统计报表和地方统计报表。国家统计报表又称国民经济基本情况统计报表,由国家统计部门统一编制,反映全国性的经济和社会基本情况,包括农业、工业、交通、基础建设、商业、对外贸易、劳动工资、物资、财政、金融等方面最基本的统计资料;业务部门统计报表是为了适应各部门业务管理的需要而制定的专业技术报表,用以搜集有关部门的业务技术资料,作为国民经济基本统计报表的补充;地方统计报表是针对地区特点而补充制定的地区性统计报表,是为本地区的计划和管理服务的。
② 根据报送周期长短不同,可分为日报、旬报、季报和年报。各种报表报送周期的长短和指标项目的详简有一定的关系:报表报送的周期越短,报送的指标项目越简越粗;反之,指标项目越繁越细。除年报外,其他的报表都称为定期报表。日报、旬报由于时效性强,也称为进度报表。
③ 根据报送单位不同,可分为基层统计报表和综合统计报表。基层统计报表是由基层企、事业单位填报的报表;综合统计报表是由主管部门根据基层报表逐级汇总填报的报表。
④ 根据调查范围不同,可分为全面统计报表和非全面统计报表。全面统计报表是要求调查对象的每一个单位都要填报的报表;非全面统计报表是要求调查对象的一部分单位填报的报表。我国的统计报表大多属于全面报表。
⑤ 根据报送方式的不同,可分为邮寄报表和电信报表。采用什么方式报送取决于内容的紧迫性或要求的实效性。日报和旬报时效性强,故通常采用电信方式上报;月报、季报和年报,一般采用邮寄方式上报。
(2)普查
普查是为了某一特定目的而专门组织的一次性全面调查,常用来说明现象在一定时点上的全面情况。普查大多是在全国范围内进行的,主要用来全面、系统地掌握重要的国情国力和资源状况,为政府部门科学地制定方针政策和发展战略提供依据。例如,全国人口普查就是要摸清我国人口的实际状况,为制定国民经济政策和社会发展战略服务。
普查的组织形式一般有两种:
① 建立专门的普查机构,配备普查人员,对调查单位进行直接的登记,如人口普查等。
② 利用调查单位的原始记录和核算资料,发放调查表,由登记单位填报,如物资库存普查等。
以上两种形式相比,第一种方式获得的统计资料更加全面、准确,但同时工作量大,需要动员较多的人力、物力,组织工作比较繁重。在任务紧迫,或者调查内容较单一、涉及范围较小时,国家统计机构往往通过第二种方式进行“快速普查”,由登记单位将填报的表格越过中间一些环节直接报送到最高一级机构集中汇总。
为了保证普查工作的顺利、有效进行,进行普查时需要坚持下述原则:
① 明确规定统一的标准时点,调查资料必须反映调查对象在这一时点上的状况,以避免因时点不统一而发生登记重复和遗漏的问题。例如,我国第五次人口普查的标准时点是2000年11月1日零时。
② 各调查单位或调查点尽可能同时进行登记,并在尽量短的期限内完成,以便在方法上、步调上保持一致,保证统计资料的准确性和及时性。例如,我国人口普查的调查期限一般是10天。
③ 调查项目应统一规定,且项目一旦确定不得任意改变或删减,以免影响汇总综合,降低资料质量。同时,为了便于对历次调查资料进行对比分析,每次调查时,同一种普查的项目应力求一致。
④ 普查尽可能按照一定周期进行,以便进行历史资料动态对比,研究调查对象的发展变化规律。改革开放以来,我国对有关国情的重大统计信息采取每隔五年或十年进行一次的周期性普查。
(3)抽样调查
抽样调查是一种非全面调查,从总体中抽取一部分单位作为样本进行调查,并根据样本的数量特征去推断总体的数量特征。如果抽取调查样本时遵循随机原则,则称为概率抽样,否则称为非概率抽样。下面主要介绍概率抽样,如无特殊说明,下文提到的抽样调查都是指概率抽样调查。
抽样调查主要有如下三个显著特点:
首先,按照随机原则从总体中抽取样本单位。所谓随机原则,是指总体中每个单位都有可能被抽中,任意单位是否被抽中纯属偶然,排除了主观因素对选样的影响。随机原则是抽样调查的基本原则,只有严格遵循这个原则,才能使样本的结构与总体的结构最大程度地相似。
其次,根据所调查样本的实际情况对调查总体的数量特征做出估计。由于样本的结构与总体的结构存在着一定程度上的相似性,这为抽样调查用部分信息来推断总体数量的特征提供了科学依据。
最后,用样本数据推算总体的特征,不可避免地存在误差,但这个误差可以计算并加以控制。抽样误差可以根据有关资料事先加以计算,并且通过一定的途径来控制其范围,以保证抽样结果达到预期的可靠程度。
抽样调查具有工作量小、经济性强、实效性高等优点,通常用于一些不可能或没有必要进行全面调查的情况,如导弹射程、电视机寿命、电视台收视率等。另外,抽样调查还经常用于对全面调查资料的检验补充和修正。
(4)重点调查
重点调查是指在全体调查对象中选择一部分重点单位进行调查,以取得统计数据的一种非全面调查方法。尽管重点单位在全体调查对象中所占比重不大,但调查的标识量却占了标识总量的很大一部分,因而对这部分重点单位进行调查,可以从数量上说明整个总体在该标志总量方面的基本情况。例如,要了解全国钢铁行业生产的基本情况,只需要对鞍钢、武钢、首钢、宝钢、包钢等几个钢铁企业进行调查就可以了,因为这几个大型联合钢铁企业的钢铁产量占全国钢铁产量的比重很大,也就是所说的重点调查单位。
重点调查的关键问题是确定重点单位,重点单位的选择主要着眼于它在所研究对象的标志总量中所占的比重,因而不带有主观因素。重点单位可以是重点地区(产区、市场、出口基地等),也可以是重点企业、主要产品或商品,在具体问题中应视情况而定。
由于选择的单位较少,重点调查中允许调查较多的项目和指标,了解较详细的情况,并且由于调查只在少数重点单位中进行,因此能够有效地减少人力、物力和财力,并能及时地掌握总体的基本状况及其发展变化的基本趋势。
当调查任务只要求掌握总体的基本情况,且总体中存在重点单位时,采用重点调查是比较适宜的。同抽样调查不同的是,重点调查取得的数据只能反映总体的基本发展趋势,不能用以推断总体。
(5)典型调查
典型调查是根据调查目的和要求,在对调查对象进行初步分析的基础上,有意识地选取少数具有代表性的典型单位进行深入细致的调查研究,借以认识事物发展变化规律及本质的一种非全面调查。
显然,典型调查单位的确定与其他非全面调查相比较,更多地取决于调查者主观的判断与决策,因此,在采用典型调查的方式时要求研究者有较丰富的经验,在划分类别、选择典型上有较大的把握。
典型调查一般更侧重于定性分析,主要依靠调查者深入调查单位,与调查对象直接接触,取得第一手资料。通过典型调查能够在更深的层次上了解事物的本质和发展变化规律,及时反映各种新情况、新问题。与重点调查一样,典型调查获得的资料可以用来补充和验证全面统计的数字,但不具备由部分单位推算总体数量特征的作用。
2.1.3 抽样调查
在很多统计问题中,或者由于人力、物力、财力或时间的限制,或者取得全部数据是不可能的,或者虽然能够取得全面数据但数据收集本身带有破坏性,在现有条件下,只能对研究对象总体的一部分单位进行调查,并依据这些部分单位的数据对研究对象总体的数量特征或数量规律进行推断。在选取“部分单位”时,可以选择研究对象总体中的重点单位或典型单位,但更多的是通过概率抽样的方法来抽取样本。
1.抽样调查的基本概念
(1)总体与样本
总体又称全及总体,是指所要认识的对象的全体,由具有共同性质的许多单位组成。一般用大写字母N表示总体单位数。抽样调查首先要弄清总体的范围、单位的含义,构成明确的抽样框(指包含全部抽样单位的名单框架,即总体单位的名单),作为抽样的母体。例如,要研究辽宁省城镇居民家庭收入水平,则全省的所有家庭构成总体,每个家庭都是一个单位。
样本又称子样,是指从总体中随机抽取出来的部分单位所构成的集合。在统计研究中,以样本代表总体,并用样本的数量特征对总体的数量特征进行估计和推断。样本的单位数称为样本容量,一般用小写字母n表示。在抽样调查中,总体是唯一确定的,而样本则不是唯一的,从一个总体中可以抽取出很多个样本来,并且每次可能抽到哪个样本也不是确定的。
样本容量n与总体单位数N的比值n/N称为抽样比。
(2)总体指标和样本指标
总体指标也称全及指标,是根据总体各单位的标志值和标志特征计算的、反映总体数量特征的综合指标。一般用大写字母表示总体指标。由于总体是唯一确定的,因此根据总体计算的总体指标也是唯一确定的。
若总体单位数为N,变量为X,变量值分别为X1,X2,…,XN,则总体平均数和总体方差分别为

若总体N个单位中,有N1个单位具有某种属性,则总体成数P表示总体中具有某种属性的单位数所占的比重,且

样本指标是根据样本各单位的标志值或标志特征计算的、反映样本总体特征的综合指标。一般用小写字母表示样本指标。样本指标是随机变量,只有从总体中抽取样本后才能计算得到。与总体指标相对应,常用的样本指标有三种。
若样本n个单位中,各单位变量值分别为x1,x2,…,xn,则样本平均数和样本方差分别为

若样本n个单位中有n1个单位具有某种属性,则样本成数p为

2.抽样调查的方法
根据样本是否能够反复抽取,抽样调查可以分为重复抽样和不重复抽样两种方法。
重复抽样也称放回式抽样,是指从总体中抽取样本时,每次抽取的样本单位,在记录其有关标志表现后都要放回总体中去参加下一次抽取,直到抽满n个样本单位为止。重复抽样时总体单位数在抽选过程中始终未减少,因此,每个单位中选或者不中选的机会在每次抽样中都是完全相同的,而且各单位都有被重复抽中的可能。
不重复抽样也称不放回式抽样,是指从总体中抽取样本时,每次抽取的样本单位,在记录其有关标志表现后不再放回总体,这样在下次抽样时就不会再次抽到前面已经抽中过的样本单位。在进行不重复抽样时,总体每经过一次抽样,下次抽样的总体单位数就减少一个,因此每个单位的中选机会在各次是不同的。
3.抽样调查的组织形式
抽样调查有如下五种组织形式。
(1)简单随机抽样
简单随机抽样也称纯随机抽样,它是按照随机原则从总体中逐个地抽取样本单位,因此每个单位的入样概率是相等的。简单随机抽样最符合抽样调查的随机性原则,是抽样调查中最基本的组织形式。
通过简单随机抽样的方法抽取样本单位时,可以先给总体的每个单位编上序号,并制成签条,掺和均匀后从中随机抽选,直到抽满预定的单位,也可以使用随机数字表。在使用随机数字表时,首先应根据编号的位数确定使用随机数字表的列数,然后从任意一列、任意一行的数字开始,向任意一个方向查过去,并摘录属于编号范围内的数字,直到抽够预定的样本单位数。
简单随机抽样需要对样本一一编号,或将被抽单位列成目录,当总体规模很大、范围很广时工作量也变得十分巨大,因此这种组织形式主要适用于总体单位数较少、范围较狭窄的情况。例如,全国职工家庭收支抽样调查,要将全国职工家庭进行编号实际上是很难办到的。
(2)类型抽样
类型抽样也称分层抽样,是将总体中的各单位按照某种特征或某种规则划分成若干个不同的类型组,然后从各类型组中独立、随机地抽取样本,再将各类型组的样本结合起来,对总体的目标量进行估计。
类型抽样可以保证样本中包含有各种特征的抽样单位,使样本的结构更近似于总体的结构,从而可以有效地提高总体指标估计值的精确度。同时,除了估计总体的参数值,还可以分别估计各个层内的情况,这些优点使类型抽样在实践中得到了广泛的应用。
例如,某服装厂的职工有500人,其中不到35岁有125人,35岁至49岁的有280人,50岁以上的有95人。为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本,由于职工年龄与这项指标有关,决定采用分层抽样方法进行抽取。因为样本容量与总体的个数的比为1∶5,所以在各年龄段抽取的个数依次为125/5,280/5,95/5,即25,56,19。
(3)等距抽样
等距抽样又称系统抽样,是将总体中各单位按照某一标志顺序排列,在规定的范围内随机确定起点,然后按照一定的间隔抽取其他样本单位的抽样组织形式。
在等距抽样中,先将总体从1~N相继编号,并计算抽样距离K=N/n。式中N为总体单位总数,n为样本容量。然后在1~K中随机抽取一个数字k1作为样本的第一个单位,接着取k1+K,k1+2K,…,直至抽满n个单位为止。
等距抽样能够使样本单位均匀分布在总体中,使样本结构与总体结构相似,因此抽样的精确性比简单抽样好,同时操作简便,在很多方面都有应用。
例如,为了解宏业印刷公司5000名员工的家庭收入水平,现要从中抽取一个容量为100的样本。我们按姓名笔划对总体进行排列,把总体划分为K=5000/100=50个相等的间隔,在第1至第50人中随机抽取一名,如抽到第10名,则后面间隔依次抽取第60,110,160,210,…名直到第4960名为止,共抽取100名职工组成一个抽样总体。
(4)整群抽样
整群抽样是将总体各单位划分为若干群,然后以群为单位从中随机抽取一些群,对抽中群的所有单位都进行调查的抽样组织形式。例如,育华中学为了调查中学生患近视眼的情况,从3个年级共36个班级中抽取一个班级的学生,对其视力状况进行统计研究。
由于整群抽样抽取的单位较为集中,因此调查实施起来较为方便,能够有效地缩减调查经费和时间。但是整群抽样中抽样单位的集中,却影响了样本单位在总体中的均匀分布,因此抽样误差较大。一般来说,为了减少抽样误差,整群抽样应尽可能多抽一些群,并且这些群应均匀分布于样本总体中。
(5)多阶段抽样
多阶段抽样也称多级抽样或阶段抽样,是将对总体单位的整个抽样过程分为两个或更多个阶段进行,先从总体中抽选若干个大的样本群,称为第一阶段单位,然后从被抽中的若干个大的单位群中,抽选较小的样本单位,以此类推。
在大规模的社会调查中,面对的总体单元数往往很庞大,并且总体范围很广,这时如果只用某一种抽样方式或通过一次抽样来选出样本,不仅工作量大,而且在精度上很难把握。在这种情况下,往往采用多阶段抽样的方式来组织抽样调查。
例如,为了调查某品牌的手机在我国的产品售后服务满意度,可以首先从全国各个省份中抽取几个省,然后从抽中的省中抽取若干个城市,从抽中的城市中,再抽取若干个县、区,这种抽样方式就是多阶段抽样。
多阶段抽样保持了整群抽样的优点,保证了样本相对集中,从而节约了调查费用。同时,可以根据各阶单元的分布情况,采取不同的抽样方法,以提高抽样的估计效率。另外,对于没有抽到的单位不需要再进行编号或制定抽样框,节约了大量的人力物力。我国许多全国性的大规模抽样,都采用的是多阶段抽样的组织形式。
需要指出的是,由于多阶段抽样的每个阶段都会产生抽样误差,因此,即便是大规模的抽样,抽取样本的阶段也应当尽可能地减少。