抽样后分层

科技工作者之家  |   2020-11-17 18:22

先抽样后分层又称事后分层或抽样后分层。顾名思义,它是对一个总体先进行简单随机抽样或系统抽样,抽取一个样本n,在调查完后,再按一定分层的因子将n个单元划分为若干个层,并进行分层抽样估计。1

用途之所以采用后分层抽样,是因为在一些调查中事先无法掌握总体各层的单元数或权重i有的事先难以对总体各部分按一定分层标志分层。比如,调查某省劳动力的有关职业情况,如果事先不知道各种职业层次的劳动力人数,就难以实施分层抽样调查。再如,大面积的森林资源调查,如果没有较完整的有关树种、林龄、疏密度等资料或它们的面积统计,就很难事先分层。为解决这类问题,需要采用后分层抽样技术。

后分层抽样操作简便、成本低,在总体信息不全的情况下可以应用。国际上一些国家广泛采用后分层抽样方法调查人口、资源、收入、卫生健康等社会经济情况。在我国森林资源调查中,后分层抽样用得也很多,在缺乏森林分布图、林相图和适合的航空相片等资料时,就只好从总体中随机地(系统更好)抽取n个样地,在外业调查样本的同时,要对总体各地块林分进行区划,分类。在内业中,按分层方案,把n个样地分层,由于这种抽样把分层和调查样本单元合并在一次外业,可节省大量费用,又能提高抽样效果。但是这种自然资源的分层抽样,通常抽样比很小,不像社会经济调查中用样本确定层权重容易,尤其是层数太多,各层样本单元数少,对层权重容易引起较大误差,影响抽样结果。

可以说,先抽样后分层是简单随机抽样和分层抽样的有机结合,在一般情况下其估计效率比先分层抽样差些,但又会比简单随机抽样好些。

由于事后分层抽样方法,总体只有一次抽样,而不能满足使各层独立随机抽取,同时也不能保证样本按比例分配,所以其方差估计与比例分层抽样不同。

特点对于分层抽样,需要在抽样之前就对总体中的所有单位进行分层,然后准备好各层的抽样框,再在各层中独立地抽样。在实际工作中,有时对总体的认识不够,事先分层比较困难。此时,如果想利用分层抽样的优点进行参数的估计,就可以考虑采用事后分层。事后分层的实施过程为:先采用简单随机抽样方法从总体中抽取一个容量为n的样本,然后对样本中的单位按照某种特征进行分层。例如,在某学院对过去一周教员加班情况的统计中,可采用按系和按职称情况进行分层。但并不知道哪种分层方式更能使得“层内差异小,层间差异大”,这时就可以进行事后分层。

事后分层要求层权已知或者可以通过某种途径获得。当层权既未知而需要进行估计时,应确保估计得到的阢与实际值相差甚小,否则事后分层技术不能达到提高参数估计精度的目的。运用事后分层技术时,还要注意事后层不宜太多。2

整群抽样后分层整群抽样与分层抽样相结合,就可以形成分层整群抽佯或整群抽样后分层。

分层整群抽佯是以群为抽样单位的分层抽样,即先对总体中的群进行分层,然后每层分别随机抽取部分群进行调查的一种抽样形式。对群进行分层的角度有两个:一是当各群内的个体数相同(即等群)但群标志总值有较大差异时,按群标志总值(或群平均数)或其他相关标志进行分层,其目的是为了提高整群抽样的估计精度。很显然,只要正确分层,分层整群抽样的估计精度一定会优于一般的整群抽样,因为它能使层间的差异大而层内群之间的差异小,同时满足分层抽样和整群抽样的要求。尤其是对于群内差异小而群间差异大的总体,分层整群抽样尤为合适。二是当各群内的个体数不相同(即不等群)时,按群的个体数多少进行分层,其目的是为了使危内的群接近于成为等群而便于采用等概率抽样估计。如果按个体数多少分层后,各群的群均值之间仍还有较大的差异,那么还可以再按群均值或相关标志进行分层,这样就可以使层内的群无论在个体数多少还是在群均值大小方面都充分接近,叭而既可以避免采用不等概率抽样估计的麻烦,又可以大大提高抽样估计的精度,可谓一举两得。

还有一种分层整群抽样是为了解决不等群的不重复不等慨率抽样问题。我们知道,在不等群的不重复不等概率抽样估计中,当样本群数大于2时,操作过程就会变得十分困难。这时可以先对总体中的群按辅助标志大小进行分层,层数为总样本群数的一半,然后每层分别随机不重复抽取2个群。这样,每层的抽样估计就容易操作一些,同时由于经过分层,总体参数估计的精度也会有所提高。 3

本词条内容贡献者为:

任毅如 - 副教授 - 湖南大学