社情民意调查热线:028-12340
当前位置:调查技术> 调查知识

【统计调查知识】数据的误差

2021-09-01  浏览量:11602 次

来源:《统计业务知识》

数据质量的好坏直接影响统计分析的结果,数据的误差是评价数据质量的主要指标之一。误差可以来自许多不同的方面,调查误差是主要来源。调查误差就是指搜集数据的观测值与真实值之间的差异。调查误差可归纳为两大类:抽样误差与非抽样误差。

一、抽样误差

抽样误差。是由于抽取样本的随机性所造成的样本值与总体值之间的差异,也称为代表性误差。抽样调查中之所以会出现这样一种误差是由于样本只是总体的一部分,它对总体的代表性存在局限性,从而会造成误差。在抽样调查中,抽样误差是不可避免的。在概率抽样中,抽样误差是能够计量且可以得到控制的。

抽样误差的大小取决于以下因素:第一,总体内部的差异程度。在其他条件不变时,总体内部差异越大,抽样误差就越大;反之,抽样误差就越小;第二,样本容量的大小。在其他条件不变时,样本容量越大,抽样误差越小。抽样误差常会随着样本容量的增加而缩小,但在一定阶段后便稳定下来;第三,抽样的方式与方法。不同的抽样方法产生的抽样误差也有差异。相同条件下,重复抽样比不重复抽样的抽样误差要大,分层抽样的抽样误差要小于其他类型抽样方式的抽样误差。以上三个因素除第一个因素外,其余两个都是人为决定的。因此,抽样误差可以创造条件加以控制,这就大大提高了抽样调查的应用价值。

二、非抽样误差

非抽样误差,是指除了抽样误差之外调查中因各种原因所引起的调查误差。通常认为非抽样误差是由于调查程序执行中的错误与不足引起的,它不仅出现在概率抽样和非概率抽样中,也出现在全面调查和非全面调查中,可能产生于调查方案设计、抽样设计、数据搜集、数据处理及分析等各个阶段与环节。抽样调查不能通过增大样本量加以控制,对调查结果的影响也非常大,甚至可能导致整体调查的失败。

与抽样误差相比,非抽样误差具有成因复杂、难以识别和测量、容易造成估计量有偏以及不可能随着样本量的增大而变小的特点。非抽样误差分为抽样框误差、应答误差、无回答误差和计量误差等。

(一)抽样框误差

抽样框误差,指目标总体和抽样总体不一致时产生的误差。目标总体是指调查研究对象的全体,而抽样总体是从目标总体中抽选样本的总体。在抽样调查中可以把总体分成若干个互不重叠又穷尽的有限个部分,每个部分称为一个抽样单位。抽样单位可以是一个个体,也可以包含多个个体。抽样单位的名称就是抽样框。例如,名单抽样框、区域抽样框、时间表抽样框等。为避免抽样框误差,应尽可能使抽样框与目标总体相一致。

抽样框误差包括以下几种情形:

第一,丢失目标总体单元。在这种情形抽样框没能覆盖全部总体单元,它使总体总和估计偏低,同时也会造成均值(或比例)估计的偏倚。

第二,包含非目标总体单元。抽样框包含了一些不属于研究对象的即非目标总体单元,这种情形常造成总体总和估计的偏高。

第三,复合连接。抽样框中的单元与目标总体单元不完全是一对一对应而是存在一对多或多对多的现象。这种情况称为抽样框与目标总体存在着复合连接。

第四,不正确的辅助信息。有些复杂抽样框还包含辅助消息,如当采用分层抽样、不等概率抽样以及使用比估计或回归估计等情形,如果这些辅助信息不完全或不正确,不仅不能提高抽样的效率,反而会降低估计的准确性,从而导致误差。

(二)应答误差

应答误差,是指调查者在接受调查时给出的答案与实际情况不相符。产生应答误差的原因可能有理解、记忆、有意被误导等多种情况。例如被调查者对问题的理解产生偏差,被调查者可能忘记了过去发生的事情但却胡乱猜测,被调查者由于对某些问题不愿回答而避开真实情况,长期问卷调查可能会导致答题疲劳从而给出一些错误的答案,调查者的不正确提示被误导而错答等。

(三)无回答误差

尽管随机抽样可能使从适当的抽样框架中选出的,但也不能保证样本中的每个人都会回答问题或回答所有的问题。无回答误差,是指在调查中由于各种原因没有能够对被所抽取样本中个体进行计量,没有获得有关样本中个体的信息而造成的偏误。无回答误差可以分为个体无回答和项目无回答。个体无回答是指被调查者没有参与或拒绝接受调查;项目无回答是指被调查者虽然接受调查,但对其中的一些调查项目没有回答。

产生无回答误差的原因很多,主要有被调查者和调查者的原因。如被调查因繁忙抵触访问;调查问卷中的问题、调查者失误等而拒访或不回答;地址有误、被调查者不在、无法与被调查者取得联系等也会造成无回答误差。此外,无回答误差与一个地区的经济发达程度及公民素质有很大关系。为提高调查回答率,应做好宣传、问卷设计、调查员培训、奖励与激励等工作,使被调查者愿意配合调查。

(四)计量误差

计量误差,是除了抽样框误差、应答误差和无回答误差之外的非抽样误差,它是由多种复杂原因所造成的调查中获得的数据与其真值不一致的误差,可能是由于问卷设计不合理产生的,也有可能是调查时产生的,还有可能是登记错误、数据录入错误等。为减少计量误差,需要科学设计问卷,认真做好数据调查及整理工作。

地址:成都市二环路西一段108号 电话:028-87042305  四川省社情民意调查中心 

Copyright © 2012

许可证编号:ICP12015325-2