谈谈中国人口数据的可靠性秋 实[新观察]·文库版·大饥荒档案 www.chinafamine.net 转载时请注明作(译)者及出处 在大饥荒之争中,经常有网友对我国人口数据的可靠性提出疑问。大 多数人是出于对实际情况的不了解。也有些人,出于对基本概念的误解。 比如,有人说,我国人口统计的误差是10%,三千万人误差一下就出来 了,跟零没有差别。于是,所谓非正常死亡两三千万的说法,统计上没什 么意义。他们显然没整明白整体(比如若干个随机变量之和)的误差,与 其构成部分(比如其中单个变量)的误差之间关系。举个简单反例:五六 十年代之交,我国少数民族的总人数也不过三千多万,难道也是误差一下 出来的,跟零没什么区别吗?建议提出这种说法的朋友,自修一下概率统 计入门知识。 其实,我国三项主要的人口数据--人口普查、人口抽查和户籍登记 --中,除户籍登记数据之外,其它数据的误差都没有上面网友猜测的那 么大。俺这里简单地介绍一下三大类人口数据的误差范围,同时着重谈一 谈户籍死亡和出生数据的漏报情形,这是人口专家在估算大饥荒非正常死 亡人数时,都特别给予注意的一大问题。 一 人口普查数据 人口普查点算整个群体,不是抽样,无所谓抽样误差。但在点算时会 出现多报或漏报的问题。这就需要抽取一定比例人口进行复查,以确定其 误差范围。下面是我国前三次人口普查的复查结果: 1953年普查:复查覆盖地区占直接调查人口9%, 结果发现,全国总 人口数重复登记1.39‰,漏报2.55‰,净漏报1.16‰,毛误差3.94‰。误 差低于千分之四。[1] 1964年普查:全部大陆人口系直接调查。复查覆盖地区占人口5.3%。 总人口数重复登记0.38‰,漏报0.39‰,净漏报0.01‰,毛误差0.77‰。 误差低于千分之一。 1982年普查:这次普查采用国际通用方法,进行了严格质量控制。复 查结果如下: --总人数重复登记0.71‰,漏报0.56‰,净重报0.15‰,毛误差1.27‰。 误差约为千分之一点二。 --出生人数重登率0.78‰,漏报2.61‰,净漏报1.83‰,毛误差3.39‰。 误差低于千分之四。注意此处的误差是以出生人口为基数计算的。 --死亡人数重登率2.64‰,漏报7.04‰,净漏报4.40‰,毛误差9.68‰。 误差约为千分之十。注意此处的误差是以死亡人口为基数计算的。 由此可见,人口普查数据的精度是相当高的。这就是为什么大家总是 尽可能地以人口普查数据作为基础,去校验其他人口数据。 二 抽样调查数据 人口抽样调查的误差范围,在设计调查方案时予以控制。以下谈到的 误差范围,置信概率均为95%。 1、一年一度的千分之零点五抽样的人口变动情况调查,人口出生率的允 许误差范围正负5‰。 国家统计局公布的一九八二年后每年的出生率和死亡率,便来自于此 项调查。 2、生育率调查,包括1982年的千分之一抽样的妇女婚姻生育史调查, 以及1985年的千分之二抽样的妇女生育节育调查等。后者的出生率允 许误差在正负0.3‰以内。 蒋正华、BANISTER、ASHTON等人口专家用于校正中国 户籍人口登记数据的生育率历史资料,便来自于1982年的调查。 3、1987年的百分之一人口抽样调查,这是一次微型人口普查,半年 出生率允许误差正负0.11‰,半年死亡率允许误差正负0.06‰。 此外还有其它一些抽样调查,此处不一一列出。从以上例子看,抽样 调查的允许误差都控制在极低水平。当然,这些都是设计误差,要求调查 者按规定进行抽样与询问,才能达到。至于调查者是否人为引入了系统误 差,在发现可靠的证明材料之前,俺不想妄加猜测。从现有资料看,抽样 调查数据与人口普查数据吻合度相当高,不象是有可观系统误差的样子。 三 户籍登记数据 户籍登记的人口总数、死亡人数、出生人数等数据,不是由专门的统 计调查来的,而是行政部门负责管理的。其好处是解放以来年年都有,坏 处就是户籍登记与人们的权利义务联系过于密切,登记数字的可靠性,直 接为人们的切身利益所左右,可靠性远远不及前两类数据。下面根据现有 的资料,谈一谈户籍登记的人口总数、出生数以及死亡人数的可能误差。 1、总人口 1964年整顿户口和人口普查本身,共查出多报人口1172万,漏报 人口357万人。按1964年普查人口计算,多报率16‰,漏报率5‰,净 多报11‰,毛误差21‰。 1982年整顿户口与人口普查,共查出多报人口622万,漏报人口 899万人。多报率6‰,漏报率9‰,净漏报3‰,毛误差15‰。 2、死亡率: 1982年人口普查得到的1981年死亡率为6.60‰,而这年户籍 登记的死亡率却为6.11‰,登记完备率约为4%。 不过,1982年因有人口普查,情况较为特殊。比较一下其它年份 户籍登记的死亡率与人口变动抽样调查得到的死亡率,就可以发现,除1 982年外,八十年代前期的死亡漏报相当严重,户籍登记的完备率只有 85-90%左右,如下表所示: 表一、1982-85年死亡率漏报情况 -------------------------------------------------- 年份 户口登记‰ 抽样调查‰ 死亡漏报率(%) -------------------------------------------------- 1982 6.11 6.36 3.93 1983 6.09 6.60 8.42 1984 5.93 6.86 13.56 1985 5.93 6.69 12.86 -------------------------------------------------- 资料来源:《中国统计年鉴1988》 转引自《中国人口--总论》(袁永熙主编,中国财政经济出版社,1991) 第620页 五、六十年代,我国的户籍登记中漏报死亡的情况,同样十分严重。 1964年人口普查时,对该年上半年人口出生、死亡、迁入、迁出四个 项目进行了核对性检查。 普查得到的1964年上半年死亡率为7‰。假 如上下两个半年死亡人数相当,推算全年死亡率应为14‰左右。而户籍登 记的死亡率,仅有11.5‰,比普查推算数低18%!由此可见当时漏报死亡 的严重性。 至于1964年以前的情况,我们可以从两次人口普查的数据以及当 时所作的死亡情况调查,大致看出漏报死亡的严重情形。 根据资料,1964年普查人口69458万人中,年满11周岁以上的 人口占69%,约为48105万,此即1953年的58260万人口中尚存的人数。 因此,不计算五三年到六四年之间出生后又死亡的人数,此期间也至少死 亡10155万人。而同期户籍登记的死亡人口仅仅只有9500万人! 假如这个 期间有大量死亡是出生后没活几岁的儿童,我们就可以肯定,户籍登记的 死亡人数,是大大低估了的。 那么,儿童死亡情形究竟如何呢?我国分别在1957年和1963 年,也即这个期间死亡率最低的两个年份,进行了两次大规模的死亡情况 调查。根据这些调查,死亡人口中很多是少年儿童(表三)。1957年 和1963年,0-4岁死亡人数占死亡人口的比重分别为42.3%和46.2%。 1957年,死亡人口的一半,没有活到18岁,1963年更惨,一半人 没有活到10岁! 用以上数据,不难对户籍死亡登记的漏报情形,作出粗略的估算。根 据人口普查资料,1953年4岁以上,到1964年已经死亡的人口,大约7900万 人,这是该期间死亡的4岁以上人口的下限。按0-4岁死亡人口占死亡人口 40%算,此期间0-4岁死亡人口至少有7900 * 40% / 60% = 5366万人,约 相当于登记死亡人数的55%。 两项合计,死亡人数13000万人,户籍登记 的死亡漏报率为28%左右。 注意以上估计未使用任何出生资料,却与蒋正华教授等根据生育调查 资料估算的死亡漏报率相当一致。根据蒋的估算,1954-64年间大 部分年份,漏报率都在23%到40%之间。事实上,中国五六十年代漏报死 亡极其严重,早已是绝大多数人口专家的共识。 表二、中国死亡人口比重(%) ----------------------------------------------------------- 年份 0-4岁(%) 50岁+(%) 死亡人口年龄中位数(岁) ----------------------------------------------------------- 1957 42.3 35.9 17.6 1963 46.1 34.8 9.6 1975 14.3 67.3 63.2 1981 15.9 64.7 62.0 1987 14.4 69.1 64.5 ----------------------------------------------------------- 资料来源:《中国人口年鉴1985》,《中国1%人口抽样调查资料》 转引自《中国人口--总论》(袁永熙主编,中国财政经济出版社,1991) 第164页 从表二还可以看出,七十年代以后,儿童死亡情形有了翻天覆地的改 变。 0-4岁死亡的比重,从40%以上,下降到16%以下;死亡年龄中位数 则从十岁十几岁,上升到六十多岁。一些生长在七、八十年代的网友,不 了解五、六十年代之事,看到人口专家估算的死亡人口中包括了大量儿童 死亡,觉得无法理解,又不肯去了解历史,动辄就把这些估算斥之为“疯 狂”“荒谬”。其实,真正“疯狂”而“荒谬”的,正是这些人不懂装懂 而又不肯虚心了解事实的偏执态度。 3、出生率 1982年人口普查得到的1981年出生率为20.91‰, 按误差率 计算,其范围20.89-20.96‰之间。但这年户籍登记的出生率却为18.53‰, 登记完备率只有88.6%。 出生率的情形与死亡率相似,户籍数据也有可观的漏报。而且在八十 年代,出生率漏报情形,远比死亡率的漏报来得严重。除1982年以外, 登记完备率仅有80%左右(表三)。 表三、1982-85出生漏报情况 -------------------------------------------------- 年份 户口登记‰ 抽样调查‰ 出生漏报率(%) -------------------------------------------------- 1982 18.53 21.09 12.14 1983 15.11 18.22 17.08 1984 13.85 17.50 20.85 1985 13.63 17.80 23.48 -------------------------------------------------- 资料来源:《中国统计年鉴1988》 转引自《中国人口--总论》(袁永熙主编,中国财政经济出版社,1991) 第620页 由此表可见,户籍出生率统计的可靠性同样十分可疑。国家统计局自 1982年起便不再使用户籍出生率和死亡率,正式公布的数字一律以抽 样调查数字为准。 五十年代,我国的户籍登记制度刚刚建立不久,很多新出生人口,都 未及时申报登记。再加上婴儿死亡率较高,很多出生后不久就死亡的孩子, 根本就没有登记出生,也没有登记死亡。蒋正华根据人口普查数据和生育 率回顾调查数据,用估计参数模型的方法计算出生率,发现五十年代到六 十年代初,出生率漏报程度同样达到10%左右,1962年更达到17%。 此後漏报程度便大幅降低。其原因,一是户籍登记制度更为健全;二是越 来越多的基本消费品按人头分配,漏报出生人口带来的利益损失扩大了; 三是婴儿死亡率大幅降低。低水平的漏报率一直维持到七十年代。随着计 划生育政策的推行日趋严厉,出生漏报率再次于七十年代后期升到10%以 上。这里有瞒报出生因素。更有不少地区,将出生人口假报为迁入人口, 这样既降低了出生率,又不损害按人头分配票证的利益。 ASHTON等人估计的1953-1964年户口登记出生的完备 率,以及其他人口专家的估算数,与蒋正华的估算相差不大,都在80-90% 之间。这些估算,与现有的人口资料以及我国有关政策变化的时间序列, 都是相当吻合的。 四、小结 我国人口普查数据和抽查数据,可靠性都是相当高的。这一点,打从 我国于1983年首次完整公布前三次人口普查数据开始,就得到国内外 主要人口专家的多方检验确认,基本上已经成为人口学界的共识。问题比 较大的是户籍出生和死亡数据,都存在比较大的漏报,其中又以死亡人数 的漏报,尤为严重。这就是为什么根据户籍上报的死亡人数算出的1500万 左右非正常死亡,通常只被被绝大多数人口专家视为下限的缘故。 注释 [1] 在1953年人口普查中,除直接调查的人口外,另有占总人口1.44%的人口为 间接估算,主要是西藏昌都等极少数边远少数民族地区。因其占比重小,其误差对全 国总人口误差影响很小。 (2000年5月6日贴于[新观察/xgc2000.com],2000年6月5日修改) [新观察]·文库版·大饥荒档案 www.chinafamine.net 转载时请注明作(译)者及出处 |