对ASHTON-HILL-ZEITZ中国大跃进 死亡人口方法的评论
郑玄
[新观察]·文库版·大饥荒档案 www.chinafamine.net 转载时请注明作(译)者及出处
网上流传的大饥荒死亡三千万的估计,来自于ASHTON,HILL,PIAZZA,
AND ZEITZ发表在
Population and Development Review, Volume 10, issue 4 (DEC, 1984),
613-645.
这篇文章,在网上的社会期刊数据库:www.jstor.org 可以查到。该数据
库为哈佛大学为文理科杂志所办的数据中心,在美国必须经过和其有和约的
学校网站方可进入。常春藤各校都可以。我以下的评论,所引均为原文所在
页数。
这篇文章的数据来源,据其自己在P613上自称,和其它几个两千万之类
的(P614) 均为中国国家统计局在80年代初的给出的一组数据。包括:
一)1953年,1964年中国人口普查人口年龄分布
二)1982年百分之十家庭调查出的人口年龄分布
三)1982年千分之一抽样所得出的妇女在1940年到1982年之间的生育率
(根据某一位不断变换笔名为其结果辩护的网友的消息,具体人数为三十万
人.所谓40年到82年的生育率,根据此网友的介绍,也就是问被问人你在某
年生的孩子。)
四)1950年到1982年大陆所记年末人口,和该年的记录出生率,和记录
死亡率。
最后一项数据在三年59,60,61中的极为可疑度,尤其是四川省,也就
是在另一篇‘千万’文章中非正常死亡达七百五十万,占该文推出‘非正常
死亡’总数近五分之二(总非正常死亡据推为一千七百万),已经在华岳被
网友们通过自己的经验观察证明是极为难以相信的事情。我的这篇讨论,基
本上是在垃圾进,垃圾出的基础上进行讨论。也就是看其在极不可信的数据
基础上,如何更进一步地作可能的夸大。
我对这篇文章的评论,要从该文附录表A-4谈起。(P640)
根据该表,从数据四)(如上)所得出的记录在案死亡率,和该文推测
出的低于十岁的少年儿童死亡率,从1953年到1964年为
记录死亡率 少年儿童死亡率
(千位) (千位)
1953-54 7926 6610
54-55 7680 6609
55-56 7275 6088
。。。。。。。。。。。。。。。。。
58-59 8389 8691
59-60 13924 6491
60-61 13782 3263
62-63 7534 7062
。。。。。。。。。。。。
从这个表上,我们可以看到非常奇怪的结果,那就是如果没有低报,53
年人口死亡近百人之八十三为少年儿童,此后这个数字稳定在百分之八十左
右,到了五八年大跃进刚开始的这一年,灾害结果还没有出现,少儿死亡人
数已经超过了全国死亡人数。这种得出的少儿死亡人数的疯狂性,非但没有
引起四位作者对自己推测方法的怀疑,却被他们以如下理由解释:中国少儿
死亡人数低报率为百人之七十。也就是说,只有百分之三十的儿童死亡后被
记录,而中国成人死亡低报率为百分之二十,远高于‘一千七百万’的彭大
师百分之十的低报率。
令人费解的是,也就在数页前的表A-1(P636)
中国儿童出生率被记录在案的一直高达近百分之八十(从53年到59年)以
后上升到百分之九十五左右。这不是很奇怪么?中国人对孩子出生记录得这
么准确,对儿童死亡却漏掉百分之七十。
通过如此疯狂假设低报率以后,我们再看表A-5和表A-4的比较:
1953到54年 记录死亡 7926 该文估计死亡 13992 差 近六百万
54-55 7680 13686 差 近六百万
55-56 7275 12856 差 五百万
56-57 6899 11103 差 五百万
。。。。。。。。。。。。。。。。
58-59 8389 15873 差 近七百五十万
59-60 13924 21368 差 近八百万
60-61 13782 19166 差 近六百万
。。。。。。。。。。。。。。。。
十年(53-64)记录在案总死人数为九千五百万,按其估计为一亿六千万,
差七千万,为实际死亡百分之七十多。有了如此可怕的人口低报估计, 彭
大法师的一千七百万中低报百分之十难免就小巫见大巫了。所以,我们的专
家们有了饿死三千万的辉煌成果。以彭大师的宝贝四川为例。
根据变笔名网友提供的‘触目惊心’的资料,四川在六零年每七人中死
一人(此‘触目惊心’的可信度为华岳网友所痛斥),根据此四人58年的低
报率,恐怕当为每三点五人中死一个,根据60年的‘低报率’,当为每四点
五人左右死一人。
网上民运所热爱的一篇文章的结果居然如此。
这四位‘三千万大师’如何得出少年儿童死亡如此之高的海数,从而在
表A-4,A-5中得出如此之高的人口死亡低报率。我们要从该文对出生率的估
计谈起。和不断变笔名为其辩护的网友在华岳上信誓旦旦说该文用的是实际
出生率(也就是记录在案出生率)相反,该文的出生数,包括用来计算死亡人
数的出生数,计算正常死亡人数的出生数,死亡率等等全部都是插值法得出
的估算值。
该文在正文(P619)表三注解A中说:
(翻译)‘在饥荒年的人口出生,是由表二得出的。十岁以下孩童正常
死亡,是以57年到58年及62-63年十岁下夭折率应用到表三中十岁以下人口于
58年中。。。。”
而表二 (P618)
上一段的该表的来源解释正是:
(翻译)“我们的数据总结列于下表二中。从1953年人口出发,依据附
录表A-4的人口出生估算值,附录表A-5得出的死亡估算值,和从附录表三中
推出的孩童夭折率序列,我们得到了每年的人口,出生率,死亡率,和幼儿
死亡率”。
如果各位朋友仔细读过从P634到P642的全文,就会知道以上所提各表全
部是估算值。跟本不是实际值。
这是一篇到处充满者任意假设的文章,几乎在每一个他们自己替自己找
原因的地方,你都可以划个问号。我现简单把他们非常繁琐的计算过程简单
讲一下,这里面关键的讨论就是该文的附录:
第一步,(见P635)估算“人口出生数”和“人口出生记录完成情况”,
所用方法是
一,从1982年生育率回顾中得出各年生育率,也就是这三十万人自称自
己在53到64年各年的生育情况。把这三十万人的自称,当成从53到64年的估
计生育率。
二,以53年人口普查的年龄分布为基础,根据53年年龄为四岁或以上的
依据实际记录在案死亡率所估计出的每年存活率,估算出从53年到64年的每
年的人口年龄分布。
三,把此三十万人自称在53年到64年各年的生育率,根据年龄差别,落
实到(二)中推算的人口各年年龄分布去,算出每年的估计出生人数。
大家千万要注意的是,这个人数,而不是实际记录在案的出生人数,将
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
成为他们计算死亡率的基础(在后文中,P636,P636,会作出更有利于多死
^^^^^^^^^^^^^^^^^^^^^^^^^
人的修正)。这个人数在每一年都高于实际出生人数,我将向大家说明,用
这样的估算出生人数,而不用实际出生人数,也是得出三千万的高数之基础
之一。
四,以从(三)中估算出的人数为“真正出生的人数”(郑玄形象比喻),
和实际出生人数比较,得出所谓的“人口出生记录在案完备率”。真正人口
出生记录在案的作用,基本到此结束(在调整估算数中有用)。
第二步,用估算出来的各年人口出生数,1964年和1982年人口普查年龄
分布情况,估算各年出生者到64年和82年他们的存活率。
基本思想是:如果你在54年出生(不要忘了,是假设有个你出生),到64
年和82年你可能还活者。这样假设54年有一批人出生,到64年我们实际观察
到的你这个54年出生年龄段有多少人,一比较,就是你的存活可能性。82年
还有一个。
注意,所谓的成活可能在两个比较中(54年和82年)很一致是没有什么意
思的,64年那个年龄段的人(从0到十岁)到82年是18到30岁,没什么兵荒马乱,
基本不死,你用54年和两个事情比较,当然会存活率基本不变。在这里,出
现了令该文作者感到奇怪的事情,该文作者加以调整,在调整中,进一步降
低了在大饥荒时间的两个年龄段的存活可能,从而进一步升高了大饥荒时期
的估算“实际死亡率”,继续为更高估计大饥荒时期的“非正常死亡”打下
基础。
第三步,假设各年龄低于十岁的孩童在任何一年死亡率相同,和第二步
中的估算“存活率”估算每年儿童可能死亡率。(P638)
第四步,以第一,二步的估算“实际出生人口”,和第三步的估算儿童
死亡率,计算各年儿童死亡数(这也就是我在此文一开头提到的可怕的高的
儿童死亡数--实际上是在无穷假设后的估计数的由来)。
第五步,以第一,二步的估算”实际人口出生数“,以57-58年和62-63
的估计儿童死亡率,计算‘正常死亡人数’。
第六步,发现在第四步中的儿童死亡人数算出几乎达到实际记录死亡总
人数的百分之八十甚至在某些人超过实际记录死亡总人数,慌乱中抛出“在
发展中国家儿童死亡未记录率常常远高于成人死亡未记录”(P640),声称儿
童(十岁以下)死亡未被记录为百分之七十,又为了让数据吻合,计算出成人
(十岁以上)死亡未报率为百分之二十,从而得出和实际死亡记录在案数相
差极大的全体总人口“实际死亡”数。
第七步,用这个远远高于记录在案的死亡数的估算死亡数,减去“正常
死亡人数”。得出成人非正常死亡一千七百万,儿童非正常死亡(十岁下)
一千二百万如此气球七吹八吹,终于吹出近三千万‘非正常死亡’来。
网友们知道,我们计算‘非正常死亡’,基本的公式在简单化以后,实
际上如下:
某种人口数*(实际死亡率-正常死亡率)=非正常死亡数
这个公式也可以写成
某种人口数*死亡率的SCALE(NORMED 实际死亡率- NORMED正常死亡率)=非正常死亡数
这种公式还可以写成
某种人口数*(所报实际死亡率-所报正常死亡率)*(1+低报率)=非正常死亡人数
这也就把我们来变戏法,尽可能吹大非正常死亡数提供了五个途径:
一,提高某种人口数
二,提高实际死亡率
三,减低正常死亡率
四,吹大死亡率的SCALE。
五,提高低报率。
以上五个方法,可以互相重叠于一个行动中。并非五种互相排斥的办法。
但各种并不等价。
当ASHTON等人所用的全部是估计值的时候,上面提高或减低后加上估计
就可以了。
我对ASHTON等人的各个假设的怀疑的出发点如下。
一,各年龄层所用“实际出生人口”的计算方法实在值得怀疑。这千分
之一家庭的82年的生育回顾调查实在值得怀疑。我不是说这三十万人说谎,
而是说这三十万人的生育估计,能作为插值用到全体,而且是用插值估算出
来的54年到64年实际全体生育情况去么?毕竟,千分之一是点,全体生育情
况是面。从点到面的推测是有随机误差的,更何况,点群之间未必有代表性,
这就会出现偏心预测。
举个例子,如果这千分之一家庭愿意老老实实回答自己生育情况的从非
典型的相对富裕亚群中得出(统计人员没有去艰苦地区随机抽样,而是和中
国传统混世人员在文革后期和结束后一样,早点去个好地方干完事情了事),
那么相对富裕地区的生育率,出于家庭经济学的考量,是会高于正常平均生
育率的。这样一用插值倒插,就高估了群的生育率,从而估计出来的’实际
出生人口‘。
二,既然该文声称死亡率被大规模低报,那么在(P635页)上计算53年各
年龄层在以后各年的人口分布中,就应该用估算的“真实死亡率”,而不是
“记录在案死亡率”。用该文的声称来看,他用的这种计算方法必然会高估
各年龄层人口在53年到64年的人口数,从而高估“实际出生数”约略等于估
计人口数*估计生育率。
该文为什么没有这样作,我认为原因可能是:1)没考虑到(最有可能),
2)这样会出现必须重复多次反复计算,一直到经济学中所说的CONVERGENCE
出现的时候,而他们没有这样的计算能力。
为什么要多次计算呢?我们用类似计算经济学中科克伦--奥克德计算法
说明如下:
你以记录在案死亡率计算人口各年分布,然后在估算出成活率后用插值
法估算出实际死亡率,这是个新的死亡率。你要用这个新的死亡率,回算各
年人口分步,再算出更新的实际死亡率,再次回头修改,直到前后两次的估
计实际死亡率相差很小。这就叫CONVERGENCE。而这个问题最后有无可能
CONVERGE,无人知道。不是所有这样的算法都能CONVERGE,有些情况下这种
计算会永远进行下去。
又有人会说:从该步估算的是幼儿人口成活率,而53年四岁以上的是生
他们的人,你怎么能要求用那个幼儿死亡率来修正生他们的人的死亡率呢?
答:嘻嘻,你别忘了,该文声称成人死亡低报率是百分之二十啊?这个循环
过程是从头一步作到尾,在把尾的结果重新拿到头里去也!如此循环往复。
三,高估的人口出生估计数,在用来进一步估算人口在64年和82年的人
口普查各年龄段中的存活率的时候,会升高死亡率的SCALE。
为什么要这么说呢?因为64年和82年,一个是实际的点人头,也就是实
际在录真正人口年龄分布。这个数据不会因估计当时人口如全部存活当为多
少的插值法错误而被高估。这样,你假设多生了很多人,这些人却不会被吹
进64年,和82年独立的人口统计。于是,出生人口(实际上并未出生)当然
成活率降低了。因为成活率又是计算各年龄段幼儿死亡率的基础。死亡率的
SCALE自然升高。这样,非正常死亡数也会上升了。
四,在该文的P636页和P637页,该文作者们人为地调低了不是用来作
‘正常死亡率’计算的两个年份人口存活率,和作为‘正常死亡率’基年的
62-63年的人口存活率。后者的确如作者所说,是‘不可能的高’--存活率为
0。983,而前各年的人口成活率为从53-54到61-62:
0。75,0。81,0。77,0。79,0。81,0。68,0。83,0。79,0。75
(未调整前)相差居然近0。2。该文将‘正常死亡率’基数年出生存活率
下调,本来是件减少‘非正常死亡数的事情’,可是该年存活率远远高于近
乎记录死亡率谷低的57-58年存活率达近两个百分点,而挑后仍然达0。89,
为存活率第一。
除此之外,该文以82年人口生育回归可能‘低估’了54-55“实际出生率”
为由,敲掉了第一个成活率高点0.81。又以59年到60年成活率太高,可能是
因为“实际出生率”被低估(用他们的话,出生记录在案率实际上要低很多
(P637)),敲掉了另一个成活高峰点,0.83。这样,经过修正后的人口成活
率为(从53-54到61-62):P638
0。75 0。76 0。77 0。79 0。81 0。68 0。772 0。793 0。752,0。892
其中最高的两个成活率年被当成了计算‘正常死亡率’基数年。62-63
的0。89计算出来的低死亡率是否能成为‘正常死亡率’基数是很令人怀疑
的。如果这是个低估的‘正常死亡率’,那非正常死亡数就会上升。
五,这篇文章里太多随意的假设,除了在最后一步一口咬住两个死亡未
报率的天价。儿童死亡未报为百分之七十,十岁以上为百分之二十以外。
它的核心,饥荒年的幼儿和成人死亡数的绝对值和比例,都让人感到奇怪。
而它自称的解释,过于的牵强附会。
请看附表A-5。
估算死亡在10岁以下 成人死亡估算
1958--1959 8691 7182
59-60 6491 14877
60-61 3263 15903
1961-62 7062 6727
也就是说,在58年,大跃进刚刚开始,其苦果还没有在59年,60年那样
大暴露的时候,在该文自己推算的成人死亡数在57-58年度为7042,几乎和
58年相等的时候,少年儿童突然死亡达到历史最高点,近八百七十万。等到
59年,60年大饥荒开始的时候,成人死亡率暴增,儿童死亡率却不升反降。
到了成人死亡最高的60年,儿童死亡数忽然降到了从53年到61年的最低点。
等到61年大饥荒的威胁减弱的时候,成人死亡估算突然跌到这十年死亡数的
最低,好于各年份。儿童死亡却大增回高于成人死亡。
根据该文在正文(P618)的解释:
大义为:59年到61年存在粮食配给制度,优待40岁以下的人。所以在61
年取消优待以后,儿童死亡率大升。
我驳斥说:这种牵强附会的解释实在是荒谬之极。
一,这里面的儿童家长看来是极度自私,在58年,把孩子的东西用来喂
自己,让孩子饿死。这哪里是中国的可怜天下父母心啊!
二,这些儿童家长不仅自私,而且还很听党的话。党说:要给儿童多吃
点东西,这些家长拿了给小孩东西,不会自己去吃,很乖地让小孩吃得饱饱
的,自己去饿死。
三,看来粮食配给远胜过正常饮食。十岁儿童死亡各年估算在该文
[P640]中从53--61各年为:
6600 (千) 6609 6088 5633 5193 8691 6491 3263 7062
以前各正常年度的饮食,包括58年,都不如粮食配给。粮食配给的60年,
在全国一片饥荒的情况下,少年儿童的成活率忽然空前的无比地好了起来,
降到了3262千。
和我的辨奸论一样,如果没有什么大的特殊讨论,我对该文的看法就写
到这里了。并不是该文没有别的可以批评的地方,而是该文随意假设太多,
得出来的结论太离奇,不是我们正常的,作为生活在中国过或正在生活在中
国的人可以通过自己的经验接受的。
我对计量经济学和统计的有限知识告诉我这条最基本的原理(用统计学
的术语,也就是第一和第二统计错误),那就是无论你用什么模型得出什么
样的数字,只要客观现实和这个看上去再怎么严谨,在怎么到处左右缝缘地
解释,看上去在‘理论上’天衣无缝预测抵触,那就是这个模型和它的预测
方法错了。
以前有位网友冲动一时地说:废话,人饿死是用模型算出来的么?那是
点出来的。这其实包含了一个真理。我们观察到的客观事实,我们亲身经历
的感受总和,才是检验社会科学模型的真正工具。
这就象一个俄罗斯老百姓看了某自称经济学大师的某某再三用模型证明
俄罗斯的休克疗法是最优之路,看了看自己身边到处穷困潦倒会对那个经济
学家说狗屁一样。我们感受到的客观事实的总和才是衡量预测的最后标准。
模型永远只是模型,不能解释现实,靠诡辩维持的模型老百姓是不会信
的。用理论,数字模型变戏法,谁都能变。只是闪亮的泡泡很快就有爆炸的
一天?
(送交者: (郑玄) 于 May 03, 2000 03:57:03:[新观察/xgc2000.com])
回页首
[新观察]·文库版·大饥荒档案 www.chinafamine.net 转载时请注明作(译)者及出处
|