主题：浅层搜索与深层搜索：一个反教化的实例 -- 秋末冬初

共:💬69 🌺248 新:

老大河待整

分页树展主题 · 全看首页上页下页末页

- - 复以咱家看来，饿死多少人是个立场问题，不是科学问题
    家园 也许未必，我看到一些数字，
    桥上:抄书
    其实挺清楚的，至少可能不必推算了。
    - 复也许未必，我看到一些数字，
      家园 这也就能说明河南地区的情况
      要是推而广之，那就谬以千里了。
      还有数据的准确性问题
      根据地季6月8日统计，从1959年10月至1960年4月底，信阳地区死亡总数共436,882名，占全区原有总人口8,042,097人的5.42%。死亡人数中正常死亡155,698人，占总人口的1.96%，非正常死亡155,698人（不包括工伤、中毒及其他死亡的3717人），占总人口的3.44%。非正常死亡中因浮肿紫疳死亡的175,951人，因其他病症死亡的105,233人。
      按数据的原文，
      全区原有人口8,042,097人，
      非正常死亡数应该是8042097*3.44%=276,648
      其他原因死亡的应该是8042097*（5.42-1.96-3.44）%=1608
      但是非正常死因统计中，却可以看到非正常死亡人数为
      175951+105233=281,184
      如果倒推回去，非正常死亡人口占总人口应该是281184/8042097=3.496%
      这都对不上号呀……
  - 复以咱家看来，饿死多少人是个立场问题，不是科学问题
    家园 我来说说杨继绳数字的推导
    我来说说杨继绳数字的推导吧
    其实我本帖的根本动机，说的不是具体的数字问题，而是教化与反教化的问题。它的背景正在于用一个今天读者相对远距离的历史“事件”，加借其时政治力量官僚系统以及今天的政治力量既得利益者以及动机之间错综复杂的关系，以不断教化的“解释”来影响读者的“理解”，而又以“解释”来替代“事件”本身。被我说饶了？我这里有一个跟帖，大概表明我看待此类历史的态度。关键是如何理解历史本身
    但是现在发觉，即便你不愿意谈，即便你强调的是在“理解”和“解释”之间的争夺，怎样在影响读者对“事件”的把握上发生的斗争，但还是避免不了谈“事件”本身。
    那就浅谈几句“事件”。我对这个事件本身，没有确切的准确的把握。原因很简单，我们没有可靠的精准的数字依靠。我同意橡树村长所说的，数字本身不可靠。但我在这一篇的意思，则是三次人口统计的一个有趣的对比则是质疑了这种数字不可靠的原因。则它是有规律的，而且随着时间和政治格局的变化，这个人口普查中“天上掉人口”的“尾巴”会变得越来越大。很有可能我们下一次人口统计，即便59-61年出生的人口数量不再如同前两次人口普查一样天上掉人口越死越多，但如果这个规律管用，那依然很有可能我们会发现59-61年出生的人口死亡率竟然要比前面后面出生年份的都要低。所以积吉河友讲技术上是不可能产生误差的，是人为的误差。我只能...谢谢他这么讲。
    这里还有几个相关的讨论，都只是技术层面的。
    隔路山贼:经过我的研究，已经有了那三年的比较准确的非正常死亡数据。
    秋末冬初:进一步精准为见
    雪里蕻:这些事情要搅和起来就细了
    好吧。回头谈杨继绳数据的来源。谈他，实属大家讨论中看来已经无法避免。再加上在史文恭的楼里，百丈村长河友一句“[杨继绳]是对包括他亲人在内的死难者的纪念。这就是杨老师的用心，就算他“愚蠢”，也不宜称为“别有”[用心]”令我深受刺激。再加之黑翼炽天使河友已经引用了部分杨继绳的内容，那我们就来说一说吧。
    杨继绳主要有两个数据，一个是3600万，一个是7600万。
    第一个数据怎样来的呢？根据丁学良讲，杨继绳本书“该书对资料的整理、对数据的比较，非常细致”，还引用了“[杨]1960年代毕业于清华大学，基础扎实”作为佐证，惭愧。
    当然，其中“在长达十几年的研究期间，作者在全国饥荒最严重的几个省，包括西北、西南、华北、华东、东北、华南等地的省区收集了大量资料，并面对面地采访了100多名当事人。他收集的资料多达千万字，仅访谈当事人的记录就厚厚的十多本。”这一点是值得称道的，起码那100多名当事人的访谈，如果别人不去重复做一遍，是没有办法反驳的，这是实证研究的优势，毕竟对于历史研究而言，“事实高于理论”。就此向杨继绳“老师”致敬。
    事实上，无论左派还是官派还是政府，我从未看到有任何一人否认过那三年有灾荒（这一点杨继绳及其同志倒是极力否认），饿死了人，政策有重大错误。连毛泽东都对大炼钢铁以及大办人民公社正儿八经地认了错（但貌似今天某派同志及网友们穿越往来，坚持或无视都说他没认错）。但貌似今天，认为“（别人）有错误”一直是杨派同志们的专利。持不同意见者肯定是反人道的、无理的、吃人不吐骨头的。
    所以说，我对实证访谈部分脱帽致敬，只是作者及其拥趸不一定允许我等脱帽就是了。
    但实证访谈是无法归纳出3600万的宏观数据来的。1对1的走访和3600万的宏观数据之间不存在逻辑上的等同。那杨继绳的3600万数据是怎样的出来的呢？按照丁学良的说法，他“比较了几个外国学者对中国大饥荒的重要研究成果”，又“比较了中国国内三位学者金辉、王维志、曹树基的研究成果”，还说，杨继绳“对数据的比较非常细致”。结果呢？如果你通读杨的著作，并认真做笔记的话，你就会发现，其实杨本身并没有做相对于以上作者而言更新更进一步的数据处理和模型处理工作，他做的研究是——
    三个国外学者：
    美国Judith Bannister： 2987.1万
    美国Ansley Coale： 2481万
    法国Gerard Calot： 2850.9万
    按照丁学良的说法，“杨继绳对这三位学者的研究做了仔细的比较，在此基础上，又比较了几位中国学者金辉、王维志、丁抒、曹树基的研究成果。”
    在杨继绳的引述中，这几位学者报告上的死亡数字大概都在3200万-3500万之间。其中王维志的数字最高，在3300-3500万。
    而胡星斗的文章中提到“杨继绳先生特别看重王维志的研究成果。强调：“王维志不仅熟悉人口统计理论，还熟悉中国官方人口数据的形成过程。””而杨继绳本人则讲“基本同意王维志的结论”。
    如果说杨继绳同志真的做了独立的数据研究的话，那他的研究完全浓缩在不到两个电脑屏幕幅度的精华之中，大家在本贴后杨文链接部分即可看到。基本上只是以上各个学者数据的一个摆列加简单验算。
    可见，杨继绳的“细致”的研究基本上就是这么一个过程：
    1-首先，找老外（倒是摸透了中国人崇洋惧洋的特点），老外数据大多是2000多万。
    2-其次，还有没有更大的？找到几个中国学者，都比老外给出的数据高，于是“细致比对”后，采取了这几个在3200万-3500万之间结论的中国学者的说法。
    3-而在这几个中国学者当中，他又因为“王维志不仅熟悉人口统计理论，还熟悉中国官方人口数据的形成过程”而采用了最高的一个3500万的数据，而且还是王数据的上限。
    然后，他认为应当加上1958年和1962年（他坚持认为这两年有饥荒），因此，应该有一个增量。所以他无视王算法对前后年份的插值基础，算出了“按各省官方数据”1958年为181万，1962年为42万，共计223万人，则大饥荒饿死人在3500万～3700万之间。取其中数3600万。
    然后根据“计算那些应出生而没有出生的人口”（男性河友，请一定不要打手枪啊*），第二个数据，即7600万出现了。
    讲完了。总结一下——
    杨继绳老师的细致的数据研究方法就是：他搜罗了不少材料，国内的国外的，然后选了数字最大的一群人的研究，再取了数字最大的一个人的研究，然后再取了这个人研究的数字的上限，然后再加上自己的个人调整(加上了1958年和1962年的数据)，得出了3600万。再加上没生出来的，7600万。
    其中，为了以示不偏不倚，他很“厚道”地在自己的3500-3700万之间取了一个中值。即便为了这个小厚道，他还不忘说“笔者认为，同所有中外学者的数字比较，3600万这个数字比较接近实际，但还是低于实际”。我就不明白，说自己觉得“还是低于实际的”就可以了，讲什么“同所有中外学者的数字比较”啊。不是吗？
    此外，为了证实王的个人调整（针对蒋正华1700万数据的调整），同样也为了证实自己后面对1958和1962年数据的“调整”，他还特地指出“王维志...是以他多年的实际经验和亲身体验。。。他是学统计的，...他知道各地报上来的数字是多么不准确，如果用精确的数学工具来处理这些数据，显得滑稽。”看来强调个人出身来让读者相信无论如何得到的东西，的确是大家的习惯。
    这的确是一个，按照百丈村长河友的说法，“就算他愚蠢，也不宜称为别有（用心）”的推算方法，也就是丁学良大学者所言的“对资料的整理和对数据的比较非常细致”的方法。
    我向这些学者们脱帽致敬。
    既然中国的GDP都能按照每年8-10%的增量前进；那么这个死人的数据估计也能同样繁荣。这还得多谢这些学者们的努力，后浪逐前浪。
    相同的都是平民出汗，“精英”出话罢了。
    我好汗。
    其实历史没有前进，我们一直生活在本质上相同的官僚集团当中，只不过他们的数量到底是一个还是多个罢了。
    文中提及而未在行文中直接指出的引用：
    百丈村长:我有意见。
    黑翼炽天使:摘点老杨《墓碑》序言里的话
    黑翼炽天使:再继续贴老杨的《墓碑》关于“三年是常年”的高论
    丁学良：你不能不看的墓碑
    杨继绳：大饥荒期间中国的人口损失
    *注：而且在饥荒之后，生育意愿和生育能力的恢复，都被赤裸裸地无视了。而在这些作者以插值法为基础的算法中，反倒成为了死亡人数正向增加的基础。所以说，“如果用精确的数学工具来处理这些数据显得滑稽”，大家还混什么混啊。
    通宝推：桥上,黑翼炽天使,
    - 复我来说说杨继绳数字的推导
      家园 这个问题上比较通俗而且又系统的文章还是金小丁那篇
      抓了“30M”说法的几个源头（不然“30M”一开始难道是从天上掉下来的？）和几个典型衍生说法，有针对性的进行批驳，既有定量分析，又有定性分析，既有文献调阅，又有当事人走访，而且还比较通俗易懂。
      金小丁：“饿死三千万”质疑（金的原始链接，好像被Yahoo拿掉了）
      水木“历史俱乐部”版的转贴
      通宝推：秋末冬初,
      - 复这个问题上比较通俗而且又系统的文章还是金小丁那篇
        家园 关于数字“事件”的来源与评述：金小丁的论述
        关于数字“事件”的来源与评述：金小丁的论述
        多谢jungleford的推荐。以前我没有看过这篇，看了之后的确觉得好。
        起码，我们假模假式地谈论研究方法和研究态度，相比杨继绳的“计算”，金小丁这篇要好得多，不仅仅做了文献综述，而且对每一个引述文献的质疑都有详细的逻辑基础。跟这篇相比，杨继绳的“清华出身”“基本功扎实”“数据研究非常仔细”就是个肥皂泡。很推荐。
        转录如下：
        “饿死三千万”质疑
        金小丁
        1959-1961年间发生在中国的饥荒所造成的死亡人数, 是多年以来世人普遍关注的问题。1964年中国政府进行了建国后第二次人口普查，但结果没有公布。在1982年第三次人口普查之后，两次普查结果和历年户籍统计资料一起在国家统计局1983年出版的《中国统计年鉴》里公布。其中最令人震惊的是，根据户口统计，中国人口总数在1960年减少了整整一千万。
        《年鉴》公布以后，中外学者以此为主要依据，对三年饥荒期间的非正常死亡人数作出了各种估计。与此有关的比较重要的数据和中外专家在学术杂志上发表的研究论文，都被收录在海外《新观察》中文网站主办的《大饥荒档案》里（见
        http://xgc.bbsindex.com/wh/famine/或https://3dlabes.game-host.org）。本文所引用的数据和文献，除另外注明者外，都可以从该网页上查证。
        根据这些材料和研究结果，经西方和海外中文媒体的广泛宣传，三年大饥荒“至少饿死三千万人”似乎已经成为主流共识，甚至得到一些中国官方媒体和机构非正式的认可。本文通过对《大饥荒档案》登录的所有七篇研究论文的分析说明，这个流行甚广的说法缺乏科学依据和逻辑合理性，是不可信的。
        《大饥荒档案》收录的七篇论文中，有三篇得出接近或超过三千万的非正常死亡人数，其他四篇低于三千万。我们将分别对这两组论文进行讨论。在具体分析这些研究结果之前，首先应当明确的是，专家们论证出来的是饥荒期间的非正常死亡人数，这与饿死人是两回事。比如，一个老年癌症患者本来可以活到1962年，但由于饥荒期间营养不足，体质下降，1961年就去世了。在医生和他家人眼里，他明显死于癌症，不是饿死的，但在统计数据和专家的论证结果里，他属于非正常死亡。根据《中国统计年鉴》，1959-1961年的三年平均死亡率为18.1‰,与1950-1952三年的平均死亡率17.6‰相当接近。也就是说，三年饥荒中大部分死亡，在1950-1952年可能被当成正常的。可是没人认为五十年代初那三年有几千万人饿死。中国历史上记载的饥荒死亡人数指的是饿死人数，通常只占非正常死亡人数的一小部分。有人用这次饥荒的非正常死亡人数与历史上饥荒造成的饿死人数相比，是不恰当的。本文讨论的是非正常死亡人数，不是饿死人数。
        １。三千万及更高死亡数的结果分析：
        《大饥荒档案》所列的接近和超过三千万非正常死亡的研究结果有：Ashton等四位美国人口学家估计的2947万(1984)，美国人口统计局 Banister博士的三千万(1984) 和上海大学金辉教授的4060万（1993）。除此之外，近年来还有其他人提出超过三千万甚至四千万的估计数。但其学术水平都不在这三家之上，漏洞更明显，《档案》也没有登录，我们就无须在此浪费读者时间了。科学不须民主投票，只要《档案》所列的这三家中任何一个站得住，三千万非正常死亡就可以成立。下面让我们逐个分析这三项研究结果。
        （一）让我们先看一下Ashton等人的研究结果。他们先分别算出1958年中－1962年中十岁以下儿童和十岁以上人口的非正常死亡人数，再把二者相加而得到四年非正常死亡2947万的估计数。估计十岁以下儿童的死亡数比估计死亡总人数难得多。户籍统计的总人口数和死亡率是不分年龄的，只有1953和 1964年的人口普查结果包括各年龄组人数。可大多数在饥荒期间死去的十岁以下儿童，1953年还没出生，不会出现在普查数据里。而他们1964年都已死去，也无法登记在案。这些儿童生来无影死去无踪，他们的人数是怎么推算出来的呢？
        Ashton等人口学家先根据1982年中国千分之一人口抽样生育率调查的结果，算出1964以前历年的出生人口，再与1964年人口普查的相应年龄人数对比，得到这些年龄组到1964年的存活率。以这些存活率为基础，加上其他假设，推导出各年龄组儿童在1964年以前历年的死亡率。但这样算出的死亡率有的成了负数，明显不合理。为了消除这些漏洞，Ashton等专家修改了三个年龄组到1964年的存活率，使死亡率皆为正数，最后算出十岁以下儿童的非正常死亡数（635-639页）。按照这些美国专家的说法，死亡儿童的70%都被中国政府的统计遗漏了。
        这些专家的研究方法很难令人信服。首先，当死亡率出现负数时，他们能看出不合理并做了调整，但数值为正数的死亡率，就肯定没有问题吗？其次，既然存活率不可靠，需要修改，那么，以存活率为基础算出来的死亡率能可靠吗？第三，死亡率出现负数，各年龄组的存活率都可能有问题，其他假设和数据也可能不准确，为什么仅仅修改那三个年龄组的存活率呢？如果修改其他年龄组的存活率，或修改其他假设，也可以消除死亡率为负数的不合理结果。因此，Ashton等人算出的儿童非正常死亡数只是很多可能性当中的一种，却不是唯一的或最合理的估计。
        下面的实例说明Ashton等专家的估计确实不合理。根据他们的推算（619页表3），1958年中至1959年中，十岁以下儿童非正常死亡高达427 万，而十岁以上人口非正常死亡数不到22万。两年后年忽然风水轮转，十岁以下儿童非正常死亡只有55万，而十岁以上的非正常死亡达910万。再过一年，风水轮又转回来，十岁以下非正常死亡突破442万，而十岁以上的非正常死亡现象竟然彻底消失了。
        生活在那个时代的中国人，有谁见过或听说过这种老少轮流死亡现象呢？Ashton等专家解释，这是因为饥荒开始阶段政府没实行粮食定量，大人只顾自己吃，小孩被饿死。然后，政府向儿童提供专项救济粮，救活了小的，饿死了老的。再后来，粮食定量没有严格执行，又是孩子饿死，大人没事。
        谁听说过中国政府在饥荒期间专给儿童发配口粮？即使发了，还不是要经过父母的手到孩子的口吗？如果狠心的父母能在1959年眼睁睁看着自己的孩子饿死，1961年就能乖乖地看着孩子吃救济粮自己饿死？这些美国专家做出那样的解释，太不体谅我们中国老百姓的天下父母心了吧。
        既然Ashton等专家分别算出来的十岁以下和十岁以上非正常死亡人数难以置信，他们由此所得出的2947万估计数也明显可疑。
        （二）其次，让我们看看Banister博士。在她的研究结果中，与其1958-1961四年三千万非正常死亡估计数有着不可分割的联系的，还有：1960年死亡率44.6‰，婴儿（一周岁以内）死亡率更高达284‰，平均预期寿命仅24.6岁。
        这些结果与官方数据的巨大差异，Banister博士的解释是因为后者对死亡率严重漏报。据她估计，1953-1961年九年间平均死亡漏报率高达 42%。她说这是因为中国老百姓对亲属死亡隐瞒不报，以便继续从政府那冒领粮食。假如真是这样，这些人死不发丧可不能象秦始皇似的，只瞒个把月，甚至一年半载都不行。因为日后被发现的死亡人数将会加到下年度，进出相抵，不会对平均漏报率有什么影响。Banister博士认为42%的死者亲属能长期向政府冒领粮食而不被发现，恐怕太小看那段时期无产阶级专政的强大威力了吧。
        据Banister博士在1987年出版的《中国变化中的人口》（114-115页）介绍，她先根据1982年生育率抽样调查，算出1953-1964 年历年出生人数，再用这些出生人数之和减去从1953年和1964年人口普查得到的总人口变化数，算出1953年至1964年的死亡人口总数。然后她把这些死亡总人数分配到1953至1964年期间，得出历年死亡率。她估算出的1957年死亡率为18‰，1962年为14‰，并假设1958年至1961年的正常死亡率由前者向后者线性递减。最后，她用这四年估计的死亡率超过正常值的部分与总人口数相乘，得到1958-1961年三千万非正常死亡人口数，其中仅1960年的非正常死亡人数就接近二千万。
        假设Banister博士的出生人口数正确，其计算过程中最关键也最有争议的是如何将1953年至1964年的死亡人口总数分配到历年中去。显然，分配到饥荒年份的死亡数越多，算出的非正常死亡数也就越大。她对其分配死亡人数方法的解释是：“这个随意估计的过程得助于官方死亡率的升降趋势。我们可以假设，虽然历年的官方死亡率都太低，但他们所显示出的趋势还是代表了真实情况的。我们在此列出的大多数年份的死亡率估计，就是在这样的假设下得到的（115 页）”。
        按照上述说法，最简单的办法应是假设历年死亡漏报率相同或漏报百分数相同。但Banister博士没有这样做。她估计1960年死亡漏报率为43%，从而使她估计的该年死亡率比公布值高出19‰。而她估计1957年和1962年的死亡漏报率为40%和28%，使得她对这两年死亡率的估计只比公布值高7‰ 和4‰。这样的区别对待明显拉大了1960年死亡率与1957和1962年死亡率之间的差距，使她得出的1960年非正常死亡率几乎是按官方数据得到的两倍。这是她算出1960年近二千万非正常死亡人数的关键。她没有解释把1960年死亡率和漏报率估计那么高的原因。
        那么，Banister博士估计的1960年44.6‰的死亡率能否自圆其说呢？可惜不能。按照她书中（42页表2.7）给出的她对《年鉴》数据调整后的估计，1959年底和1960年底中国总人口数分别为652,505万和647,665万。而她估计的1960年出生率为26.8‰。由此，我们可以推出1960年的死亡率应为34.2‰，远远低于她自己在同一本书里给出的44.6‰。我们应该相信哪一个？
        另外，根据Banister博士书中的数据（384、386页表A.1、A.2），我们可以用1964年普查时3岁和4岁儿童的平均数，计算出生于 1960年并活到1964年的人数至少为1292万（如果按4岁儿童人数计算，则更高达1430万）。即使所有1960年出生者年满一岁以后到1964年普查时一个都没死，按照284‰的婴儿死亡率，1960年出生人数最少也得有：1292万／(1－0.284)＝1804万。再遵照Banister博士估计的1960年26.8‰出生率，我们应当得到1959年底全国总人口数为1804万／0.0268＝673,309万。这个数目与她估计的 652,505万相差二千多万，比她估计的1960年非正常死亡数还多。如果考虑到1960年出生者一岁以后到1964年普查时死去的人数，差别会更大。这个误差不解决，她的三千万非正常死亡估计数能有多少意义呢？
        （三）最后，轮到唯一的中国学者，估出4060万非正常死亡人数的金辉教授。出于对同胞的尊重，我们对金教授的研究做一点更认真详细的介绍。在得出这个最高死亡数之前，金辉教授先得出非正常死亡最低2791万和农村非正常死亡3471万两个结果。我们将对这三个数字分别进行讨论。
        （1）非正常死亡至少2791万：金教授的非正常死亡人口计算法是用出生人口－正常死亡人口＋总人口减少值。对于出生人口，他“暂且利用公布的出生率” 得出“1960年出生了1381万人（66207万×0.02086），1961年出生了1187万人（65859万×0.01802），两年中共出生了 2568万人”。对于正常死亡人口，他“取1956、1957和1962、1963年的平均值10.57作为1959-1961年间的‘正常死亡率’的值”，得出“1960年正常死亡数为　699万（66207×0.01057），1961年为696万（65859×0.01057），两年累计为 1395万”。另外，“1960年总人口净减1000万，1961年又净减348万，两年累计1348万”。
        根据其非正常死亡人口计算公式：“2568万（出生人口）－1395万（正常死亡数）＋1348万（净减总人口）＝2521万（非正常死亡）”。由此，金教授下结论：“可见，1960－1961年两年间的非正常死亡人数可能达2521万”。
        金教授继续推论：“还有1959年。我们姑且相信公布的死亡率14.59，其与前述平均死亡率之差为4.02，即使这样，1959年的非正常死亡数亦达 270万（67207×0.00402）”。因此，“1959-1961年三年灾难时期，中国大陆的非正常死亡人口，肯定不低于2791万（2521 万＋270万）”。
        金教授没有解释为什么他“暂且利用”《年鉴》1960和1961年的出生率，不利用死亡率，然后又“姑且相信”1959年的死亡率，不相信出生率。听他的口气，好像反过来算会让他更高兴。那就让我们看看结果如何。依照1959年的出生率24.78‰计算，当年出生人数为67207万 ×0.0247＝1660万。人口增长量为67207万－65994万＝1213万。正常死亡数为67207万×0.01057＝710万。因此，按照金辉先生的公式，1959年非正常死亡数为：1660万－710万－1213万＝－263万。另外，1960和1961年的死亡率为25.43‰和 14.24‰，两年非正常死亡数是67207万×（0.02543－0.01057）＋66207万×（0.01424－0.01057）＝1242万。三年非正常死亡人数为1242万－263万＝979万，远低于金教授的2791万。
        我们未必相信979万的低估计数，但对金教授先“姑且相信”一种算法，接着又“暂且利用”另一种算法而得出的2791万，不能不怀疑其可靠性。
        （2）农村非正常死亡3471万：在算出全国非正常死亡2791万的基础上，金教授进一步分析：“三年中市镇非正常死亡约为157万人，但市镇人口按公布增长率算仍增加了约545万人。而1958年底至1961年底，三年中全国总人口是负增长135万人，这即意味着仅仅中国农村那三年中非正常死亡的绝对数字，就比统计意义上的全国非正常死亡的总数还要多出680万人”。这样，他的结论是：“三年灾难中，仅仅中国农村的非正常死亡人数，就可能达3471 万。”
        让我们“姑且相信”金教授的2791万非正常死亡人数。既然“三年中市镇非正常死亡约为157万人”，农村非正常死亡人数的简单算法应当为2791万－157万＝2634万。只有城市非正常死亡人数为负数时，农村非正常死亡人数才可能高于全国。金教授用城市增加人口545万＋全国人口负增长135万所得的680万，应当是农村人口三年净减少数。参照金教授的非正常死亡人数计算公式，农村非正常死亡人数应当为：农村出生人口－农村正常死亡人口－农民进城净人口＋680万农村人口减少数。金教授把全国非正常死亡人数2791万当成前三项之和，得到他的3471万农村非正常死亡人数，太有想象力了。
        按理说，农村出生人口－农村正常死亡人口应当等于农村人口数×（农村出生率－正常死亡率）。按照金教授所列的数据，三年共计54836万 ×（0.02378－0.01057）+ 53134万×（0.01935－0.01057）+ 53152万×（0.01699－0.01057）＝1834万。忽略城乡人口移动，三年饥荒期间的农村非正常死亡人数应为1834万＋680 万＝2514万。这个数字跟我们前面按简单算法得到的2634万基本吻合。
        所以，即使“姑且相信”金教授的2791万非正常死亡数，他的3471万农村非正常死亡估计也完全是概念糊涂导致计算错误的结果。按照金教授的话讲，真是“误差太大了。大得令人难以置信”。
        （3）全国非正常死亡4060万: 让我们再次“姑且相信”金教授的2791万，看看他如何论证出全国4060万非正常死亡人数。首先，由于《年鉴》公布的人口数和人口增长率不吻合，金教授宣称他“可以断言，误差如此之大的数据，肯定不全部是原始数据，而是经过精心设计的真假相间虚实结合的信息，虽然我们目前也许尚未能精确地完全破译它”。因此，金教授当仁不让承担起“精确地完全破译它”的重任。他“经过反复正向和逆向的演算，发现这些数据虽然表面上充满了矛盾，但它们之间又确实有着自身的规律和内在的逻辑。......有些数据尽管明显是矛盾的虚假的，但是，它们却极为微妙地在暗中指点迷津，使人通过这些虚假数据搭起的桥，而最终能够寻找到原始的真实之所在”。
        果然，经过这些“虚假数据”“极为微妙地在暗中指点迷津”，金教授发现1961年底的全国总人口数比《年鉴》公布的65,859万少1278万。这 1278万被官方数据隐瞒的死亡人数，加上前面算出的2791万非正常死亡数，终于使金教授“寻找到原始的真实”：“中国在1959-1961年的三灾难年中，非正常死亡人数可能高达4060万”。
        金教授发现的这些被隐瞒的死亡人数是从三个数的平均值得出来的。这三个数是: “1324万、1214万、1295万。三数平均为1278万”。第一个数是以1961年底公布人口数为基数，按照公布的人口增长率算出1964年底应有人口数，再减去1964年底实际人口数得到的。第二个数是以1964年底实际人口数为基数，按照公布的人口增长率反推出1961年底应有人口数，再用 1961年底公布人口数与此数相减得到的。
        让我们先看看这前两个数之间的关系。假设1961年底人口数为A，1964年底人口数为B，其间人口总增长倍数为r。显然，前述第一个数的表达式是 rA－B; 第二个数为A－B/r，二者相差r倍。1962-1964这三年人口增长率为26.99‰、33.33‰和27.64‰，所以，r＝ 1.02699′1.03333′1.02764 ＝ 1.09055。因此，毫不奇怪，1214万′1.09055 ＝ 1324万。可见，这两个数是一枚硬币的两面，不是互相独立的计算结果，完全没有理由加在一起算平均值。第一个数1324万的含义是，假如1214万人在 1961年没死，按增长率计算到1964年底的应有人数。这个数怎么能当成饥荒期间死亡人口跟1214万一起平均呢？
        金教授第二个数1214万的根据是，他认为《年鉴》公布的1961－1963年底人口数均不可信，但1962-1964这三年的人口增长率是可信的，因为他“猜测，统计人员不是出于‘疏忽’，而是出于职业道德和良知，在公布的数据中保留下了这一组相对真实的历史资料”。让我们“姑且相信”金教授的猜测，接受1214万。
        现在来欣赏一下金教授的第三个数字1295万。这个数字是金教授“以1959年底的公布总人口为基数，按1960年、1961年的公布增长率计算，得到的结果就比1961年的公布总人口多1295万人”。请读者注意，这里金教授得到的结果比“公布总人口多1295万”，也就是说，《年鉴》公布的官方数据低估了人口数，把1961年底仍然活着的1295万人漏掉了。这个结论与前面1214万的意义正好相反，显示非正常死亡人数有可能被高估了1295万。
        遵循金教授平均值算法，略去那被错加的1324万，我们可以算出1961年底实际人口比《年鉴》公布值低多少，结果为（1214万－1295 万）/2＝－40万。也就是说，《年鉴》把1961年底的人口数低估了40万，依此而得到的非正常死亡人数被高估了40万。调整后的非正常死亡人数应为 2791万－40万＝2751万。
        莫名其妙的是，金教授却将这1295万当成跟1214万互为印证的同类，加在一起算平均值。一个一千多万的负数，只要绝对值近似，就被金教授看成是跟一个一千多万的正数代表着相同的含义，并且认定这些数字“指向同一个数值，它们显然不是什么‘误差’了，而分明是假中含真、由假寻真的路标”。金教授所以能得到1278万的平均值，靠的就是这种把负数当正数、减法变加法的“逆向的演算”。
        我们跟着金教授，“通过这些虚假数据搭起的桥”，寻找到的这些“原始的真实”，用金教授的话说，“更让人百思不得其解”，“除非谁能对这些‘一蹋糊涂’ 的数字另外做出令人满意的解释”。正如他所说：“如此巨大的误差当作何解释呢？笔者不相信这是统计中的疏忽，也不相信这是一种偶然的误差”。的确，金教授的误差用基本概念的“一蹋糊涂”都难以解释。我们不得不怀疑，也许他提供的是“经过精心设计的真假相间虚实结合的信息”，遗憾的是我们不会“反复正向和逆向的演算”，所以迄今“尚未能精确地完全破译它”。
        总之，经过对三个研究结果的分析，我们看到三千万或更高的非正常死亡估计数，没有一个站得住脚。下面让我们看看超过二千万的估计数是否靠得住。
        ２。低于三千万死亡数的结果分析：
        除以上三项研究外，《大饥荒档案》收录的其他四项研究结果都得出低于三千万的非正常死亡估计数，其中有：国家统计局局长李成瑞（1997）、西安交通大学教授蒋正华和李楠 (1986)、复旦大学教授彭西哲(1987) 和中山大学教授李若建 (1998)。下面，我们简单介绍一下这些研究成果。
        （一）李成瑞老先生的文章首先质疑美国人口学会主席Coale 教授(1984) 所估计的2680万非正常死亡数。Coale 教授的估计也是利用1982年的生育调查，对《年鉴》公布的死亡率进行调整后得到的。李老先生指出：“(1)按科尔书中给出的户口登记1957年死亡人数 590万，死亡率为10.80‰倒推，这一年的平均人口为54630万人；(2)按科尔书中给出的他所估计的1957年死亡人数1040万，死亡率 19.0‰倒推，这一年的平均人口为54737万人。这样倒推出来的两个1957年人口数比1953年全国人口普查的58260万人(这个数字是科尔所肯定的) 还少3500至3600万人；而且把1957年与1958年的65，324万相比，一年内猛增1亿多人，这些都是难以设想的。因此，笔者认为科尔书中给出的1957年两个死亡人数与相关数字间存在着令人难以理解的矛盾，至少在科尔作以新的解释前是这样的。”
        李老先生对Coale教授的算法做了必要的修正以消除以上矛盾之后，得到的非正常死亡估计数为2158万。但这未必表明他本人完全赞同这个数字。事实上，他比较认同蒋正华和李楠教授的估计结果。
        （二）蒋正华和李楠教授估计1959-1961年非正常死亡人数为1858万。这是对其原来1697万的估计数作了修正以后得到的。他们对《年鉴》公布的人口数、出生率和死亡率都作了重新估计，减少了三者之间的矛盾，但仍不能完全吻合。他们的结果是在《大饥荒档案》上列出的唯一低于二千万的估计数。　
        （三）复旦大学彭西哲教授估计1958-1962五年的非正常死亡人数为二千三百万。他首先分析人口变化资料较全的十四个省份，其中包括四川、河南、山东、湖南和贵州等死亡率较高的地区。由此他估算出的非正常死亡人数为1420万。然后，他在此基础上假设饥荒期间官方的死亡漏报率比饥荒前高10%，又进一步假设占全国人口40%的其他省份的非正常死亡率与这十四省类同，这样得到二千三百万的非正常死亡数(649页)。他没有说明这些假设的根据是什么。这两个假设，尤其第二个明显有待商榷。如果对其做些修改，譬如，假设其他省份的非正常死亡率只是这十四省的一半，彭教授的估计值则与蒋正华和李楠教授很接近。
        （四）中山大学李若建教授对1958-1961四年非正常死亡的估计数在1530万～2470万人之间。这个结果其实没有多少独立研究的学术内容。其下限依据《年鉴》公布的死亡率，上限采纳了Banister博士的死亡率。上限比Banister博士的估计数少了530万，主要原因是后者的正常死亡率是从1957年的18‰向1962年的14‰线性递减的，而李教授采用1957年的18‰为正常死亡率。Banister博士死亡率估计的随意性与自相矛盾，我们已经在前面作了说明。所以，李教授的2470万估计数也不可靠。他的下限估计1530万比蒋正华和李楠教授还低330万，因为他用的是没经过修正的公布死亡率。由此推导出来的出生率与《年鉴》公布的出生率矛盾很大。他没有解释为什么片面相信公布的死亡率，却忽略出生率。这样任意取舍的算法也有问题。
        通过对《大饥荒档案》收录的全部七项研究论文的讨论，可以看出，二千万以上的非正常死亡估计数也没有一个是完全可靠的。因此，根据现有的数据和分析结果，三年饥荒非正常死亡人数的可靠估计很难超过二千万。
        ３。几项补充说明：
        本文的目的不是为饥荒造成的非正常死亡人数提供答案。然而，为使读者对此有更多的了解，我们有必要针对几个相关问题做些说明解释。
        （一）政府是否隐瞒真相：西方媒体和华人精英阶层中，不少人怀疑中国政府的人口普查资料隐瞒真相，压低了死亡人数。这种怀疑的主要依据有两点：一是《年鉴》公布的1960年中国总人口净减整整一千万，有人怀疑真实数字高于此数，但在政治干预下只能报一千万；二是《年鉴》公布的总人口数与人口增长率不相符，有人怀疑也是政治干预的结果。
        就以上两个问题，笔者于2006年初拜访了负责1982年中国人口普查和出版1983年《中国统计年鉴》的前国家统计局局长李成瑞。对第一个整数一千万的问题，李老先生明确地说，那是一个巧合，在万位数以下是有零头的，但被略掉了，绝对没有任何政治干预。对第二个总人数与增长率矛盾的问题，李老先生解释说，这是当时按照两种不同渠道得到的实际结果，确实表明数据不准确，但又无法确定哪个数字更准确，所以决定如实发表，同样没有受到任何政治干预。从笔者个人与李老先生交谈所得的印象来判断，他的这些话是完全可信的。当然，笔者的判断不足以作为证据。希望有热心人继续探讨，找出当年数据收集和处理的原始资料，给历史一个完满的交代。
        除此之外，外界普遍存在的疑问是，中国政府是否掌握公开资料以外有关饥荒死亡人数的重要信息。比如，有人说刘少奇曾讲过三千万的饿死人数，杨尚昆认可过四川省至少一千万的饿死人数。我向李老先生提出这个问题，他回答说，当时不可能有这样的准确数字。饥荒期间，他是李先念副总理的秘书，住在中南海，邻居中有毛泽东身边的工作人员。那时中央很想知道各地的灾情，但得不到详细材料。统计局在大跃进时被撤销。即使当时有些估计数，也只能是猜测。除了已经公开发表的资料之外，他没听说其他权威性的统计资料。他问：如果有，是怎么来的？如果这么容易就能得到这些数据，还要我们统计局干吗？
        （二）1982年生育率调查：从以上讨论我们看到，在接近或超过三千万非正常死亡的估计结果中，有三个出自美国专家（金辉教授不在此列），即 Ashton等四位人口学家，Banister博士和李成瑞老先生文中提到的Coale教授。他们的估计结果都导致明显的自相矛盾或者与实际情况相差太远。这里是否存在某种共同的原因呢？这三项研究的共同点是，根据1982年生育率抽样调查的结果，得出高于《中国统计年鉴》公布的出生率。在确认1964 年普查人口数量的前提下，在此之前出生人数越多，则死亡人口也越多。只要这些多出来的死亡人口不是平均分配到各个年份，必然提高饥荒期间的非正常死亡人数。
        如果1982年生育率调查准确，这些专家按以上思路所做的研究出错的可能性应当较小。反过来说，他们的不合理结果，可能是1982年生育率调查不准确造成的。与人口普查不同，1982年生育率调查不是由国家统计局，而是由计划生育委员会主持的。调查所覆盖的千分之一人口大约一百万，调查对象是30万左右 15-67岁的女性，平均每个年龄组只有六千人，分到每个省平均二百人。抽样调查是以生产大队和街道为单位进行的，比个人抽样的随机性小得多。尤其重要的是，这次调查的目的是为以一胎化为中心的人口控制措施提供依据。而计划生育委员会本身又是人口政策的执行者，主观上有为强调控制人口的紧迫性而偏高估计生育率的可能。这种误差的产生，只要在抽样选择调查单位时，有很小一点倾向性就足够了。四分之一世纪之后的今天，计划生育委员会所估计的出生率仍然高于其他人口专家和研究单位的结果，而且差距如此显著，甚至到了无法自圆其说的地步。1982年的抽样调查夸大生育率是很有可能的。
        基于中国庞大的人口基数，只要1982年生育率调查得出的结果稍微偏高一点，由此产生的多余出生人口就不是小数。这些幽灵人口必须“死”于1964年以前，经专家们的推理演算，大部都变成了非正常死亡。但这些错误假设下的演算跟现实对不上号，所以就出现了我们前面提到的各位美国专家所得到的荒谬结果。
        （三）正常死亡率：以上所讨论的研究选取的正常死亡率，大都假设为从1957年的水平向1962年线性递减，或按与此原则类似的方法计算。许多人认为，既然1950－1957年的死亡率逐年下降，饥荒期的正常死亡率也应继续下降。所以，按此原则算出的非正常死亡人数，乃是最低估计。这个结论是不对的。
        第一，饥荒后的1962年，老弱病残者已大部死去，人口结构相对年轻。即使各个年龄组的死亡率与1957年相同，总死亡率也会较低。因而以该年死亡率为正常标准可能高估非正常死亡数。
        第二，由于1950－1957年死亡率逐年下降，人口平均年龄提高，老年人增多。即使其后几年各年龄组死亡率不变，总死亡率也可能上升。死亡率下降越多越快，反弹也会越明显。这种死亡率正常反弹现象就出现于80年代初。1965－1979年死亡率几乎年年下降，而1979－1983年却连续四年上升。 1965－1979年死亡率由9.50‰降到6.21‰，年平均0.24‰。1979－1983年死亡率由6.21‰回升到7.08‰,每年平均上升 0.22‰，几乎与下降速度相同。这显然与饥荒等灾害无关。更没有人会认为“联产承包”等政策造成几百万人饿死。
        相比之下，1950－1957年死亡率下降更多更快，由18.0‰降到10.8‰，七年下降7.2‰，平均每年1.03‰。如果1957年以后四年死亡率也象1979年后那样出现与下降速度几乎相等的反弹，则应每年上升大约0.9‰。由此算出的1959-1961三年非正常死亡数，与按照从 1957年向1962年线性递减的正常死亡率得出的结果相比,差别超过五百万。所以，从后者得到的估计值，并不是最保守的。
        （四）失踪的证据：最后，我们离开统计数据，从另一个角度来考虑死亡人数问题。凡是比较准确的死亡估计数，不仅应与统计数据和分析结果相吻合，而且应能经受人证物证的检验。非正常死亡三千万的说法，不但缺乏学术研究的支持，而且跟人们的现实生活经验有很大的矛盾。
        饥荒期间大量饿死人的现象主要发生在四川、河南、山东、湖南、安徽、贵州等地。如果二、三千万死亡人数在这些地区平均分布（基本上不可能），几乎每人都应有亲朋邻友遇难。如果是不平均分布，应有许多村、乡（公社）、县死亡过半，甚至十室九空。这些灾区应当留下大量集中掩埋的尸骨，大片抛荒的土地和无人村落，或有大批移民来填补。另外，普遍死亡应导致大量孤儿和鳏夫寡妇，导致广泛的家庭重新组合现象。这些证据几十年后都不会消失，而且应该不难找到。
        饥荒结束不到五年文化大革命就开始了。大串联期间，河南、山东、四川、安徽、湖南几乎每个公社都有不少年轻人走向全国。当时信息交流基本上不受限制。受灾地区各级干部被打倒的不少，“三年困难时期不管人民死活”常常被作为他们的罪行。可即使在捕风捉影的揭发材料里也难找到与“饿死三千万”之说相符的证据。改革开放以来，诉大跃进之苦更成了政治时髦。连官方媒体上对饥荒的惨痛描写也已汗牛充栋。但涉及大范围饿死人的事件，除河南信阳外，大都语焉不详。甚至就连信阳地区，也未发现媒体宣传的饿死一百多万的充足证据。在互联网如此发达的今日，全国范围内此类证据的数量实在难与“饿死三千万”的结论相符。古今中外恐怕还没发生过毁尸灭迹如此彻底的饥荒。
        毋庸置疑，每一位受饥荒影响而死亡的同胞，都是中华民族的不幸，都值得我们这些幸运者深切的同情和哀悼。但我们在同情和哀悼的同时，也应当避免中国文人根深蒂固的那种人云亦云、跟风造势、甚至弄虚作假的风气。少点这种风气，近半个世纪前那场惨痛的民族灾难就不会发生了。
        2007-08-01
        参考文献：
        李成瑞:“大跃进”引起的人口变动，《中共党史研究》1997年第二期
        李若建:大跃进后人口损失的若干问题，《中国人口科学》1998年第４期
        金辉:“三年自然灾害”备忘录, 《社会》1993年第四、五合期
        蒋正华、李楠：中国出生率与死亡率的校正，《西安交通大学学报》1986年第3期
        彭西哲：Demographic Consequences of the Great Leapforward in China’s Provinces,vol. 13, 1987
        Judith Banister: China's Changing Population,Stanford University Press, 1987, Stanford, California
        Ashton, B.,K. Hill, A. Piazza and R. Zaitz: Famine in China, 1958-61, Population and Development Review, vol. 10, 1984
        通宝推：谷品三斋,
        
        本帖一共被 1 帖引用 (帖内工具实现)
        直观通俗的理解
    - 复我来说说杨继绳数字的推导
      家园 酱油不好打啊.
      建议找原书章节看, 才能打到真正的酱油.
      二次开发的,加点醋进去不容易看出来.
    - 复我来说说杨继绳数字的推导
      家园 好文果然有宝～～
      恭喜：你意外获得【通宝】一枚
      鲜花已经成功送出，可通过工具取消
      提示：此次送花为此次送花为【有效送花赞扬，涨乐善、声望】。
    - 复我来说说杨继绳数字的推导
      家园 只能说兄对这些不知德赛二先生为何物的文人耐心好
      还仔细看、认真驳，换了我直接无视，这些人既不能提供个人道德反省的镜鉴，又不能提供科学的思想和知识，认真对待他们的文字完全是浪费生命。
      咱家没什么文化，不过知道一句话“士之无耻，是为国耻”。曲学阿世是可耻的。
      - 复只能说兄对这些不知德赛二先生为何物的文人耐心好
        家园 现在只有对所有炎黄春秋的人的文章全部无视了
        虽然我不喜欢因人废言
    - 复我来说说杨继绳数字的推导
      家园 再补充两句，酱油党看起来好骗
      其实个个主意正着呢，谁说什么都不信。你想，连共产党都不好意思跟酱油党再提“誓将红旗插遍全球”，改“和谐社会”了（这还是共产党吗？）。文人想拿着几篇不着调的小破文章煽动俺们的仇恨情绪、让俺们跟着闹革命，别费心了，洗洗睡吧，等酱油党日子过不下去了再说吧（就如同当年酱油党跟着中共一样）。
    - 复我来说说杨继绳数字的推导
      家园 两个问题
      我无意为杨的文章辩驳, 无意为三千万的数字辩驳. 不过, 我觉得你在这一系列驳斥文章中, 有一些误区 --
      第一, 统计局的人口数据问题.
      在统计局的数据中, 59-62年的人口数和出生率是对不上的, 我在回复隔路山贼文章的时候, 已经指出统计局的人口数据本身就对不上, 或者死亡率被低估, 或者出生率被高估. 这在非正常死亡人口的研究当中是常识, 几乎每篇研究或后人写的综述都提到了这一点. 你还回复了我这一帖. 不知为何被你此处忽视了?
      请注意, 统计局的原始数据只此一家, 别无分号. 除非抛开他家的数据不理, 否则无法避开这个问题. 有些数据表面上挺好, 例如积吉:技术上是不可能产生误差的，是人为的误差引用了一个看上去饥荒中每年都有人口增长的数据来源 http://www.lookinto.cn/theory/1501/, 其实只是在此基础上的一个人为修正而已: 请看这张表后面长长的注释, 饥荒年间处理情况几乎每年都不一样. 其中第8条, 说61年数据直接由公布的60年人口总数乘以公布的增长率 . 所以, 如何处理这个数据悖论, 可能是产生了众多研究, 大家八仙过海各显神通的重要原因之一.
      另外关于 82年, 90年, 00年的人口普查数据互相对不上这一点, 你在秋末冬初:我的补充：三次人口统计的一个有趣的对比提到了一句"近乎几何般的美感", 暗示政府有根据政治需要修改数据. 据我的猜测, 你指的是82年和90年的对比, 82年有人为的高估死亡率等"作弊因素.
      可是蒋正华, 这个1700万所谓官方数字的提供者, 认为82年的数据更加精确可靠. 在杨给他写去质疑数字过低的信后, 他回信指出
      我们根据1982年人口普查获得了很好的数据，在第四、五两次人口普查后，我们都做过数据分析，发现这两次普查数据质量都不及三普，因此我认为可利用的详尽的死亡率分年龄资料仍以这次最可靠。我们利用1982年数据构建了年龄别的生命表，并利用优化拟合的回推技术，再现了历史上各年的生命表，据此计算1957年到1965年的死亡率与非正常死亡率之差，从方法学而言比外国学者更加严密，我们的优势是成瑞同志大力支持，提供了三普的微观个人数据。
      由于这一点不涉及杨对蒋的质疑, 可称得上是随口说出. 蒋 + 李, 我认为至少比你的猜测更可靠.
      第二. 对其他结论是否采信的问题
      你在这方面的态度有两种, 一是过分复杂化, 例如秋末冬初:为了进一步精准为见, 也不光是你, 例如雪里蕻:这些事情要搅和起来就细了.
      对此, 我想说, 能做得精细当然很好, 但除非你自己做出一个正面榜样, 或者简单一点, 用初步的计算和推理指出忽略某些因素, 将导致已有估计的严重系统性偏差, 而且还是朝着不利于他们结论的方向, 否则这些结果不能被轻易推翻. 我想这是社会科学里数量研究的惯例, 也符合常理, 因为涉及到全社会的统计计算问题, 在细节上, 例如自变量的添加, 例如计量方法的改进, 往往是无止境的. 但粗略的看误差可能正负相抵, 因此这种改进很多时候都不能推翻以前的结论, 只是程度上略有差别而已. 所以, 我不认为你这种挑剔的看法能构成一个有力质疑.
      你这篇文章又滑入另一个极端: 过分轻视研究者的功力. 其实上面统计局数据的问题就是一例. 在这里, 你又说
      *注：而且在饥荒之后，生育意愿和生育能力的恢复，都被赤裸裸地无视了。而在这些作者以插值法为基础的算法中，反倒成为了死亡人数正向增加的基础。所以说，“如果用精确的数学工具来处理这些数据显得滑稽”，大家还混什么混啊。
      其中的粗体, 未免有些把人看扁了. 提醒你仔细阅读自己所引用的杨文. 他提及的所有研究成果, 都注意到了死亡率和出生率是两个概念, 几乎都是分别估计正常数值和饥荒年间数值, 然后分别得出少生育人口和非正常死亡人口. 他们并没有混为一谈. 另外, 有的研究如王维志, 的确是用出生人口(和自然增长人口)来推死亡人口. 但杨解释说饥荒年间的出生人口相对不易低估, 因为不上报就没有供给指标; 而死亡人口则可能低估. 无论这个理由最终是否站得住脚, 也是一种说法, 并非没注意到逻辑自洽性, 你总不能视而不见吧?
      再给你看另外一篇此类研究综述, 以证明这个非常基本的问题一般没有被当时的研究者, 和后来的引用者被忽视 -- 中国大饥荒时期「非正常人口死亡」研究之综述与解读.
      最后再次声明, 我不同意杨的结论和很多分析, 更不赞成他的立场. 但杨也不是臭狗屎, 人人踩上一脚. 这样降低的就不一定只是他的公信力了. 只是, 平心而论秋末的这一系列文章思路清晰, 富有理性, 并非是很过分的攻讦之词, 我回你的帖子, 其实还是相信这里能看到更好的讨论.
      - 复两个问题
        家园 我的一些回答
        首先多谢你和我的探讨。
        其次，我想，你几个问题的产生，可能一部分原因是对我的帖子的用意过于高估了。
        我写这一个帖子，依然不是想直接寻求“这个数字”到底是多少的答案。正如我说，我认为在目前的“人口数据”基础上，无法作答。而这一个帖子的目的在于“杨继绳的数据是如何产生的”。
        如果你仔细读过了杨文，你就会发现，杨自己也有根据国家统计数据做了计算，也有根据各省统计数据做了计算——而且所有的计算的数值都在2000万的档，没有到达3000万。
        但杨没有采用自己的计算。同样，从蒋正华的1700万，到三个国外学者的2000多万，到几个国内学者的3000多万，他都没有采用。用学术研究的角度来说，杨的确列举了一堆文献，他指出了问题*，但他并没有给出明确的解释(只提供了牵强的理由，而且理由基本上都是因为学者“采用了官方的数字”而没有做调整----见王维志的做法)，对于同一个题目，为何他没有采信其中任何一个学者的数据的原因（除了他提出蒋正华的数据对不上并做了简单计算之外）。
        跟对前面这些给出低于3500万的学者的“沉默无视”不同的是，他跳过了对这些学者数据的评述，直接采信了王维志的3500万数据，也就是他所能获得的数据中最高的。而王的数据，当然你可以说他是自洽的。但他的自洽基于自己对几组矛盾的数据的极富个人特色的判断的基础上。即他的计算的可靠性，在很大程度上基于他个人的判断。
        但杨继绳无视前面所有低于3500万的数据，直接采用王的数据。即他既没有交代前面的学者的数据为何他不采信，也不交代为什么王的数据更可靠--而且王的数据很大程度上还得依靠个人判断的调整--除了相当于说“王是专家更可靠”之外，他只是采信之。这个逻辑对于我来说，就是无视所有没有到达最大的数据，而直接抓取了最大的数据。
        并且杨还要根据自己的个人判断，加上了58和62两年的数据。
        我的这个帖子，就是想给读者展示杨继绳作为当今某派的头牌，他的论断所立足的研究基础是怎样的。我们需要怎样才能成为“有良心的学者”，就好比丁学良在这个基础上依然可以称杨继绳做了细致的数据比对，基本功很扎实等等。
        起码从严肃的研究的角度来说，杨一点都不愚蠢，而且很有可能别有用心——针对于百丈村长为杨的辩解。
        
        这便是我帖子的立意。
        至于你在这提到的问题，有很多都是直接相关于我对这个数字本身的看法。我说了，我的确没有直接的把握。而且我也并不想直接把自己陷到这个数字里去，所以无论蒋正华也罢，王维志也罢，我都无意直接去剖析他们的数据分析过程。因为正如你所说“但除非你自己做出一个正面榜样”，而根据现今我们拥有的数据基础，我认为我们做不到拨云见日这一点。但质疑是永远有益的。
        而且我的判断有我自己的逻辑——虽然在一系列的帖子里，我都不想自己直接把它说出来（所以我感谢积臣）。
        如果实在要讨论，我愿意划分为两部分，说说我的观点。
        首先，跟你在这个帖子所提到的不同，我是连蒋正华的论断都不信任的。这种不信任，是跟我对1982年的时代背景以及它的统计数据的不信任在逻辑上紧密联系的。秋末冬初:我的补充：三次人口统计的一个有趣的对比。不仅仅1990年人口统计的数据跟1982年的人口普查相比较，它的意外之处有“几何的美感”。1959-1962年的数据有“意外增加之人”，而且与之相较，1956-1958倒是在正常减少。然而即便是2000年的人口普查，它1960-1962年的数据相较1982年，依然有“意外增加之人”，甚至相对于1990年仍然还有“意外增加之人”（如果我们将1961年数据加入死亡率考察，我没有做这一步）。而且1958年又突然少了很多的人口。
        我不相信这个数据基础，正如我不相信这个交织延续至今的时代政治、官僚系统的本质。秋末冬初:这就是我在我那个帖子里所强调的秋末冬初:关键是如何理解历史本身
        但蒋正华其实也许有意无意中给出了一些细微的线索，正如你也注意到的，他做了一些个人的调整，而且他在回信中也没有告诉杨继绳，为什么要做这个调整。但他说了——“我们的优势是成瑞同志大力支持，提供了三普的微观个人数据”。
        重点在于，他这个研究是在1984-1986年间做出的。所以我对它的信任感以及对政治背景的判断，是跟秋末冬初:我的补充：三次人口统计的一个有趣的对比一致的。我并不想把这话直接说出来，现在也不想。
        “我们的优势是成瑞同志大力支持，提供了三普的微观个人数据”
        那么，第二部分。以王维志的研究为例。他同样也发现了各组官方数据之间的矛盾之处（所有的相关人都发现了），除了他基于个人的判断，实质上低估了死亡率（以58年的为基准）等一系列个人因素的“调整”我不赞同之外，我最大的不赞同，是他们站在对官方数据的怀疑的起点，所做的调整（包括丁、金等人的研究），全部都是基于认为官方数据在极力“抹平”数据这一逻辑基础上。
        他们也许有道理，也许是真傻，也许是装傻，我不知道。
        但正如我所讲的，相比1982年数据，1990年数据和2000年数据的趋势构成了我对“数据事件”（而不是饥荒事件）的基本判断。这个判断是很有可能成立的，因为距离当事的时间和当事之人已经越来越远。也正如我所说“很有可能我们下一次人口统计，即便59-61年出生的人口数量不再如同前两次人口普查一样天上掉人口越死越多，但如果这个规律管用，那依然很有可能我们会发现59-61年出生的人口死亡率竟然要比前面后面出生年份的都要低”。
        那么，他们是有道理，还是真傻，或者装傻呢？各人或许都有自己的判断。但杨继绳的“论证”又给了我们怎样的判断呢？
        此外，尽管你不赞同。但我依然认为，不断提出“复杂化”的方法依然是有意义的。尽管正如我所说，我认为在现在的数据基础上，我们无法还原“事件”，但进一步复杂精确的方法依然能够让我们起码在逻辑上产生进一步逼近“事件”的必要条件；同时也能加强我们对现有解释的判断的“质”的基础。而我想说的是，现在正是因为相关人士的研究的“复杂”少了，而不是“复杂”多了。
        *这个问题在这套基于“人口统计”的数据的方法中是本质存在的，因为根源上，数据就对不上——正如你说的。
        另：对于“生育意愿和生育能力的恢复，都被赤裸裸地无视了”的一段，我是说，对于灾荒年月的生育率和死亡率，都在很大程度上依靠前后年份的插值计算，因为官方数据出现了矛盾。当然，你可以说，他们加上了自己对灾荒年月的判断的调整。但我的意思是，由于同一人群生育意愿和生育能力在时间序列上的平移，使得这个插值法的本身存在问题，尤其是对之后年份的插值方法应用。
        复我的一些回答
        家园回复
        只要你也开始试着了解情况, 估计数字, 而不是当一个消费新闻的看客, 就会多少理解这些研究者的做法. 好比实际中的数据往往不是正态分布的, 那么OLS就不用了? 恰恰相反, OLS 仍然是使用最多的方法. 抱着这种立场, 你的那些质疑很多都不成立. 当然, 你如果作为消费新闻的读者, 我完全尊重这样的想法. 杨如果是文宣, 而你只是在反击文宣, 那也挺好.
        别的就不多说了, 你的文章写得很好, 花一朵.
        复回复
        家园 正是因为原始数据存在问题，所以才不能搞放卫星
        只要你也开始试着了解情况, 估计数字, 而不是当一个消费新闻的看客, 就会多少理解这些研究者的做法. 好比实际中的数据往往不是正态分布的, 那么OLS就不用了? 恰恰相反, OLS 仍然是使用最多的方法. 抱着这种立场, 你的那些质疑很多都不成立. 当然, 你如果作为消费新闻的读者, 我完全尊重这样的想法. 杨如果是文宣, 而你只是在反击文宣, 那也挺好.
        这些研究者如何处理数据自然有他的道理，不管是正理还是歪理，问题是现在的“真相”与“良心”已经把三年期间的饿死人口变成了“放卫星”“大跃进”，只许往上长，不能往下降，不然就是“否认三年饿死人”“发这样的贴对得起良心吗”“无耻的五毛”“你全家饥荒时统统饿死，你也会替TG歌功颂德”。于是乎，饿死人数越涨越高，而可信的论证却越来越少。
        我们不能因为当年的“大跃进”造成了惨剧，就可以在今天用另一个“大跃进”来制造新的谎言。这不是反思，这些疯狂上涨的“饿死真相”不过是为“吹牛受宠，真话挨批”继续地助纣为虐，
        这些高举“良心”的旗手，不过是当年“亩产万斤”的孝子贤孙。
        复正是因为原始数据存在问题，所以才不能搞放卫星
        家园 西河既不是所谓的良心当道, 也没有五毛横行
        你的担心似乎有些多余.
        至于整个网络的其他地方, 我不是很在意, 我们自家人说自家话就是了.
        统计局的数据问题是研究的难度基础, 却不是终结. 否则很多中国问题都不要搞了.
        这些研究者如何处理数据自然有他的道理，不管是正理还是歪理
        说是歪理牵强了, 只是基于不同的假设, 富有争议而已.
        问题是现在的“真相”与“良心”已经把三年期间的饿死人口变成了“放卫星”“大跃进”，只许往上长，不能往下降，不然就是“否认三年饿死人”“发这样的贴对得起良心吗”“无耻的五毛”“你全家饥荒时统统饿死，你也会替TG歌功颂德”
        这些辩论当中的激愤之语, 理他作甚? 这里有谁这么说了?
        于是乎，饿死人数越涨越高，而可信的论证却越来越少。
        你们在河里开玩笑可以这么说, 但在实际文献中, 这个趋势好像不存在. 不同的数字, 必然有从大到小的排列.
        少出生人口也算进来的确荒谬, 你把它搁在一边就是了, 所有的研究者都同时提供了分开算的数字.
        我们不能因为当年的“大跃进”造成了惨剧，就可以在今天用另一个“大跃进”来制造新的谎言。这不是反思，这些疯狂上涨的“饿死真相”不过是为“吹牛受宠，真话挨批”继续地助纣为虐，
        这些高举“良心”的旗手，不过是当年“亩产万斤”的孝子贤孙。
        你看到了雪里蕻说ZY真人始作俑者, 就为亩产万斤这件事情完全找到了替罪羊, 恰好所有的数字制造者, 这些说谎专家, 还都和他们是一帮的, 呵呵. 我想说, 河里灌水可不是了解真相之旅啊.

分页树展主题 · 全看首页上页下页末页

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明