西西河

主题:浅层搜索与深层搜索:一个反教化的实例 -- 秋末冬初

共:💬69 🌺248 新:
全看分页树展 · 主题 跟帖
家园 我的一些回答

首先多谢你和我的探讨。

其次,我想,你几个问题的产生,可能一部分原因是对我的帖子的用意过于高估了。

我写这一个帖子,依然不是想直接寻求“这个数字”到底是多少的答案。正如我说,我认为在目前的“人口数据”基础上,无法作答。而这一个帖子的目的在于“杨继绳的数据是如何产生的”。

如果你仔细读过了杨文,你就会发现,杨自己也有根据国家统计数据做了计算,也有根据各省统计数据做了计算——而且所有的计算的数值都在2000万的档,没有到达3000万。

但杨没有采用自己的计算。同样,从蒋正华的1700万,到三个国外学者的2000多万,到几个国内学者的3000多万,他都没有采用。用学术研究的角度来说,杨的确列举了一堆文献,他指出了问题*,但他并没有给出明确的解释(只提供了牵强的理由,而且理由基本上都是因为学者“采用了官方的数字”而没有做调整----见王维志的做法),对于同一个题目,为何他没有采信其中任何一个学者的数据的原因(除了他提出蒋正华的数据对不上并做了简单计算之外)。

跟对前面这些给出低于3500万的学者的“沉默无视”不同的是,他跳过了对这些学者数据的评述,直接采信了王维志的3500万数据,也就是他所能获得的数据中最高的。而王的数据,当然你可以说他是自洽的。但他的自洽基于自己对几组矛盾的数据的极富个人特色的判断的基础上。即他的计算的可靠性,在很大程度上基于他个人的判断。

但杨继绳无视前面所有低于3500万的数据,直接采用王的数据。即他既没有交代前面的学者的数据为何他不采信,也不交代为什么王的数据更可靠--而且王的数据很大程度上还得依靠个人判断的调整--除了相当于说“王是专家更可靠”之外,他只是采信之。这个逻辑对于我来说,就是无视所有没有到达最大的数据,而直接抓取了最大的数据。

并且杨还要根据自己的个人判断,加上了58和62两年的数据。

我的这个帖子,就是想给读者展示杨继绳作为当今某派的头牌,他的论断所立足的研究基础是怎样的。我们需要怎样才能成为“有良心的学者”,就好比丁学良在这个基础上依然可以称杨继绳做了细致的数据比对,基本功很扎实等等。

起码从严肃的研究的角度来说,杨一点都不愚蠢,而且很有可能别有用心——针对于百丈村长为杨的辩解。

这便是我帖子的立意。

至于你在这提到的问题,有很多都是直接相关于我对这个数字本身的看法。我说了,我的确没有直接的把握。而且我也并不想直接把自己陷到这个数字里去,所以无论蒋正华也罢,王维志也罢,我都无意直接去剖析他们的数据分析过程。因为正如你所说“但除非你自己做出一个正面榜样”,而根据现今我们拥有的数据基础,我认为我们做不到拨云见日这一点。但质疑是永远有益的。

而且我的判断有我自己的逻辑——虽然在一系列的帖子里,我都不想自己直接把它说出来(所以我感谢积臣)。

如果实在要讨论,我愿意划分为两部分,说说我的观点。

首先,跟你在这个帖子所提到的不同,我是连蒋正华的论断都不信任的。这种不信任,是跟我对1982年的时代背景以及它的统计数据的不信任在逻辑上紧密联系的。秋末冬初:我的补充:三次人口统计的一个有趣的对比。不仅仅1990年人口统计的数据跟1982年的人口普查相比较,它的意外之处有“几何的美感”。1959-1962年的数据有“意外增加之人”,而且与之相较,1956-1958倒是在正常减少。然而即便是2000年的人口普查,它1960-1962年的数据相较1982年,依然有“意外增加之人”,甚至相对于1990年仍然还有“意外增加之人”(如果我们将1961年数据加入死亡率考察,我没有做这一步)。而且1958年又突然少了很多的人口。

我不相信这个数据基础,正如我不相信这个交织延续至今的时代政治、官僚系统的本质。秋末冬初:这就是我在我那个帖子里所强调的秋末冬初:关键是如何理解历史本身

但蒋正华其实也许有意无意中给出了一些细微的线索,正如你也注意到的,他做了一些个人的调整,而且他在回信中也没有告诉杨继绳,为什么要做这个调整。但他说了——“我们的优势是成瑞同志大力支持,提供了三普的微观个人数据”。

重点在于,他这个研究是在1984-1986年间做出的。所以我对它的信任感以及对政治背景的判断,是跟秋末冬初:我的补充:三次人口统计的一个有趣的对比一致的。我并不想把这话直接说出来,现在也不想。

“我们的优势是成瑞同志大力支持,提供了三普的微观个人数据”

那么,第二部分。以王维志的研究为例。他同样也发现了各组官方数据之间的矛盾之处(所有的相关人都发现了),除了他基于个人的判断,实质上低估了死亡率(以58年的为基准)等一系列个人因素的“调整”我不赞同之外,我最大的不赞同,是他们站在对官方数据的怀疑的起点,所做的调整(包括丁、金等人的研究),全部都是基于认为官方数据在极力“抹平”数据这一逻辑基础上。

他们也许有道理,也许是真傻,也许是装傻,我不知道。

但正如我所讲的,相比1982年数据,1990年数据和2000年数据的趋势构成了我对“数据事件”(而不是饥荒事件)的基本判断。这个判断是很有可能成立的,因为距离当事的时间和当事之人已经越来越远。也正如我所说“很有可能我们下一次人口统计,即便59-61年出生的人口数量不再如同前两次人口普查一样天上掉人口越死越多,但如果这个规律管用,那依然很有可能我们会发现59-61年出生的人口死亡率竟然要比前面后面出生年份的都要低”。

那么,他们是有道理,还是真傻,或者装傻呢?各人或许都有自己的判断。但杨继绳的“论证”又给了我们怎样的判断呢?

此外,尽管你不赞同。但我依然认为,不断提出“复杂化”的方法依然是有意义的。尽管正如我所说,我认为在现在的数据基础上,我们无法还原“事件”,但进一步复杂精确的方法依然能够让我们起码在逻辑上产生进一步逼近“事件”的必要条件;同时也能加强我们对现有解释的判断的“质”的基础。而我想说的是,现在正是因为相关人士的研究的“复杂”少了,而不是“复杂”多了。

*这个问题在这套基于“人口统计”的数据的方法中是本质存在的,因为根源上,数据就对不上——正如你说的。

另:对于“生育意愿和生育能力的恢复,都被赤裸裸地无视了”的一段,我是说,对于灾荒年月的生育率和死亡率,都在很大程度上依靠前后年份的插值计算,因为官方数据出现了矛盾。当然,你可以说,他们加上了自己对灾荒年月的判断的调整。但我的意思是,由于同一人群生育意愿和生育能力在时间序列上的平移,使得这个插值法的本身存在问题,尤其是对之后年份的插值方法应用。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河