西西河

主题:【原创】直觉看,这不对啊。 -- spin

共:💬13 🌺51 新:
全看树展主题 · 分页首页 上页
/ 1
下页 末页
家园 【原创】直觉看,这不对啊。

最近在观网上闲逛,看到一篇汪涛关于计划生育数据的小文,观点暂且不论,这个数据处理方式的解释违反常识,本人也不是测量学的专家,所以发在河里,大家讨论活跃一下气氛。

我转载他写的一段我们分析一下。

“4.来自测量学的说明

我们来以最严格的测量学知识说明这个问题。最准确的总和生育率测量会是一个以数学期望为中心的高斯分布。这样,有50%的机率实际的数据小于这个数学期望值,也有50%的机率大于这个值。

如果我们是要设定一个安全的余量,肯定不能设在中心的数学期望值上,因为那样的话就有50%的机率超越这个限度,这还得了?

假设我们要设定一个安全限度,使得实际值有很大概率小于这个限度,应该怎么办?这就需要采用上规范限策略。例如,以高于数学期望6个西格玛(6倍的均方差)设定这个偏差,就可以使实际值超过限度的概率小于百万分之3.4。这就是说,如果总和生育率的数学期望是1.4(很可能来自人口普查,但并非绝对),均方差值为0.05,那安全限度就会在1.7左右。这样就会存在0.3的固定偏高的差值。伪人口学家们注意到了这个偏差,其实所有人都知道,只是一般人不知道这个偏差的真实含义到底是什么。

问题只在于:我们究竟需要设定上规范限还是下规范限,设定多少,3个西格玛还是6个西格玛?这不取决于人口数据的测量方法本身,而是取决于人口总量与资源量的关系。相对来说,最接近实际的是人口普查的数据。但这个数据已经有了,如果要以它们为依据进行预测的话,只需要在电脑中输入需要查询或预测的条件,然后按回车键或用鼠标点击一下——OK,所有数据全有了。这根本不需要人口学家再做什么,也根本不需要那些伪人口学家做什么。人口学家的职责甚至使命,就是要考虑如果存在各种人口普查时未考虑到的因素影响,或存在偶然变化因素刺激的话,“最坏情况下”总和生育率数据最大会达到多少。因为过去中国根据预测的人口总量与资源量之间的关系为依据,确定了以控制人口总量不能超限为目标,采用的就是上规范限的策略。因此,这不是中国人口学界想偏高,而是中国决策者赋予他们的工作使命,是他们的职责要求他们必须要在这个历史阶段这么做。”

我看作者也认为计划生育率是一个大量样本的平均值,那么它的方差就应该随样本数量的开方而减小,以10亿人的样本为例,方差西格玛在10的负4次方量级,那么所谓的6个西格玛也基本等于零,不会对平均生育率的数值有任何影响。这种例子非常多,平均工资,平均汽车保有量,这些数据只要样本足够大,根本就不需要考虑所谓的方差。如果宣称“均方差值为0.05”,那只是说明得出数据所依据的样本数量在400个左岩。还有6西格玛,对应的几率应该是1-erf(6),基本上这个值就是零,而不是他宣称的百万分之3。4,我不知道测量学上需要取这么大的安全限度么。

家园 前提就是错的,总和生育率并不符合高斯分布
家园 每个样本的分布可能确实不是高斯分布

每个样本的分布可能确实不是高斯分布,估计更接近于泊松分布。但对于很多样本的平均,上面我的讨论没有问题,毕竟超扩散等偏离0.5指数的情况不是那么容易出现的,这也是大数定理保证的。

家园 生育率不是随机量是离散量

现实中妇女的生育率肯定接近泊松分布,样本量再大也是泊松分布。人口统计不是测量学,而是统计学,不适合用测量学的数学模型。

家园 搞统计的名声就是被社会学这帮人给毁了的

可以直接说这哥们不懂统计思想.在他的所谓10亿人的独立样本的假设下,那么标准差是在万这个级别的.而对中国人口,万是几乎可以忽略不计的量.也就是说,根本不需要考虑安全限度这个抹布来擦屁股.

严格意义上讲,社会学(social science)不是科学.当然,在科学的治学态度下,社会学还是能产生合理结论的.但现在绝大多数社会学家,不管中国美国的,都只是混饭吃的.更恶劣的还有很多人是带着目的写文章.

家园 样本的泊松并不妨碍其平均值的方差随样本数量0。5次方递减

二阶距还是描述分布的胖瘦,只是不同于高斯分布,分布的具体形状还需要更高的阶距来准确描述而已,但当样本数量足够多,其平均值的分布总是趋向于delta函数。

这就是我印象中的常识,所以主贴里引用的那些煞有介事的说法看起来挑战常识啊。

家园 主贴你引用的那篇文章就是胡说八道

假设样本分布符合高斯分布,总和生育率均值在1.4,按育龄妇女样本总数为2亿,样本生育率的方差怎么可能是0.05?

家园 问题是这论文怎么能通过审稿

可见整个圈子水平之低劣。

家园 这家伙投靠了少生派呗

然后甘愿为少生派提供理论炮弹,少生派当然能让他发文章。

家园 这个估计也不是啥正规论文

我只是震惊还有这么玩的,要说社会问题本身确实可以公说公有理,没有定论。但一个统计计算的问题还有这种玩狡辩的,就是欺负一般读者没有数理基础,不怕被实锤打脸么。所以我一开始看还有点怀疑自己,难道测量学真有这么处理的道理。

家园 计划生育为什么要搞这么狠

1,因为组织是邪恶的,(不讨论)

2,因为组织被歪理邪说蒙蔽,组织对于没有绝对把握的事情一般采用摸石头过河思路,为何这里就雷厉风行了?

3,不搞不行,必须要搞,迫在眉睫。

题外话,有人感慨华为任总为啥就这么高瞻远瞩英明神武预料到芯片和操作系统有被卡脖子的可能性而未雨绸缪呢。。我呸,这个问题用脚趾头就能想到啊,根本用不到我英明的大脑,只是我预见到了也什么都做不了而已。

回到人口问题,如果接下来十年是经济危机,或许可以看到印度,孟加拉,埃及等国家人口崩溃,华人总量不变而占比上升几个百分点。

无节制而不用接受惩处,那才奇怪。古代咱们可是经历过多次十室九空人口下降过半的,线性思维害人。

家园 6西格玛是质量数据统计中常用到的

测量学一般不涉及6西格玛,测量学之所以需要用到统计数学模型,是为了评定测量不确定度,人口统计又不存在不确定度。你引用的主贴文章,瞎引用统计学,质量控制和测量学的一些名词概念,纯粹忽悠外行。

家园 计生教父宋健被西方忽悠瘸了,宋健又忽悠某人,举国恐慌!

计生教父宋健被西方忽悠瘸了,宋健又忽悠某人,举国恐慌!某人又一向战略短视,战术激进(如大跃进),手法极左。

导弹科学家宋健在欧洲出差碰到了数学家奥尔斯德(Geert Jan Olsder),两人相谈甚欢,奥尔斯德介绍了自己的人口理论,宋健从中得到了灵感,回国后就出台了人口控制论,认为中国必须采取强制措施的一胎政策,否则人口会暴涨到40亿,最适合中国的人口数量是7亿。

哦,对了,这个欧洲数学家现在表示,当时就是喝酒随口聊了一句人口模型,其实那个人口模型现在看来问题很多,早就废弃不用了。

梁中堂的书籍,如《中国计划生育政策史论,BBC中文转载的泰晤士报报道《西方是中国一胎化的始作俑者》,《Science》的文章(一个很短的小八卦),外国学者书籍《Just One Child》上面都讲过这个事情。

“英国生态学家根据英国本土的资源推算,现在5600万人太多,应该逐步降到3000万人,即减少46%;荷兰科学家研究的结果是现在的1350万人口已经超过了4万平方公里上的生态系统所能负担的限度,应该在今后150年内降到500万,即减少63%。”(宋健:《从现代科学看人口问题》

--被西方忽悠瘸了!

计生教父宋健想把百年后人口降到6亿,所谓的适度人口, 却对百年后科技无知,用当时科技水平来硬推,典型的刻舟求剑。大时间跨度定具体人口数量,实际上是伪科学。去设计百年之后具体指标,自以为科学,实为科盲!举个例子,大家很好理解:百年之前,光绪年间的人搞计划生育,应该定今天的人口数量是多少?他知道今天的社会经济科技生活形态吗?知道今天的工作形态和数量吗?在百年之后的人眼里 ,你是石器时代的人,你好意思定别人的具体数据!

1981年宋健从食品角度估算了百年后(刻舟求剑,根本不知道百年后技术,用当前技术硬推),中国适度人口数量,中国人口数量应在6.8亿以下。《中国人口容量与适度人口问题研究》

宋健的6亿人口执念非常强,2015年还在阻碍二胎放开。时间到了2015年,中国两位退休高官宋健与彭佩云都在就独生子女政策游说新一届领导层,但彼此意见相左,这表明中国领导层内部在此事上的分歧,而内部分歧阻碍了这一关键领域的改革进程。与许多学者一样,彭佩云认为目前是该放宽独生子女政策的时候了。不到一年前,在北京的一个学术会议上,彭佩云首次公开表明她对该政策的看法已经改变。宋健则持相反观点,他认为中国资源有限,必须保持低生育率来保持经济发展,否则中国人口将猛增,引发粮食和其他资源短缺。

宋健通过计算為了在2000年控制人口在12億,那麼每對夫婦只能生育1.7個孩子。於是,1.7個孩子就成了政策制定者的夢靨。1.7意味著有的人可以生育兩個,有的人只能生育一個,到底誰能生兩個,誰只能生一個?

在中國,這種難題只有一個解決方案:宁左勿右。 二代做事一向简单粗暴。当然宋健,田雪原当年他们提出: 实行 一胎化政策后 “不会出现老年化,不会出现劳动力短缺,不会出现男人多于女人”。

通宝推:桥上,
全看树展主题 · 分页首页 上页
/ 1
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河