西西河

主题:社会科学中的概率?读《直觉,固执,谋杀:三则故事》的困惑 -- 永远的幻想

共:💬21 🌺43 新:
全看分页树展 · 主题 跟帖
家园 我是搞经济学的

最在日常生活中也有类似的现象。当某人向你讲述一件事时,他讲的细节越多,你越容易相信他讲的是真的。但是,细节越多,可能意味着这些细节同时发生的可能性越小,所以他讲的事越不可能是真的(当然,这些细节必须相互联系,你才会信以为真。所以他们之间不是互不相干“相互独立”的,但是这些联系是你做为听者自己加进去的)。

这一段是胡说。照这个逻辑,你用电脑生成了N个随机数。你一个朋友向你要这N个数据,照这篇文章的说法,已知你给了你朋友数据,如果N越大你就越有可能说谎了。

这个推理要成立,必须是你同时知道这些细节的概率随细节数量的增加而降低。但是,我觉得这个假设没什么道理。

关于Prior,这涉及到概率的定义以及哲学含义。对于这个问题已经争论200多年了,现在也没有定论。关于概率定义主要有两派:客观概率和主观概率。你是搞自然科学的,很容易接受客观概率,比如说,扔筛子出现任何一面的概率是六分之一。这个概率是现实存在的。就Prior而说,就是以前的观测数据来建立的。但是,用这个定义,概率的运用范围较窄,比如赌博,中国队同巴西队交手,中国队胜的概率是多大,比如美国联邦储备委员会需要决定未来12个之内出现通货膨胀的概率有多大,这些按照客观概率的定义是不存在的。而按照主管概率来说,概率是人对世界不确定性的看法。当然如果这些看法要合乎逻辑,consistent的话,Savage证明这些概率必须同样满足所有客观概率必须满足的性质,比如A和B独立, 那么P(A和B)=P(A)P(B)等等。因此数学上来说,主观与客观概率没有区别,但是在定义理解,以及应用方面,差别很大。

现代的统计理论,在相当程度上是决策理论。也就是说,在已知信息情况下,最优的决策(estimator)是什么。但是在量化的数据之外,我们还有许多知识,信息不能被量化,但是这些信息知识明显和决策有关,在Bayesian Statisics里面,用来model这些信息知识的就是Prior。比如你在日常生活中,已经有许多种族歧视的经历,因此在你搜集数据研究种族歧视问题之前,你已经对这个问题有了一定的知识,但是这些知识不能直接进入你的概率模型(likelihood function),而是你用它们建立起你的Prior。通过Prior进入最后的决策。这里的Prior就是一个主观概率。如果你认为这种使用概率的方法是不对的,那只能到此为止。我前面说了,这个问题已经争论了二百年了,现在也没有结论。

回到你的文章,将“第一印象”问题等同于Prior是不对的。第一印象是说,先入为主,结论是和信息的顺序有关。这在Bayesian Statistics里也是不可能的。我们能够在现实世界中观测到这种现象,只能归结到人行为的非理性。

Savage证明,如果人的行为是理性(consistent)的话,它必须满足贝叶斯法则。即使他们没有conciously运用贝叶斯法则,只要他们是理性的话,他们的行为就看起来象在使用。因此,只要我们认为法官或陪审团是理性的,使用贝叶斯法则分析他们的行为是可以的。

注意这里的历史统计数据,不是针对的被告,而是其他人

这就涉及到统计运用的核心问题。我们都是默认假设历史上以及其他类似问题的数据同我们现在处理的问题有关。比如美国联邦储备委员会总是假设美国历史上历次经济衰退的经济表现,其他国家金融危机后的经济表现会给现在的经济问题提供一定的指示。你当然总可以argue这次金融危机是彻底的structural break。以前的任何信息都没有任何价值了,但那样的话,统计学就没有存在的必要了。

元宝推荐:游识猷,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河