主题：社会科学中的概率？读《直觉,固执,谋杀:三则故事》的困惑 -- 永远的幻想

共:💬21 🌺43 新:

老大河待整

修正一下

标题里提到了“文科中的概率统计”，其实更准确的提法应该是“社会科学中的”，前者说的是文学历史和哲学，而社会学科研究的是人的社会活动的基本规律。人的行为有规律吗，应该有，尤其是一些基本的简单的决策，或者，作为一个群体的宏观规律。但琢磨这些规律还真不是那么容易直观的，听起来和二十世纪前期的物理学有点相似，微观尺度的牛顿定律和宏观尺度的统计热力学，但是，把分子替换成决策人以后事情就完全不同了。只有在很局限的一个范围里的行为我们有把握说一些规律是存在且稳定的，而人是多么的不可捉摸（这样这个世界才更有趣不是吗）！

作为一个个人，可能会本能地不喜欢墨守成规，刻意地反统计规律也是一种可以理解的心态。这可怎么算计进去啊。所以我一直说，做经济学理论的人，首先要谦虚，能琢磨清楚人的行为的一小部分秘密就很让人满足了。

复修正一下

家园

标题改了。花谢

嗯，西方在人文领域的数学应用是越来越多，确实无愧“社会科学”的名字。欢迎搞社会科学都来说说这个问题。

原作者的意思倒也不是想反统计学规律吧，其实理工科的人是“迷信”统计规律还差不多。

讨论的只是在社会科学中统计规律该怎么用，用到什么程度的问题。

比如判案这种事，是对“已经发生”的1次犯罪进行审理。而不是推断如果这个人以后再去“随机试验”N次，其中犯罪的概率。这种情况下能用历史上别人犯罪的统计来推定这次的这个人的情况么？

能不能就肯定说，每个人都是一个同分布的随机样本？

我在主帖里的类似问题好像有点无厘头，但是不把这些前提条件夯实，统计学还真是不敢乱用啊。

复社会科学中的概率？读《直觉,固执,谋杀:三则故事》的困惑

家园

我的看法

1. 原来的实验，说明人决策过程的非理性。

这种非理性用统计知识也许可以看得更清楚，但无法完全靠统计学来解释。实际上，能用统计学解释的，也就不是非理性了。原文喜欢把任何东西都往自己专业上扯，我同意这个问题扯的不是太有意思。

2. 这一段我觉得很有意思。第一印象当成 prior，似乎没有什么问题，本来就是这个意思吧？你大概是平时工作中等可能的情况用到得太多了，没多想 prior 到底是什么意思。

3. 我觉得是这样，P(老公是凶手|老公平时打老婆, 老婆被谋杀)=0.9

这样就比较说的通。

当然，不意味着这个推断就一点没问题。比方说，这个统计肯定是破获案件当中的，否则，我才不信主妇谋杀案的破获率有90%以上。那么，老公是凶手占了九成以上，很可能是因为这样的案子比较好破吧。

刑事案件是否应该使用概率？我想，实际人的决策过程，可能还是和这个有关。但是从表面上来看，你肯定找不到一点点痕迹，法律的权威需要靠文字的严密表达来建立，统计学是不行的。

复社会科学中的概率？读《直觉,固执,谋杀:三则故事》的困惑

家园

提一點淺見

細細看過幻兄對這三個故事的評判，鄙人作為概率統計和機器學習剛剛入門的小生，針對幻兄的三個評論提一點反對意見，以供探討。

第一個故事：

幻兄在評論中提到了邏輯和機器學習的觀點，小生愚鈍，不甚理解這兩點與幻兄的觀點以及原先的故事有何以類比的地方，鄙人需要進一步學習。但是幻兄提到：

至于人相不相信，本来就和概率无关

小生認為此言認為有失偏頗。概率本身作為一個主觀的事情，是主體會依照事實的出現不斷進行修正的，這一點看來和人如何相信不相信一件事情是一致的，人相信不相信一件事情，決定於他看到了什麼事件，也就是說這是一種條件概率，或者言是后驗概率。從例子中說，描述人對一個女人一些性質的可能性的心理相信成都，決定於P(性質|[題目中出現的條件&性質])，而不是P(性質)：

S: 題目中出現的各種條件

顯然，多數人認為 P(C|[C&S]) > P([H=C&F]|[H&S=C&F&S]) > P(F|[F&S])，並且同概率論可能並不矛盾（需要進一步探討？）

小生淺見，這則故事的實際意思是，P(H)=P(C&F)=P(C)*P(F)的絕對概率表述的定理不能簡單地應用於人對一件事情是否發生概率的理解，因為事情的關鍵還需要對各種條件的概率考量，並且需要考慮后驗，並不能說概率論在描述人是否相信一件事情上就是無效的。

第二個故事：

幻兄言：

先验是描述事情发生的“固有”概率

小生雖然愚鈍，但是對於這一點是非常反對的，因為幻兄將概率無條件客觀化了，然而概率論的主觀和客觀問題至今小生沒有太多的知曉（是否世界上的數學家們依舊在爭論這個問題？），但是小生淺見，概率的純客觀性本身就是錯誤的。小生對於先驗的理解，是主體主觀相信事件發生的概率（一個主觀定義），對於先驗的修正，靠的是貝葉斯：

P(H|T) = P(T|H)*P(T) / P(H)

如果發生的T不強烈，即沒有P(T)幾乎為1的事件發生，則T的發生對P(H|T)的修正作用是較少的，我想這個大概是原故事想要說明的問題罷。

第三個故事：

最后想清楚了，定罪需要得到是P(被告杀妻|被告打过妻子) 高

鄙人認為可能不是如此。定罪需要得到的不是P(被告殺妻|被告打過妻子)的值，否則便可能忽略了“被告的妻子已經被殺”這一立案條件了。鄙人淺見，定罪需要的是P(被告殺妻|[被告打過妻子&妻子已死])，在這種情況下，可以用P(丈夫殺妻|[丈夫打過妻子&妻子已死])來估計，並且在可能的情況下可以算得此估計的置信區間。如果置信區間足夠小，那麼P(被告殺妻|[被告打過妻子&妻子已死])便可能是正確而可能作為定罪考量的。

以上均是小生淺見，請多多包涵～～

复社会科学中的概率？读《直觉,固执,谋杀:三则故事》的困惑

家园

我是搞经济学的

最在日常生活中也有类似的现象。当某人向你讲述一件事时，他讲的细节越多，你越容易相信他讲的是真的。但是，细节越多，可能意味着这些细节同时发生的可能性越小，所以他讲的事越不可能是真的（当然，这些细节必须相互联系，你才会信以为真。所以他们之间不是互不相干“相互独立”的，但是这些联系是你做为听者自己加进去的）。

这一段是胡说。照这个逻辑，你用电脑生成了N个随机数。你一个朋友向你要这N个数据，照这篇文章的说法，已知你给了你朋友数据，如果N越大你就越有可能说谎了。

这个推理要成立，必须是你同时知道这些细节的概率随细节数量的增加而降低。但是，我觉得这个假设没什么道理。

关于Prior，这涉及到概率的定义以及哲学含义。对于这个问题已经争论200多年了，现在也没有定论。关于概率定义主要有两派：客观概率和主观概率。你是搞自然科学的，很容易接受客观概率，比如说，扔筛子出现任何一面的概率是六分之一。这个概率是现实存在的。就Prior而说，就是以前的观测数据来建立的。但是，用这个定义，概率的运用范围较窄，比如赌博，中国队同巴西队交手，中国队胜的概率是多大，比如美国联邦储备委员会需要决定未来12个之内出现通货膨胀的概率有多大，这些按照客观概率的定义是不存在的。而按照主管概率来说，概率是人对世界不确定性的看法。当然如果这些看法要合乎逻辑，consistent的话，Savage证明这些概率必须同样满足所有客观概率必须满足的性质，比如A和B独立，那么P(A和B）=P(A)P(B)等等。因此数学上来说，主观与客观概率没有区别，但是在定义理解，以及应用方面，差别很大。

现代的统计理论，在相当程度上是决策理论。也就是说，在已知信息情况下，最优的决策（estimator)是什么。但是在量化的数据之外，我们还有许多知识，信息不能被量化，但是这些信息知识明显和决策有关，在Bayesian Statisics里面，用来model这些信息知识的就是Prior。比如你在日常生活中，已经有许多种族歧视的经历，因此在你搜集数据研究种族歧视问题之前，你已经对这个问题有了一定的知识，但是这些知识不能直接进入你的概率模型（likelihood function),而是你用它们建立起你的Prior。通过Prior进入最后的决策。这里的Prior就是一个主观概率。如果你认为这种使用概率的方法是不对的，那只能到此为止。我前面说了，这个问题已经争论了二百年了，现在也没有结论。

回到你的文章，将“第一印象”问题等同于Prior是不对的。第一印象是说，先入为主，结论是和信息的顺序有关。这在Bayesian Statistics里也是不可能的。我们能够在现实世界中观测到这种现象，只能归结到人行为的非理性。

Savage证明，如果人的行为是理性(consistent)的话，它必须满足贝叶斯法则。即使他们没有conciously运用贝叶斯法则，只要他们是理性的话，他们的行为就看起来象在使用。因此，只要我们认为法官或陪审团是理性的，使用贝叶斯法则分析他们的行为是可以的。

注意这里的历史统计数据，不是针对的被告，而是其他人

这就涉及到统计运用的核心问题。我们都是默认假设历史上以及其他类似问题的数据同我们现在处理的问题有关。比如美国联邦储备委员会总是假设美国历史上历次经济衰退的经济表现，其他国家金融危机后的经济表现会给现在的经济问题提供一定的指示。你当然总可以argue这次金融危机是彻底的structural break。以前的任何信息都没有任何价值了，但那样的话，统计学就没有存在的必要了。

元宝推荐：游识猷,

复我是搞经济学的

家园

同意关于prior的看法

楼主的岐见和定义有关。

从应用角度说，第一印象也不一定是非理性的结果，比如法庭上被告的第一印象给人以粗鲁/野蛮的感觉，而“粗鲁野蛮”和“有罪”之间的关系，由以前的经验已经给了法官“罪行成立概率大”的判断，后面被告要证明自己无罪就要付出更多的努力，这也不能说是非理性的结果。

这说明人的行为概率可以被诱导而改变。

楼主所引第一个故事中，人们犯错，也是诱导的结果：给出很多社会活动背景资料，然后直接给出两个选择哪个可能性高：A.出纳员 B.出纳员和女权主义者，相信也有人也会被诱导而犯错，选项越多，被诱导的可能性越大。

我觉得可能要思考另外一个问题：理性不等于不犯错。理性是逻辑链条的延伸，是思考活动本身，而犯错不犯错是有一个标准答案在上面做判断的，是思考活动的结果，所以，对具体的应用来说，因为有一个预想的观察目的在，可能用犯错不犯错或者行动的是与否的概念，取代理性非理性的概念，可能可以简化问题。我不是搞这个的，浅陋之处见笑了。

全看树展主题 · 分页首页上页下页末页

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明