主题 ：【原创】草菅人命的概率 -- 淮夷

【原创】草菅人命的概率

点看全图

外链图片需谨慎，可能会被源头改

《How Doctors Think》是哈佛大学教授Jerome写的畅销书，2007年出版。此书讨论美国医生各种奇怪的诊断错误。我读完此书的第一印象是，在草菅人命这事儿上，中外医生似乎都有无穷潜力。

中国的例子我在《笑林广记》读过：一医迁居，谓四邻曰“向来打扰，无物可做別敬，每位奉药一帖。”邻舍辞以无病。医曰，“但吃了我的药，自然生起病来。”

去医院不是看病而是送命，也许要深入想一想，背后的理由到底是什么。

本书作者认为，大量的误诊或许不该归咎医生的学业不精，而是因为医生和普通人一样，存在顽固的思维误区和认知偏差。

举例来说，有一个典型的认知偏差，心理学称作“availability bias”。意思是，如果医生很难判断一个病症，医生倾向用最熟悉的诊断方式来解释。您觉得四肢无力是吗？那您也许是中毒、肿瘤、大脑幻觉、需要截肢。这取决于您瞧的医生是内科、放射科、精神科、抑或外科的。而四肢无力的唯一原因，也许只是，饿了。

这种认知偏见有一个衍生后果，就是医生们为那些容易留下印象的病症，分配更高的发生概率。

这种大脑赋予的概率分布，是一种下意识的直觉。譬如，人们直觉之一就是，无家可归者往往疯疯癫癫。实际上，人们过高地估计了该人群精神疾病的占比。遇到一个精神正常的流浪汉，你也许毫不留意，偶然碰到一个流浪汉冲你傻笑，更容易长久记得，并在直觉中赋予它更高的概率。

显然，此种直觉很可能是出错的。

针对概率出错的问题，美国的认知心理学家，诺奖得主Daniel Kahneman，做过很多精彩的研究。1983年， Kahneman在一个实验里，请一群实习医生对肺血栓的症状进行概率判断。

这实验设置是这样。病人得了肺血栓，最常见的症状是呼吸短促。偶然的病例中，病人也可能因肺血栓而身体偏瘫。医生要考虑两种情形：A）病人只发生偏瘫，B)病人同时发生偏瘫和呼吸短促，哪一种的概率更高？

91% 的受测医生坚信，B的概率更高。因为，凭医生的经验，患者呼吸短促的确是更常见的。

您也许发现，这个测试不需要懂医学。只要稍稍懂得统计学，就能看到91%的医生都答错了。A的概率无论如何都要高过B，因为B是两个事件并发，等同于A的概率乘以呼吸短促的概率，这乘积肯定小于A的。

可见，这些强有力的认知偏见扭曲了人们对周围事物的认识。这是一个普遍存在的现象，不独医生如此。

事实上，就草菅人命的潜力来说，我觉得比医生更猛的是法官大人。这方面也有一些概率问题，不妨略作了解。

我读过一些书籍谈论美国司法系统用数学概率进行分析，有越来越广的趋势。这似乎是好的现象，不过，人们可能要担心的是 --- 法庭的数学水平。

譬如，犯罪现场的DNA证据，常被陪审团或法官采信，认为是不可争辩的铁证。根据DNA专家的统计，随机抽样一个人，其DNA与案件DNA吻合的概率，只有10亿分之一。这意味着，对DNA吻合的嫌疑人，法庭判错的概率只有10亿分之一，微不足计。

真的微不足计吗？

法院其实忽视了另一个指标，这就是DNA样本自身的出错率。样本也会出错吗？出错的概率有多高？实际上DNA从采样、送检、到最后生成报告，每个环节都可能出现操作失误。

俄克拉荷马州法院基于DNA证据，曾经判一个叫Timothy的嫌犯3100年刑期，而此人有11个证人证明他不在犯罪现场。Timothy在大牢蹲了四年，法院才发现，实验室对其DNA检验操作错了，真凶另有其人。

DNA样本的出错率，尽管科学界没有统一测量值，但很多专家的估计是，概率约为1%。

所以，法庭面对一份DNA匹配的证据，必须考虑两个差错概率：A）随机匹配出错率（10亿分之一）；B）样本自身出错率（1%）。那么，综合的错误率又是多少呢？很多陪审员对此做了估计，凭感觉，他们觉得也许在两者之间，比如1千万分之一。

这本身其实是个相当简单的概率题，用加法法则即可。A或B任一发生差错，法院都不该采信DNA证据。所以，法院错判的概率，其算法是P(A or B) = P(A)+P(B)。由于A的概率实在微小，样本出错率这个较大的数值，基本上决定了法庭的错判概率。

这意味着，DNA作为司法证据绝对可靠，也许是一个被严重夸大的事情。法庭更应关注的数据是实验室的人为差错率，而人为差错率因其主观性，偏偏又不被法庭采纳！

说到法庭的数学水平被挑战，远不止DNA一项。1968年的People v. Collins案件，加州法院也被概率搞晕了。

这案件本身是一宗小型抢劫案。案情颇简单：洛杉矶一老太太推购物车出商场，被一年轻女孩推倒。女孩抢走老太太的钱包，跳上一辆汽车。汽车司机是男的，两人开车逃窜。钱包内有40美元。

这起价值40美元的劫案，演变为法律史上的著名案例之一，因为这是一起概率引发的冤案。

老太太和目击者都没看清楚凶手相貌，只能描述出一些特征。另外，作案的一男一女看来是一对夫妇。于是，检察官雇了一个州立大学的数学家，基于这些特征的概率进行了分析：

凶手特征发生概率

- 开黄色汽车 1/10

- 短胡男 1/4

- 络腮胡黑人男 1/10

- 马尾辫女孩 1/10

- 金发女孩 1/3

- 夫妇的肤色不同 1/1000

洛杉矶警方找到了一对夫妇，Malcom Collins和Janet Collins，他们符合全部特征。

数学家把每个特征看作独立事件，然后用乘法公式，推算一对夫妇相符的概率：

(1/10) X (1/4) X (1/10) X (1/10) X (1/3) X (1/1000) = 1/12,000,000

计算结果表明，相符夫妇的概率非常低，低到只有1200万分之一。

陪审团觉得，如此低的巧合，可谓强大铁证，遂裁定Collins夫妇罪行成立。

加州最高法院最终推翻了这一判决，因为陪审团采信的概率计算，完全算错了！

首先，这些特征之间存在很高关联。譬如短胡子很可能也是络腮胡，二者并发的概率，远比独立事件为高。因此法庭不能用各事件的概率简单相乘。修正了算法后，相符概率只有100万分之一。这当然仍是一个极小概率，人们想，如此低的概率下找到一对相符夫妇，真凶的可能性难道不是极高吗？

这是一个更关键的问题，而陪审团在此又搞错了概率的方向。以洛杉矶案发区数百万人口为基数，以100万分之一为遇合概率，可推算本地约有2-3对夫妇，从概率角度都符合全部特征。

这意味着，判Collins夫妇有罪，判对的可能性只有1/2甚至低到1/3。此案绝非陪审团相信的铁证如山，而更可能是一场冤案。

在法学界，加州陪审团所犯的这个错误代表了一种典型现象，这现象也称作“prosecutor’s fallacy”（检察官谬误）。此谬误最常见的数学原因，在于法庭错误应用了贝叶斯理论。

贝叶斯理论的要点之一，就是A发生时B发生的概率，并不等同于B发生时A发生的概率。

如果你把A看作“犯罪证据吻合”，把B看作“嫌疑人是无辜的”。那么法院的眼睛往往过多的盯住了P(A|B)，意即，当你真的无辜时，你吻合犯罪证据的概率是多少？P(A|B)本身是一个条件概率，亦称“false positive”（假阳性），其数值往往极小，譬如前面提到DNA遇合概率，加州抢劫案的夫妇相符概率，皆属此类。法庭据此相信，错判的概率可以忽略不计。

事实上，法院忽视了另一个条件概率，P(B|A)。意即，当犯罪证据吻合时，嫌犯是无辜的概率有多高？

点看全图

外链图片需谨慎，可能会被源头改

P(B|A)与P(A|B)的计算公式不同，几乎不可能产生相同数值。在一些司法案件中，前者的数值很可能远高于后者，这意味着，无辜被抓的概率相当之高。

法庭对前者的忽视，正是很多冤假错案的数学根源。

下面的知名案例中，法庭对贝叶斯理论的应用，出现了一个经典错误。

这起谋杀案发生在英国。1999年，英国法庭宣判Sally Clark谋杀罪。Sally生了两个孩子，第一个孩子出生11周死亡，死于一种极罕见疾病叫SIDS（婴儿猝死症）。第二个孩子出生8周后也死了。

两个孩子连续死于SIDS疾病的概率有多高呢？法庭传唤了资深的儿科医生，Roy Meadow。Roy推测，像Sally这样没有吸烟史且家境富裕的女性，孩子死于SIDS的概率只有1/8543。

所以，连续两婴死于SIDS的概率是：1/8543 X 1/8543 = 1/7300万。

法庭对7300万分之一的理解是：Sally的婴儿几乎绝不可能连续死于SIDS疾病，所以，Sally一定是谋杀了婴儿。

话说Sally入狱后，英国Salford大学的数学家Ray Hill写了一篇论文，分析英国法庭在此案中的数学错误。（此处链接可读之 http://www.cse.salford.ac.uk/staff/RHill/ppe_5601.pdf ）

数学家Ray指出，法庭要寻找的，并非两婴连续死于SIDS的概率，而是已知有两起死亡发生时，死亡确由SIDS引起之概率。前者是一个连续事件概率，后者是一个条件概率。此处听来有一点绕，却是一个关键的逻辑区别。

Ray进一步计算，当连续两婴死亡时，死于SIDS的概率是死于谋杀概率的9倍。这个相对概率的比较，才是法庭应采信的证据。所以在统计意义上，法庭判Sally谋杀，基本上可说是判错了。

点看全图

外链图片需谨慎，可能会被源头改

(Sally入狱4年后，无罪释放)

不论是认知偏见造成availability bias，还是混淆贝叶斯理论造成prosecutor’s fallacy，现代法律对统计证据和复杂概率的使用，一直是一个有争议性的话题。

不过，任何复杂的概率分析，在罗马教廷的律令面前，都变得一点用处没有了。

因为教廷律令是这样写的：不可判主教有罪，除非有72个证人。不可判司铎有罪，除非有44个证人。不可判助祭有罪，除非有36个证人。不可判副助祭有罪，除非有7个证人。

潜台词是，主教的犯罪概率永远很低，只有1/72，官阶次之的司铎，犯罪概率是1/44，以此类推。

当你读到这种无敌的律令，你还肯相信“一切动物生来平等”吗？

通宝推：打铁的,springisok,不打不相识,阿辉1,每周虎,钓者任公子,等明天,桃子甜,文化体制,短刀,芷蘅,云意不知沧海,弦音醉舸,

这个对日常生活中概率的估计看来还是需要坚实的数学基础阿

这个完全颠覆了我的印象，靠数学概率而不是证据就可以定罪？

西方特别是英美不是证据第一吗？在没有直接证据并形成证据链的前提下，可以用纯粹的数学概率判人有罪？而且是谋杀和抢劫这样的大罪？

书名错了，

应该是《用错概率导致的草菅人命》，你选的几个例子都不是概率的错，而是用错概率的错。

关于这个例子，设计就有问题，要么就是玩了个弯弯绕误导，或者是问题不明确。

　　他要问的是肺血栓症状的概率还是这两种情况的病人诊断肺血栓的概率？医生是依症状来诊病，粗略看一下这个问题一般都会认为是问后一个问题。所以回答后面的概率高是对的，因为单前一个情况因脑血管意外造成的概率要高得多，后一种情况考虑肺血栓就要排在首位。

主教和司铎只有在公众场合杀人才有罪

否则哪找44个以上的证人去，少于74人（包括受害者与犯罪者）的犯罪现场，主教的犯罪概率是0。

我也觉得很奇怪

对西方的司法制度一直没有系统的了解。

我猜，会不会是控方在庭辩时，用上面那些错误的概率计算方法说服了陪审团。结果就被定罪了？

任何证据都不能100%定罪

即便众目睽睽之下的犯罪，都存在所有人都认错人的概率和所有人一起撒谎的可能。

指纹，DNA，即便不考虑人为差错，也都有重合的可能。

所以只要是"beyond reasonable double"，就可以定罪的。

关于医生的笑话，想起另外一个笑话

大学时候听同学说的。

大学的校医院治疗能力很弱。我同学经过大学校医院补的牙过了几个月都变黑了。所以有位同学说，良医是治病救人，大学校医是救病治人...

这是个有意思的话题

DNA检测也曾经证明某些犯人无罪，一个著名例子是此犯人被判抢劫杀人，已经做了几十年牢，结果DNA检测证明他无罪。此人出狱后得到了政府赔偿的一大笔钱，还做了个名片，把自己叫做DNA Test Exoneree。这个人倒还实在，他说自己年纪轻轻被错判入狱，其实是因祸得福，因为当年和他一起在街上混的同龄人几乎都死于非命，他在监狱里算是活了下来。

贝叶斯理论的关键是告诉大家重视alternative explanation，喜欢数学的可以看看这本书，非常好：外链出处

这是个有意思的话题

贝叶斯理论的关键是告诉大家重视alternative explanation，喜欢数学的可以看看这本书，非常好：外链出处

是否定罪取决于能否说服陪审团

即使是DNA也不完全是证据，DNA的检测结果都是“不是此人的概率为x%（x非常小）”，说到底还是概率。

再说陪审团的成员大都是在当地的居民中挑选出来的，而美国人的平均数学水平之差他们自己都不否认，所以如果有一方提出似是而非的概率计算而另一方没有当场反驳，一般不能指望陪审团能够自己发觉错误。

“作案的一男一女看来是一对夫妇”，警察就当真了？

老太太和目击者都没看清楚凶手相貌，只能描述出一些特征。

这里面出错的可能性太大了。最离谱的是“作案的一男一女看来是一对夫妇”，洛杉矶警方居然真去抓夫妇了。难道不可能是同居的，甚至根本没男女关系的犯罪者？这概率从一开始就算错了。难怪洛杉矶警方在愚蠢排行榜上会远胜中央情报局。

出现这样荒唐的案子，还是依法进行的结果，说美国的法律不是笑话也太对不起观众了。

美国法院的葫芦案也是很离奇的

前两天听新闻，一老太在女儿家住着，顺便帮着照看外孙，一天晚上，女儿出门，老太一人在家看孩子，结果几个月大的小孩死了。检察官说是老太太强烈摇晃小孩致死。确实，小孩可以被摇晃死，但是法医在小孩身上找不到瘀青，解剖也看不到大脑出血等症状。检察官的理论是此老太摇得太剧烈，小孩的身体还没有出血等生理反应就已经死了。这个老太难道是天山童姥么？即使这样，陪审团还就信了，老太有罪。