西西河

主题:【原创】草菅人命的概率 -- 淮夷

共:💬54 🌺361 新:
全看分页树展 · 主题
家园 【原创】草菅人命的概率

点看全图

外链图片需谨慎,可能会被源头改

《How Doctors Think》是哈佛大学教授Jerome写的畅销书,2007年出版。此书讨论美国医生各种奇怪的诊断错误。我读完此书的第一印象是,在草菅人命这事儿上,中外医生似乎都有无穷潜力。

中国的例子我在《笑林广记》读过:一医迁居,谓四邻曰“向来打扰,无物可做別敬,每位奉药一帖。”邻舍辞以无病。医曰,“但吃了我的药,自然生起病来。”

去医院不是看病而是送命,也许要深入想一想,背后的理由到底是什么。

本书作者认为,大量的误诊或许不该归咎医生的学业不精,而是因为医生和普通人一样,存在顽固的思维误区和认知偏差。

举例来说,有一个典型的认知偏差,心理学称作“availability bias”。意思是,如果医生很难判断一个病症,医生倾向用最熟悉的诊断方式来解释。您觉得四肢无力是吗?那您也许是中毒、肿瘤、大脑幻觉、需要截肢。这取决于您瞧的医生是内科、放射科、精神科、抑或外科的。而四肢无力的唯一原因,也许只是,饿了。

这种认知偏见有一个衍生后果,就是医生们为那些容易留下印象的病症,分配更高的发生概率。

这种大脑赋予的概率分布,是一种下意识的直觉。譬如,人们直觉之一就是,无家可归者往往疯疯癫癫。实际上,人们过高地估计了该人群精神疾病的占比。遇到一个精神正常的流浪汉,你也许毫不留意,偶然碰到一个流浪汉冲你傻笑,更容易长久记得,并在直觉中赋予它更高的概率。

显然,此种直觉很可能是出错的。

针对概率出错的问题,美国的认知心理学家,诺奖得主Daniel Kahneman,做过很多精彩的研究。1983年, Kahneman在一个实验里,请一群实习医生对肺血栓的症状进行概率判断。

这实验设置是这样。病人得了肺血栓,最常见的症状是呼吸短促。偶然的病例中,病人也可能因肺血栓而身体偏瘫。医生要考虑两种情形:A)病人只发生偏瘫,B)病人同时发生偏瘫和呼吸短促,哪一种的概率更高?

91% 的受测医生坚信,B的概率更高。因为,凭医生的经验,患者呼吸短促的确是更常见的。

您也许发现,这个测试不需要懂医学。只要稍稍懂得统计学,就能看到91%的医生都答错了。A的概率无论如何都要高过B,因为B是两个事件并发,等同于A的概率乘以呼吸短促的概率,这乘积肯定小于A的。

可见,这些强有力的认知偏见扭曲了人们对周围事物的认识。这是一个普遍存在的现象,不独医生如此。

事实上,就草菅人命的潜力来说,我觉得比医生更猛的是法官大人。这方面也有一些概率问题,不妨略作了解。

我读过一些书籍谈论美国司法系统用数学概率进行分析,有越来越广的趋势。这似乎是好的现象,不过,人们可能要担心的是 --- 法庭的数学水平。

譬如,犯罪现场的DNA证据,常被陪审团或法官采信,认为是不可争辩的铁证。根据DNA专家的统计,随机抽样一个人,其DNA与案件DNA吻合的概率,只有10亿分之一。这意味着,对DNA吻合的嫌疑人,法庭判错的概率只有10亿分之一,微不足计。

真的微不足计吗?

法院其实忽视了另一个指标,这就是DNA样本自身的出错率。样本也会出错吗?出错的概率有多高?实际上DNA从采样、送检、到最后生成报告,每个环节都可能出现操作失误。

俄克拉荷马州法院基于DNA证据,曾经判一个叫Timothy的嫌犯3100年刑期,而此人有11个证人证明他不在犯罪现场。Timothy在大牢蹲了四年,法院才发现,实验室对其DNA检验操作错了,真凶另有其人。

DNA样本的出错率,尽管科学界没有统一测量值,但很多专家的估计是,概率约为1%。

所以,法庭面对一份DNA匹配的证据,必须考虑两个差错概率:A)随机匹配出错率(10亿分之一);B)样本自身出错率(1%)。那么,综合的错误率又是多少呢?很多陪审员对此做了估计,凭感觉,他们觉得也许在两者之间,比如1千万分之一。

这本身其实是个相当简单的概率题,用加法法则即可。A或B任一发生差错,法院都不该采信DNA证据。所以,法院错判的概率,其算法是P(A or B) = P(A)+P(B)。由于A的概率实在微小,样本出错率这个较大的数值,基本上决定了法庭的错判概率。

这意味着,DNA作为司法证据绝对可靠,也许是一个被严重夸大的事情。法庭更应关注的数据是实验室的人为差错率,而人为差错率因其主观性,偏偏又不被法庭采纳!

说到法庭的数学水平被挑战,远不止DNA一项。1968年的People v. Collins案件,加州法院也被概率搞晕了。

这案件本身是一宗小型抢劫案。案情颇简单:洛杉矶一老太太推购物车出商场,被一年轻女孩推倒。女孩抢走老太太的钱包,跳上一辆汽车。汽车司机是男的,两人开车逃窜。钱包内有40美元。

这起价值40美元的劫案,演变为法律史上的著名案例之一,因为这是一起概率引发的冤案。

老太太和目击者都没看清楚凶手相貌,只能描述出一些特征。另外,作案的一男一女看来是一对夫妇。于是,检察官雇了一个州立大学的数学家,基于这些特征的概率进行了分析:

凶手特征 发生概率

- 开黄色汽车 1/10

- 短胡男 1/4

- 络腮胡黑人男 1/10

- 马尾辫女孩 1/10

- 金发女孩 1/3

- 夫妇的肤色不同 1/1000

洛杉矶警方找到了一对夫妇,Malcom Collins和Janet Collins,他们符合全部特征。

数学家把每个特征看作独立事件,然后用乘法公式,推算一对夫妇相符的概率:

(1/10) X (1/4) X (1/10) X (1/10) X (1/3) X (1/1000) = 1/12,000,000

计算结果表明,相符夫妇的概率非常低,低到只有1200万分之一。

陪审团觉得,如此低的巧合,可谓强大铁证,遂裁定Collins夫妇罪行成立。

加州最高法院最终推翻了这一判决,因为陪审团采信的概率计算,完全算错了!

首先,这些特征之间存在很高关联。譬如短胡子很可能也是络腮胡,二者并发的概率,远比独立事件为高。因此法庭不能用各事件的概率简单相乘。修正了算法后,相符概率只有100万分之一。这当然仍是一个极小概率,人们想,如此低的概率下找到一对相符夫妇,真凶的可能性难道不是极高吗?

这是一个更关键的问题,而陪审团在此又搞错了概率的方向。以洛杉矶案发区数百万人口为基数,以100万分之一为遇合概率,可推算本地约有2-3对夫妇,从概率角度都符合全部特征。

这意味着,判Collins夫妇有罪,判对的可能性只有1/2甚至低到1/3。此案绝非陪审团相信的铁证如山,而更可能是一场冤案。

在法学界,加州陪审团所犯的这个错误代表了一种典型现象,这现象也称作“prosecutor’s fallacy”(检察官谬误)。此谬误最常见的数学原因,在于法庭错误应用了贝叶斯理论。

贝叶斯理论的要点之一,就是A发生时B发生的概率,并不等同于B发生时A发生的概率。

如果你把A看作“犯罪证据吻合”,把B看作“嫌疑人是无辜的”。那么法院的眼睛往往过多的盯住了P(A|B),意即,当你真的无辜时,你吻合犯罪证据的概率是多少?P(A|B)本身是一个条件概率,亦称“false positive”(假阳性),其数值往往极小,譬如前面提到DNA遇合概率,加州抢劫案的夫妇相符概率,皆属此类。法庭据此相信,错判的概率可以忽略不计。

事实上,法院忽视了另一个条件概率,P(B|A)。意即,当犯罪证据吻合时,嫌犯是无辜的概率有多高?

点看全图

外链图片需谨慎,可能会被源头改

P(B|A)与P(A|B)的计算公式不同,几乎不可能产生相同数值。在一些司法案件中,前者的数值很可能远高于后者,这意味着,无辜被抓的概率相当之高。

法庭对前者的忽视,正是很多冤假错案的数学根源。

下面的知名案例中,法庭对贝叶斯理论的应用,出现了一个经典错误。

这起谋杀案发生在英国。1999年,英国法庭宣判Sally Clark谋杀罪。Sally生了两个孩子,第一个孩子出生11周死亡,死于一种极罕见疾病叫SIDS(婴儿猝死症)。第二个孩子出生8周后也死了。

两个孩子连续死于SIDS疾病的概率有多高呢?法庭传唤了资深的儿科医生,Roy Meadow。Roy推测,像Sally这样没有吸烟史且家境富裕的女性,孩子死于SIDS的概率只有1/8543。

所以,连续两婴死于SIDS的概率是:1/8543 X 1/8543 = 1/7300万。

法庭对7300万分之一的理解是:Sally的婴儿几乎绝不可能连续死于SIDS疾病,所以,Sally一定是谋杀了婴儿。

话说Sally入狱后,英国Salford大学的数学家Ray Hill写了一篇论文,分析英国法庭在此案中的数学错误。(此处链接可读之 http://www.cse.salford.ac.uk/staff/RHill/ppe_5601.pdf )

数学家Ray指出,法庭要寻找的,并非两婴连续死于SIDS的概率,而是已知有两起死亡发生时,死亡确由SIDS引起之概率。前者是一个连续事件概率,后者是一个条件概率。此处听来有一点绕,却是一个关键的逻辑区别。

Ray进一步计算,当连续两婴死亡时,死于SIDS的概率是死于谋杀概率的9倍。这个相对概率的比较,才是法庭应采信的证据。所以在统计意义上,法庭判Sally谋杀,基本上可说是判错了。

点看全图

外链图片需谨慎,可能会被源头改

(Sally入狱4年后,无罪释放)

不论是认知偏见造成availability bias,还是混淆贝叶斯理论造成prosecutor’s fallacy,现代法律对统计证据和复杂概率的使用,一直是一个有争议性的话题。

不过,任何复杂的概率分析,在罗马教廷的律令面前,都变得一点用处没有了。

因为教廷律令是这样写的:不可判主教有罪,除非有72个证人。不可判司铎有罪,除非有44个证人。不可判助祭有罪,除非有36个证人。不可判副助祭有罪,除非有7个证人。

潜台词是,主教的犯罪概率永远很低,只有1/72,官阶次之的司铎,犯罪概率是1/44,以此类推。

当你读到这种无敌的律令,你还肯相信“一切动物生来平等”吗?

通宝推:打铁的,springisok,不打不相识,阿辉1,每周虎,钓者任公子,等明天,桃子甜,文化体制,短刀,芷蘅,云意不知沧海,弦音醉舸,
全看分页树展 · 主题


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河