- 程序有所改变。发帖如还有问题请报告
- 【征集】西西河的经济学,及清流措施,需要主动参与者,『稷下学宫』新认证方式,24年网站打算和努力目标
主题:【原创】草菅人命的概率 -- 淮夷
《How Doctors Think》是哈佛大学教授Jerome写的畅销书,2007年出版。此书讨论美国医生各种奇怪的诊断错误。我读完此书的第一印象是,在草菅人命这事儿上,中外医生似乎都有无穷潜力。
中国的例子我在《笑林广记》读过:一医迁居,谓四邻曰“向来打扰,无物可做別敬,每位奉药一帖。”邻舍辞以无病。医曰,“但吃了我的药,自然生起病来。”
去医院不是看病而是送命,也许要深入想一想,背后的理由到底是什么。
本书作者认为,大量的误诊或许不该归咎医生的学业不精,而是因为医生和普通人一样,存在顽固的思维误区和认知偏差。
举例来说,有一个典型的认知偏差,心理学称作“availability bias”。意思是,如果医生很难判断一个病症,医生倾向用最熟悉的诊断方式来解释。您觉得四肢无力是吗?那您也许是中毒、肿瘤、大脑幻觉、需要截肢。这取决于您瞧的医生是内科、放射科、精神科、抑或外科的。而四肢无力的唯一原因,也许只是,饿了。
这种认知偏见有一个衍生后果,就是医生们为那些容易留下印象的病症,分配更高的发生概率。
这种大脑赋予的概率分布,是一种下意识的直觉。譬如,人们直觉之一就是,无家可归者往往疯疯癫癫。实际上,人们过高地估计了该人群精神疾病的占比。遇到一个精神正常的流浪汉,你也许毫不留意,偶然碰到一个流浪汉冲你傻笑,更容易长久记得,并在直觉中赋予它更高的概率。
显然,此种直觉很可能是出错的。
针对概率出错的问题,美国的认知心理学家,诺奖得主Daniel Kahneman,做过很多精彩的研究。1983年, Kahneman在一个实验里,请一群实习医生对肺血栓的症状进行概率判断。
这实验设置是这样。病人得了肺血栓,最常见的症状是呼吸短促。偶然的病例中,病人也可能因肺血栓而身体偏瘫。医生要考虑两种情形:A)病人只发生偏瘫,B)病人同时发生偏瘫和呼吸短促,哪一种的概率更高?
91% 的受测医生坚信,B的概率更高。因为,凭医生的经验,患者呼吸短促的确是更常见的。
您也许发现,这个测试不需要懂医学。只要稍稍懂得统计学,就能看到91%的医生都答错了。A的概率无论如何都要高过B,因为B是两个事件并发,等同于A的概率乘以呼吸短促的概率,这乘积肯定小于A的。
可见,这些强有力的认知偏见扭曲了人们对周围事物的认识。这是一个普遍存在的现象,不独医生如此。
事实上,就草菅人命的潜力来说,我觉得比医生更猛的是法官大人。这方面也有一些概率问题,不妨略作了解。
我读过一些书籍谈论美国司法系统用数学概率进行分析,有越来越广的趋势。这似乎是好的现象,不过,人们可能要担心的是 --- 法庭的数学水平。
譬如,犯罪现场的DNA证据,常被陪审团或法官采信,认为是不可争辩的铁证。根据DNA专家的统计,随机抽样一个人,其DNA与案件DNA吻合的概率,只有10亿分之一。这意味着,对DNA吻合的嫌疑人,法庭判错的概率只有10亿分之一,微不足计。
真的微不足计吗?
法院其实忽视了另一个指标,这就是DNA样本自身的出错率。样本也会出错吗?出错的概率有多高?实际上DNA从采样、送检、到最后生成报告,每个环节都可能出现操作失误。
俄克拉荷马州法院基于DNA证据,曾经判一个叫Timothy的嫌犯3100年刑期,而此人有11个证人证明他不在犯罪现场。Timothy在大牢蹲了四年,法院才发现,实验室对其DNA检验操作错了,真凶另有其人。
DNA样本的出错率,尽管科学界没有统一测量值,但很多专家的估计是,概率约为1%。
所以,法庭面对一份DNA匹配的证据,必须考虑两个差错概率:A)随机匹配出错率(10亿分之一);B)样本自身出错率(1%)。那么,综合的错误率又是多少呢?很多陪审员对此做了估计,凭感觉,他们觉得也许在两者之间,比如1千万分之一。
这本身其实是个相当简单的概率题,用加法法则即可。A或B任一发生差错,法院都不该采信DNA证据。所以,法院错判的概率,其算法是P(A or B) = P(A)+P(B)。由于A的概率实在微小,样本出错率这个较大的数值,基本上决定了法庭的错判概率。
这意味着,DNA作为司法证据绝对可靠,也许是一个被严重夸大的事情。法庭更应关注的数据是实验室的人为差错率,而人为差错率因其主观性,偏偏又不被法庭采纳!
说到法庭的数学水平被挑战,远不止DNA一项。1968年的People v. Collins案件,加州法院也被概率搞晕了。
这案件本身是一宗小型抢劫案。案情颇简单:洛杉矶一老太太推购物车出商场,被一年轻女孩推倒。女孩抢走老太太的钱包,跳上一辆汽车。汽车司机是男的,两人开车逃窜。钱包内有40美元。
这起价值40美元的劫案,演变为法律史上的著名案例之一,因为这是一起概率引发的冤案。
老太太和目击者都没看清楚凶手相貌,只能描述出一些特征。另外,作案的一男一女看来是一对夫妇。于是,检察官雇了一个州立大学的数学家,基于这些特征的概率进行了分析:
凶手特征 发生概率
- 开黄色汽车 1/10
- 短胡男 1/4
- 络腮胡黑人男 1/10
- 马尾辫女孩 1/10
- 金发女孩 1/3
- 夫妇的肤色不同 1/1000
洛杉矶警方找到了一对夫妇,Malcom Collins和Janet Collins,他们符合全部特征。
数学家把每个特征看作独立事件,然后用乘法公式,推算一对夫妇相符的概率:
(1/10) X (1/4) X (1/10) X (1/10) X (1/3) X (1/1000) = 1/12,000,000
计算结果表明,相符夫妇的概率非常低,低到只有1200万分之一。
陪审团觉得,如此低的巧合,可谓强大铁证,遂裁定Collins夫妇罪行成立。
加州最高法院最终推翻了这一判决,因为陪审团采信的概率计算,完全算错了!
首先,这些特征之间存在很高关联。譬如短胡子很可能也是络腮胡,二者并发的概率,远比独立事件为高。因此法庭不能用各事件的概率简单相乘。修正了算法后,相符概率只有100万分之一。这当然仍是一个极小概率,人们想,如此低的概率下找到一对相符夫妇,真凶的可能性难道不是极高吗?
这是一个更关键的问题,而陪审团在此又搞错了概率的方向。以洛杉矶案发区数百万人口为基数,以100万分之一为遇合概率,可推算本地约有2-3对夫妇,从概率角度都符合全部特征。
这意味着,判Collins夫妇有罪,判对的可能性只有1/2甚至低到1/3。此案绝非陪审团相信的铁证如山,而更可能是一场冤案。
在法学界,加州陪审团所犯的这个错误代表了一种典型现象,这现象也称作“prosecutor’s fallacy”(检察官谬误)。此谬误最常见的数学原因,在于法庭错误应用了贝叶斯理论。
贝叶斯理论的要点之一,就是A发生时B发生的概率,并不等同于B发生时A发生的概率。
如果你把A看作“犯罪证据吻合”,把B看作“嫌疑人是无辜的”。那么法院的眼睛往往过多的盯住了P(A|B),意即,当你真的无辜时,你吻合犯罪证据的概率是多少?P(A|B)本身是一个条件概率,亦称“false positive”(假阳性),其数值往往极小,譬如前面提到DNA遇合概率,加州抢劫案的夫妇相符概率,皆属此类。法庭据此相信,错判的概率可以忽略不计。
事实上,法院忽视了另一个条件概率,P(B|A)。意即,当犯罪证据吻合时,嫌犯是无辜的概率有多高?
P(B|A)与P(A|B)的计算公式不同,几乎不可能产生相同数值。在一些司法案件中,前者的数值很可能远高于后者,这意味着,无辜被抓的概率相当之高。
法庭对前者的忽视,正是很多冤假错案的数学根源。
下面的知名案例中,法庭对贝叶斯理论的应用,出现了一个经典错误。
这起谋杀案发生在英国。1999年,英国法庭宣判Sally Clark谋杀罪。Sally生了两个孩子,第一个孩子出生11周死亡,死于一种极罕见疾病叫SIDS(婴儿猝死症)。第二个孩子出生8周后也死了。
两个孩子连续死于SIDS疾病的概率有多高呢?法庭传唤了资深的儿科医生,Roy Meadow。Roy推测,像Sally这样没有吸烟史且家境富裕的女性,孩子死于SIDS的概率只有1/8543。
所以,连续两婴死于SIDS的概率是:1/8543 X 1/8543 = 1/7300万。
法庭对7300万分之一的理解是:Sally的婴儿几乎绝不可能连续死于SIDS疾病,所以,Sally一定是谋杀了婴儿。
话说Sally入狱后,英国Salford大学的数学家Ray Hill写了一篇论文,分析英国法庭在此案中的数学错误。(此处链接可读之 http://www.cse.salford.ac.uk/staff/RHill/ppe_5601.pdf )
数学家Ray指出,法庭要寻找的,并非两婴连续死于SIDS的概率,而是已知有两起死亡发生时,死亡确由SIDS引起之概率。前者是一个连续事件概率,后者是一个条件概率。此处听来有一点绕,却是一个关键的逻辑区别。
Ray进一步计算,当连续两婴死亡时,死于SIDS的概率是死于谋杀概率的9倍。这个相对概率的比较,才是法庭应采信的证据。所以在统计意义上,法庭判Sally谋杀,基本上可说是判错了。
(Sally入狱4年后,无罪释放)
不论是认知偏见造成availability bias,还是混淆贝叶斯理论造成prosecutor’s fallacy,现代法律对统计证据和复杂概率的使用,一直是一个有争议性的话题。
不过,任何复杂的概率分析,在罗马教廷的律令面前,都变得一点用处没有了。
因为教廷律令是这样写的:不可判主教有罪,除非有72个证人。不可判司铎有罪,除非有44个证人。不可判助祭有罪,除非有36个证人。不可判副助祭有罪,除非有7个证人。
潜台词是,主教的犯罪概率永远很低,只有1/72,官阶次之的司铎,犯罪概率是1/44,以此类推。
当你读到这种无敌的律令,你还肯相信“一切动物生来平等”吗?
西方特别是英美不是证据第一吗?在没有直接证据并形成证据链的前提下,可以用纯粹的数学概率判人有罪?而且是谋杀和抢劫这样的大罪?
应该是《用错概率导致的草菅人命》,你选的几个例子都不是概率的错,而是用错概率的错。
关于这个例子,设计就有问题,要么就是玩了个弯弯绕误导,或者是问题不明确。
否则哪找44个以上的证人去,少于74人(包括受害者与犯罪者)的犯罪现场,主教的犯罪概率是0。
对西方的司法制度一直没有系统的了解。
我猜,会不会是控方在庭辩时,用上面那些错误的概率计算方法说服了陪审团。结果就被定罪了?
即便众目睽睽之下的犯罪,都存在所有人都认错人的概率和所有人一起撒谎的可能。
指纹,DNA,即便不考虑人为差错,也都有重合的可能。
所以只要是"beyond reasonable double",就可以定罪的。
大学时候听同学说的。
大学的校医院治疗能力很弱。我同学经过大学校医院补的牙过了几个月都变黑了。所以有位同学说,良医是治病救人,大学校医是救病治人...
DNA检测也曾经证明某些犯人无罪,一个著名例子是此犯人被判抢劫杀人,已经做了几十年牢,结果DNA检测证明他无罪。此人出狱后得到了政府赔偿的一大笔钱,还做了个名片,把自己叫做DNA Test Exoneree。这个人倒还实在,他说自己年纪轻轻被错判入狱,其实是因祸得福,因为当年和他一起在街上混的同龄人几乎都死于非命,他在监狱里算是活了下来。
贝叶斯理论的关键是告诉大家重视alternative explanation,喜欢数学的可以看看这本书,非常好:外链出处
DNA检测也曾经证明某些犯人无罪,一个著名例子是此犯人被判抢劫杀人,已经做了几十年牢,结果DNA检测证明他无罪。此人出狱后得到了政府赔偿的一大笔钱,还做了个名片,把自己叫做DNA Test Exoneree。这个人倒还实在,他说自己年纪轻轻被错判入狱,其实是因祸得福,因为当年和他一起在街上混的同龄人几乎都死于非命,他在监狱里算是活了下来。
贝叶斯理论的关键是告诉大家重视alternative explanation,喜欢数学的可以看看这本书,非常好:外链出处
即使是DNA也不完全是证据,DNA的检测结果都是“不是此人的概率为x%(x非常小)”,说到底还是概率。
再说陪审团的成员大都是在当地的居民中挑选出来的,而美国人的平均数学水平之差他们自己都不否认,所以如果有一方提出似是而非的概率计算而另一方没有当场反驳,一般不能指望陪审团能够自己发觉错误。
老太太和目击者都没看清楚凶手相貌,只能描述出一些特征。
这里面出错的可能性太大了。最离谱的是“作案的一男一女看来是一对夫妇”,洛杉矶警方居然真去抓夫妇了。难道不可能是同居的,甚至根本没男女关系的犯罪者?这概率从一开始就算错了。难怪洛杉矶警方在愚蠢排行榜上会远胜中央情报局。
出现这样荒唐的案子,还是依法进行的结果,说美国的法律不是笑话也太对不起观众了。
前两天听新闻,一老太在女儿家住着,顺便帮着照看外孙,一天晚上,女儿出门,老太一人在家看孩子,结果几个月大的小孩死了。检察官说是老太太强烈摇晃小孩致死。确实,小孩可以被摇晃死,但是法医在小孩身上找不到瘀青,解剖也看不到大脑出血等症状。检察官的理论是此老太摇得太剧烈,小孩的身体还没有出血等生理反应就已经死了。这个老太难道是天山童姥么?即使这样,陪审团还就信了,老太有罪。
P(A or B) = P(A)+P(B)
应该是 P(A or B)=P(A)+P(B)-P(A and B)
但后两个加数远小于第一个加数,可忽略。此处求的是综合错误率,应该有三种情况,随机出错但样本无错,随机无错但样本有错,随机出错且样本出错。
=========
这篇文章的确有些颠覆我的常识。讨论两点:
1,40美元抢劫案中考虑流动人口没?
楼主的这句话看得我蛋疼
2,西方不是信奉无罪推定吗?怎么在实际中,因为某些巧合的概率十分小,就可以认定某人有罪?
看了这几个判例,让我有种西方法庭草菅人命的感觉……
一向很喜欢淮夷介绍的书,一般看完淮夷的文章后,会跑去gigapedia那里下载,可惜最近发现这个网站已经被关了。。。。。
请问各位去哪里下载免费英文版的电子书啊?中文的我知道去新浪爱问。。。