西西河

主题:漫谈体检策略-统计相关的故事(一) -- xtqntd

共:💬41 🌺182 新:
分页树展主题 · 全看首页 上页
/ 3
下页 末页
    • 家园 漫谈体检策略-统计相关的故事(终局)

      没时间的网友可以直接忽略中间那些,跳到这篇。

      绕了这么大的圈子,我们还是回到了原点:体检,究竟该怎么办?

      之前拉拉杂杂了这么多,其实最后建议只有记住以下三点

      1。先想清楚“我”是谁,我要什么?

      2。先问清楚这个方法是不是适合“我们”?

      3。天下没有免费的午餐

      也许这家老爷子有高血压,邻家大妈前两年不幸得了胃癌但是万幸是早期医生说切得很干净,隔壁大兄弟四十来岁成天在外面忙事业不着家,楼下小姑娘很可怜,家里有几位长辈女性得了乳腺癌她忙里忙外的

      这是我们的生活,这是“我”。每一个人都属于一个小小的群体,你把自己定位得越细越准确,“我”和“他”就有所不一样,那么体检的策略自然有不所一样。希望大家特别注意,多想一点,然后自然可以分辨不同的人给的意见是否适用于自己。古人谓兼听,择其善者从之,其不善者而改之,与Baysian思想下的偏倚分析不约而同。

      如果有人跑来跟你说xx方法最牛x,包查百病,有百利而无一害,这个时候就要留个心眼了,这是骗子,圈圈功,叉叉教和投行的专家们特别喜欢的句式。多留个心眼,天下没有免费的午餐。

      上面的几位分别代表了不同的人,有不同的需求,重点检测不同的疾病,推荐的方法自然不一样。大家不妨一起出出主意,并且说说为什么您会建议他们这么做,相信几轮讨论,各位都能建立起您自己的心得。

      另外,有一位有趣的教授弄了一个your disease risk的网站,以前在哈佛,老头跳槽去了圣路易斯华大,于是网站也跟着搬到了新的学校。

      http://www.yourdiseaserisk.wustl.edu/

      仍然需要指出的是,网站的实际对象是美国的、能使用英语的、能够上互联网的、并且会跑来看这个网站的人群,虽然设计对象是(美国的)全人群,资料来源也尽可能是(美国的)全人群。当然,大多原理还是相通的,对普通国人来说简明易懂,可以参考。

      哈佛还留了一个按图索骥,也还不错

      http://www.diseaseriskindex.harvard.edu/update/english/index.htm

      通宝推:唐家山,
    • 家园 漫谈体检策略-统计相关的故事(外一篇)

      世界真的很复杂

      我们要去体检,我们陷入了一张无穷无尽的概率推断的巨大网络,虽然我们总是希望这样的推断是因果推断,但绝大多数时候,只是相关性的概率推断。

      某项检测是不是适用于某个群体-|

      我要检查什么东西-------|

      我是谁-我属于哪个群体------》是否检测某指标--》检测方法是否能准确反映这个指标--》这个指标能否反映某个疾病--》是不是有某个疾病

      这就是临床医生每天面对的世界,每天积累着经验,每天修正着自己的判断。没有人会在做诊断的时候这样一步一步地推,一切都在潜移默化中融入了思维,这就是人脑神奇之处。

      抱怨这次医改提高医生服务诊费的河友,如果您知道了诊断是如此复杂的事情,您还会抱怨医生收的服务费太高么?假设同样的工作强度下,布隆博格和麦肯锡卖信息和咨询意见各自收费又是多少呢?

      行文至此,不由得上一段严肃的讨论。

      医生应该是贝耶斯主义者,只是大多数时候他们并不需要仔细分辨。

      医学是经验学科,医生随着经验的积累不断地修正自己的判断,也在不断地适应自己所面对的人群。随着现代医学分科的不断细化,专科医生越来越局限于自己专长所能见到的人群。但经常地,他们也会经常忘记自己所下结论的人群。

      对普罗大众推荐合适的基本体检,应是面对普罗大众的全科医生的作用所在,并由此担负起正确分诊的重任。因为各种因素的影响,文化、经济和人的心态,基层全科医生待遇低、地位低,无人肯做,无人尊重,于是平均水准也相对较低,由此进入恶性循环。在美国也是一样的情况。之前的讨论中出现的争论正是目前我国和美国部分医疗现状的一个共同缩影:

      部分富裕的人们涌向最顶尖的医院,专科医生取代了全科医生的职责,或有意或无意直接推荐高精尖的适用于特殊人群的检查给一般人群。其中纠结了太多的利益、名誉、自我认同和群体认同,绝非一两句就能解释。而穷人们在这样潮流的裹挟之下,也只能随波逐流了。

      前面的争论中反复出现并为医生自豪的,也是现在极为很热门的一个词汇就是循证医学,力图把医疗手段标准化、证据化。以往比较常见的如证据分级、meta分析等已为我国医界所接受和广为应用,当然,水平各有千秋。进一步发展可参考美国兰德公司的三大支柱之一,兰德医疗的研究,他们目前正在从事着标准化医疗决策的研究,临床医生、流行病学家和统计学家共同合作构建基于Baysian理论基础上的各类决策树和决策理论,用于制定相对标准化的疾病诊疗流程、预后判断,广泛运用于临床实践和医疗保险业。高水平专科医生大可以此为参考依据。

      但遗憾的是,如此强大的工具在目前我国医学教育模式的大背景下并没有得到最好的发挥。为了晋升,必需要有博士学位,必需要有SCI论文。于是医学博士生们被要求待在实验室里钻研动物模型,最重要的临床实践却不见了,这在国内某些新贵医学院中表现得特别明显,论文,论文,还是论文。博士不会看病者大有人在,即使是研究循症医学的博士或是专科医生,倘只醉心于跟踪所谓最新的文献,却忘记了这些文献结论下在什么样的人群,而自己面对的又是什么样的人群。

      另一方面,这样的标准化流程也成为了极佳的,往善处说是自我保护,往恶处说是推卸责任的借口--这里的也是现实中的善恶没有明确的分野--这是目前最好的证据,我一步一步照着来的,这也是正是目前部分医疗官司压力下的某些医生保护自己的无奈之举,也是某些医生推卸责任的基本模式。

      • 家园 不同阶段需要采用不同的策略

        循证医学在现阶段还是推广、普及标准化最佳的工具,不仅在中国,在全球范围内还是这样,估计还得有10、20年的时间去推广、实践,才能得出比较好的效果。

        从循证医学这个概念引入的历史来看,其实这完全反映了数学这门学科在医学领域的应用:在国内,这个概念实际是临床流行病学方面的专家(其实这些人本身也是临床专家)首先介绍,并得到更多临床专家的支持和宣传。国际上应该也差不多。有这个基础在,相信更多数学原理和方法可以更好的提高医疗服务的质量。

        只是经过近20多年的培育、宣传,现在大部分医生对循证医学都还没有吃透,就不要说更高级的方法了。比如对森林图如何解读、证据等级与建议级别的差别。再比如,在很多领域,尤其是和外科相关的方面,循证医学的开展就比内科和肿瘤科落后很多。

        说实话,Baysian理论我相信在中国的医生中知道的不超过万分之一。我也不懂。但我相信,总会好起来的。为了这一天,还请坚持不断的宣传、科普。

        • 家园 Baysian不是什么神奇的理论啦

          没你说的那么夸张哈,只是国内没有系统地教罢了

          美国很多MD都要学的,有的是在Health Service的Minor里跟着学,有的是在Epi的Minor里跟着学。

          呵呵

          • 家园 不是难不难,而是根本没有接触

            国内的临床医学本科/研究生的卫生统计学/流行病学没有这方面的内容,那么一个医生这辈子基本上就不太可能认识这个东东了。

            那么对于一个无人知其为何物的概念,要被大众接受,漫漫长路,长得难以想象,看看循证医学的现状就可以知道了。

            其实这和新中国前40年的教育体系还是有很大关系,重应用,而且是重落伍30-40年的应用。现在大学都在改革了,希望能好点。不过老师还是那些旧知识结构的人,难啊。

            • 家园 还真是40年

              40多年前Cornfield开始的东西国内还没教透……不过美国也一样啦。话又说回来,不能要求临床医生对这个都搞得很透的,求全责备,会疯了的。

    • 家园 漫谈体检策略-统计相关的故事(七)

      天下没有免费的午餐

      老祖宗教导我们福祸相依,阴阳轮回,革命导师教育我们要用辩证法,而皇帝、资本家和普世教育我们只有这样这样才是是对的。

      没有哪种检查是没有副作用的。最少的副作用是花了你的或者纳税人的钱和时间。也正因为有副作用,所以才需要更多地考虑一下“我是谁”的问题。世界上最准确的方法是病理切片。把你从上到下全部切成标本由病理学家诊断一遍,保证没错(某个时代的金指标),但似乎检查完成之后人也没了。

      最常用的体检,也就是望触叩听这些基本功,敏感度和特异度都很低。于是才有技术手段的不断进展,但是技术手段越激进,可能副作用也就越大。X线是革命性的突破,但同时带来了外辐射;PET是革命性的突破,但同时带来了内、外辐射;胃镜、肠镜、ERCP是革命性的突破,但是不小心捅破了器官致命的事情也开始有了

      以前两天闹得沸沸扬扬的PET-CT为例,其潜在的副作用有:

      CT的X线外辐射

      PET正电子的外辐射

      注射进体内同位素标记的分子(一般是葡萄糖)的内辐射

      标记药物可能引发的过敏

      密闭空间的幽闭恐惧(这个太少了,忽略好了。)

      如果这种方法在急需判定是否需要化疗、化疗需要用什么样方案的肿瘤患者中使用,没有问题。但是在一般人群里,既然这种方法的阳性预测值和别的非侵入性的/放射性的方法没什么差别,那么副作用,在这种情况下,就成为了必需要考虑的问题,再在前面的基础上,根据副作用的危害程度,考虑是否采用这种检查。

      这就是一环套一环的条件概率链条,在过去的几天争论中,不停地有人选取其中某一环的概率--必需得承认对这环/或者说部分的研究确实有严谨的研究证据--来试图替代应用于整体的条件概率,有意(刻意推广者)或无意(忘了下定义的人群者)地给出了误导性的结论。

      不可否认的是,即使大家都构建了同样的推理链条,在各个环节上的选择也是因人而异的。策略的选择实际变成了个人性格和知识的综合体现。你是激进的还是保守的?你的医生是激进的还是保守的?

      于是我们需要再看,无论在哪所医学院,临床医学教育中前辈医师都会一直、反复强调,考虑疾病先要考虑常见病多发病,考虑检查也是要循序渐进,不能一上来就是“高精尖”,为什么?

      因为我们都是Baysian

      土鳖抗铁牛

    • 家园 漫谈体检策略-统计相关的故事(六)

      串联和并联

      中学我们就知道,串联电路和并联电路是不一样的,医学检查也是一样

      因为世界总是不那么完美,医生很多时候没法根据某一项检测来确诊或者获得足够高的信心来判定--比如阳性预测值很低,于是就需要做多项检测。

      多项检测的策略最基本的有两种,串联和并联。一个医生诊断的艺术纷繁复杂,其中很重要的一条就是看他怎么把各种手段组成有他自己特点的串并联电路并应用于病人。

      水平高超的医生通过经验和逻辑会选择尽量少的检查,通过合理安排其排列次序达到很高的效率--这就是决策树,学管理的河友应该并不陌生。另一方面,如果社会对医生的压力太大,特别是保险公司/医患矛盾过于突出,要求医生举证的责任过大,那么出于理性的自我保护,医生也许就会牺牲效率,而选择另外的电路排列方式,最大限度地保护自己。

      闲话扯回来。说说串并联。

      串联检查,就是先进行检查A,如果有问题/发现阳性再进行检查B。数学上可以推导,给定两种方法的敏感度和特异度之后,串联可以提高整体的特异度,但是降低了整体的敏感度。

      这样的好处是尽量减少假阳性,特别在检出阳性结果可能带来巨大的社会心理影响的时候。最典型的是HIV感染的检测,先要初筛,初筛阳性之后再做确诊检测。

      并联检查,就是同时进行A和B检查。并联检查的结果判定又分为两种

      1。A和B同时为阳性时判定为阳性

      这种和串联检查其实没什么太大的差别(不能说完全一样),现实意义下的主要差别是你一次掏钱的数目。时间上串联可以有一部分人不做第二个检测,少掏一些钱。

      2。A或B为阳性时判定为阳性

      这种是真正意义上的并联检查。本着宁可错杀1000,不可放过一个的空一格精神,这种方法提高了敏感度,但降低了特异度。

      于是我们只能感叹,天下没有免费的午餐!

      但是免费的午餐还不止于此。

      土鳖抗铁牛

    • 家园 漫谈体检策略-统计相关的故事(五)

      为什么两个医生都相关?

      其实万变不离其宗,还是一个“人群”的问题。

      检验科医生面对的是所有送来的样本--注意,不是全人群的随机样本--是各个科室医生觉得需要做这个检查的就诊者和自己要求做这个检查的就诊者的样本。

      太复杂了对吧。所以这个人群实在没法定义,各家医院面对的人群也完全不一样,于是很多临床上的检测报告在各家医院之间有时候就是不能以同样的标准来解释了--楼歪出去,现实大量的重复检测,一部分是因为某些人想赚钱,一部分是因为某些医院的检测水平比较低/检测方法比较差,另一家的医生不相信,还有一部分是因为各个医院的检验科其实下结论的人群都不一样,潜移默化里面会对所下的结论有不同的影响。

      这就是检验科医生的描述所对应的人群。

      再回头看肿瘤科医生的话。

      这个就更复杂一些了--学医不是那么容易的,虽然很多患者久病成良医了,但是如果一知半解去跟医生争论该怎么治,那还是很容易出问题的--又歪了,搬回来。

      肿瘤科医生其实需要做一连串的判断:

      1。医生是不是相信这个检查

      另一个条件概率-给定他经验所及的会来找他看病的人群,这个检查结果是否可信的条件概率

      2。根据某一位就诊者既往资料和现有的检查决定是否要做某一个检查

      这是一个条件概率

      3。相信这个检查结果,这个结果代表什么

      如果这个检查结果可信,那么预期疾病进展的条件概率

      这就是肿瘤科医生的故事。

      于是我们可以对照着这位去体检的哥们,看看他到底得了一个什么回答呢

      土鳖抗铁牛

    • 家园 漫谈体检策略-统计相关的故事(四)

      某个方法适合你么?

      或者换个说法,用三段论把这个问题分解一下就是:某个检测方法是不是适合用于某个人群?(大前提)而“我”是不是属于这个人群?(小前提)于是我们可以看到,这两个问题的答案排列组合是:

      是-是 适合

      是-否 不适合

      否-是 不适合

      否-否 不知道

      显然只有第一种情况下我才会推荐您去做某个检查。这就是体检策略最基

      本的逻辑框架。于是我们需要做的就是回答以上这两个问题了。

      小前提:

      Who am I ?

      无论您是否看了前两天的吵架贴,只要您仔细看本系列之前的几篇,您应该已经想到了这个“我是谁”的问题。这个该由谁来判定呢?可以是您自己,也可以是别人,总之您得做个判定。如果把自己判错了群体,那么结果就很可能很难解释。

      大前提:

      某个检测方法是否适合用于某个人群,我们用“预测值”来判断。预测值分两种,阳性预测值和阴性预测值,之前的贴里已经说过基本定义。

      这两个指标受制于:

      1,检测方法本身的能力,也就是敏感度和特异度

      2,被检测人群的患病率

      假设有10000人的一个一般人群,对自己啥都不知道,但真实的癌症患病率是0。5%,也就是50人。

      再假设某种方法敏感度特异度都是90%

      那么会有50*90%+9950*(1-90%)=1040人检出阳性

      其中45人是真的病人,阳性预测值是45/1040

      如果敏感度90%,特异度70%,那么阳性预测值就只有45/3030了

      1040或者3030个检测“阳性”的里面只有45例是真的。

      如果这个人群里有500人感觉不好或者简单体检发现可能有问题,而这500人里面包含了40位癌症患者,也就是8%的患病率

      同理可得,敏感度特异度都是90%,阳性预测值是36/91

      如果敏感度90%,特异度70%,阳性预测值是36/181

      看上去比前面的好多了。

      这就是检验科医生说的故事,但同时也是肿瘤科医生说的故事。

      到底怎么回事?

      土鳖抗铁牛

    • 家园 漫谈体检策略-统计相关的故事(三)

      如果答两个都对(10分里可以得2分,如果任选其一可以得1分)。剩下的8分要求解释其成立的条件,并叙述结论适用的范围。

      于是事情要从头开始慢慢讲起了

      所有检查方法都得有个“好坏”的评价。评价自然需要设定标准。一般情况下,病理学检查是“金指标”。但有一个经典的玩笑:病理医生是对疾病了解得最深最透彻的,只是太晚了--总不能等尸检结果之后再做诊断治疗吧跑提了,撤回来。

      设定了金指标后,每一种诊断技术都要对一系列标准对象进行检测,并以金指标判断这个检测是否正确。衡量这种技术的指标有两个:

      第一个叫做敏感度。

      所谓敏感度,就是在确定是病人(令其为“阳性”)的情况下正确地检测出阳性的概率。

      相对应的另一个指标是特异度,就是确定不是病人/确定阴性的情况下,正确地检测出阴性的概率。就是说一个人没病,做了一个检查,查出来他没病的概率。

      世上没有完美的事情,所以一般来说敏感度和特异度都不会是100%。

      两个指标的下限是都50%(如果低于50%,直接把阴性阳性倒一下就可以了),比如用“眼光注视法”判断一个人是否感染了HIV,这种方法的敏感度和特异度应该都接近50%--也就是胡扯。

      显然,我们总希望两个指标越高越好,但是世事非我等能所设计,往往两者只能顾及一头。于是我们可以看到林林总总的方法,有的敏感度高,有的特异度高。如果有人跑来跟你说两个都高,而你又不懂其内部的机制的化,最好还是留个心眼,就好像面对一个投行的跑来跟你说这个投资回报极高同时风险极低一样--不是说没有这样的事情,但是如此神奇的东西迄今实在不太多,哪怕在飞速发展的医疗技术领域。

      如果知道了某个方法的敏感度和特异度,我们判断出“好坏”了,这个方法就一定适用于你么?

      土鳖抗铁牛

      • 家园 这个似乎有点小问题

        比如用“眼光注视法”判断一个人是否感染了HIV,这种方法的敏感度和特异度应该都接近50%--也就是胡扯。

        肯定不应当是这个数。按这个算的话F-score有50%,这在疾病检测中是非常高的了。

分页树展主题 · 全看首页 上页
/ 3
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河