蓝鱼o_0 发表于 2012-8-2 10:33

[转]诊断准确性性试验的设计、统计分析与解释要点(读Clinical Chemistry统计学系列论

本帖转自丁香园hzdlj版主的心得分享。感觉非常有价值,分享给大家。

近期Clinical Chemistry隆重推出了四篇关于诊断性试验设计、数据处理和解释方面的论文,在版面上我曾经做过相应的介绍,详见:
【专题】Cliinical Chemistry内容预告:聚焦统计


应该说,这四篇论文都属于重量级的论文,四位在诊断学领域一流的专家轮流坐庄,从不同的方面重点阐述了诊断性试验设计、数据处理与解释方面的内容。
Bossuyt PM:Clinical Chemistry的编委,诊断性试验报告规范(STARD)的起草人之一,同时还参与了诊断性试验评价工具(QUADAS)的制定者之一,其在诊断性试验领域的学术地位由此可见一斑。
Reitsma JB:也是STARD报告规范的起草人之一。
Moons KG和Linnet K的学术背景我不是很熟悉,不过参考文献中列出了很多他们发表的文献,看得出他们是这个领域的实力派!
另外,再向大家介绍两个诊断性试验设计领域的专家:Pencina MJ和Nancy Cook。

从即日其,我将在这四篇论文上线的第一时间向大家提供全文;同时也将在本帖中记录自己的学习心得体会,希望借此能够实现和广大战友的进行广泛且深入的交流,同时也督促自己学习此方面的知识。
需要说明的几点是:
1,本人才疏学浅,对其中部分内容的理解可能有失偏颇,希望各位战友砖下留情,同时欢迎各位战友批评指正。
2,希望大家不要转帖这个贴子的内容,小弟我身为丁香园检验板的版主,当然希望检验板的人气越来越旺,点击率越来越高,如果贴子都被转走了,谁还关注检验板呢?
3,希望大家深入讨论,跟帖尽量不要是“mark”,“顶”之类的内容,虽然这样的回帖可以极大地满足我的虚荣心,但是实在不利于版面整洁,更不利于问题的深入讨论。
4,敬告某些同志,如果在讲课的时候需要引用本帖的文字,请在幻灯片右下角注明:转自丁香园检验板H版的贴子,至少也应该在口头上说一下这些内容与丁香园检验板H版有关。虽然我只是谈论了自己的学习体会,并不是原创了这些学术思想,但是这个贴子的每一句话都是我在读懂了原文的基础上用自己的语言总结概括的,并不是Ctrl+C和Ctrl+V来的,也不是直接的翻译内容。不要怪我斤斤计较,我本草根,也逃不出“名利二字”。


Linnet K, Bossuyt PM, Moons KG, Reitsma JB.Quantifying the accuracy of a diagnostic test or marker. Clin Chem2012;58:XXX–XXX
http://www.clinchem.org/content/early/2012/07/13/clinchem.2012.182543.abstract


作为四篇论文里面的第一篇,作者首先介绍了这四篇论文的关系,这幅图一览无余地表示出了诊断性试验的三个层次:能不能做(实验室检测能力如何)----诊断得准不准(诊断效能如何)-----有没有用(一切不能使患者、患者家属和社会获益的实验室检查手段都是耍流氓!)

方法学的验证一个标志物(biomarker)或者检查手段(test)在应用于临床之前,必须首先经过方法学的验证(analytical validity),这就是我们检验的人开口闭口都在谈论的线性,精密度、携带污染、生物变异等,同时还应该兼顾检测周期、取材难易、检测费用等。当然,这不是本文需要重点阐述的内容,所以作者就不多讲了。
当一个实验室标志物或者检测手段在性能上已经能达到临床要求的时候,就可以考虑开展临床试验进行评价了,这就是所谓的(Clinical Validity),从诊断的角度来讲,这就需要做诊断性试验。当然,实验室标志物或者检测手段还有别的意义,比如预后评估、疾病筛查、危险分层、治疗依据等,因为不属于本文的重点,作者也没有讨论了。

从诊断性试验的实施目的来讲,主要是要明确三个问题:
第一,这个标志物(或者检测手段)的诊断性能如何?
第二,这个诊断标志物(或者检查手段)和其它已知的标志物进行比较,孰优孰劣?
第三,这个标志物(或者检查手段)是否能提供常规手段所不能提供的信息(added information beyond well-established markers)?这篇综述主要就是讲前两个问题的。

这里还要提前预告一下BossuytPM的那篇综述:Beyonddiagnostic accuracy: the clinical utility of diagnostic tests。这篇综述实际上就是将上面那幅图右下角的内容的:把疾病诊断正确了,不一定意味着对病人有益。因此我们需要把眼光放长远点,多考虑一下:检测这个东西对病人有没有好处。这篇论文前几天我下载了,初步阅读了一下,本来想向大家推荐的,但是发现Clinical Chemistry又把它撤回去了,估计有些内容还要变,因此我就不发上来了。仅讨论第一篇综述的内容。

诊断性试验设计要点(盲法、代表性和独立)在谈论到诊断性试验设计要点时,Linnet反复强调:“盲法、代表性和独立”是影响诊断准确性试验的三个最主要的因素:
盲法:标志物的检测和临床解释最好采用盲法(最好是双盲),避免偏倚,实际上,这在QUADAS标准中是有规定的。
代表性:所招募的病人应该能够代表临床工作中意见的实际情况,一般最好是连续招募。多与部分发病率极低的疾病,可以采取类似于巢式病例对照研究的设计方案。QUADAS和STARD都涉及了此方面的内容。
独立:待评价评价试验不能作为疾病的诊断标准之一,说得再直白一点,就是“公检法”要分家。

ROC曲线的是是非非在谈到ROC曲线时,作者强调了几个问题:
最好给出曲线下面积的95%CI。
最佳诊断界值的确定应该根据专业需求而定,有的疾病强调的是敏感性,而有的疾病则强调特异性。
作者还介绍了一些基本的概念:敏感性、特异性、似然比、预测值、优势比等,相关书籍上均有,就不一一介绍了。

两个标志物(检验手段)诊断效能的比较可以直接比较ROC曲线下面积,目前ROC曲线下面积的比较有参数法和非参数法,分别由Hanley和Delong等提出,目前以Delong的方法认可度较高。
但事实上广比较ROC曲线下面积有时容易误导人,因为ROC曲线的走形也是很重要的。
为了稳妥起见,最好根据专业确定一个界值以后,以McNemar法来比较诊断效能的差异。其实这个问题前段时间在CCLM上讨论过,注意第二篇论文的第一作者也是诊断性试验领域的权威。
Levinson SS. Letter to the editor reply:Statistical methods for assessment of added usefulness of new biomarkers. ClinChem Lab Med. 2011;49(7):1241-1242
Pencina MJ,D'Agostino RB, Vasan RS. Statistical methods forassessment of added usefulness of new biomarkers. Clin Chem Lab Med.2010;48(12):1703-1711.

结语做诊断性试验,最好事先全面学习QUADAS标准,论文写作以前,最好通读STARD报告的全文,并且是按照STARD报告规范来进行撰写。

这篇综述的全文见附件

蓝鱼o_0 发表于 2012-8-2 10:34

本帖最后由 蓝鱼o_0 于 2012-8-2 10:36 编辑

我再转,我转,我转转转!

今天浏览CC网站,发现主编Nader Rifai和副主编Thomas Annesley和责任编辑James C. Boyd撰写了一篇社论:Statistical Methods for Test and Biomarker Evaluation Studies: A Clinical Chemistry Series。在该文中,三位编辑部的老大预告了在接下来(应该还没有确定是哪期)的一期CC中,将刊登四篇关于统计学的综述,四位作者都是统计学大家:Linnet K, Bossuyt PM, Moons KG, Reitsma JB,其中,Bossuyt PM和Reitsma JB是STARD报告规范的起草人之一。

这四篇综述分别是:
Linnet K, Bossuyt PM, Moons KG, Reitsma JB. Quantifying the accuracy of a diagnostic test or marker. Clin Chem 2012;58:XXX–XXX.
应该是讲怎样评价一个实验室标志物诊断准确性的论文。
Moons KG, de Groot JA, Linnet K, Reitsma JB, Bossuyt PM. Quantifying the added value of a diagnostic test or marker. Clin Chem. Forthcoming 2012;58.
应该是讲如何评价一个标志物增加了常规标志物所不能提供的诊断信息的。
Reitsma JB, Moons KG, Bossuyt PM, Linnet K. Systematic reviews of studies quantifying the accuracy of diagnostic tests and markers. Clin Chem. Forthcoming 2012;58.
系统综述中的统计学问题,要写meta的一定要关注了!
Bossuyt PM, Reitsma JB, Linnet K, Moons KG. Beyond diagnostic accuracy: the clinical utility of diagnostic tests. Clin Chem. Forthcoming 2012;58.
这篇论文前几天上线了,主要是站在临床的角度看标志物的诊断效率,提出了很多突破检验界常规思维的观点,他论述的重点是:准不准和有没有用是两回事。我曾仔细拜读过,有让人醍醐灌顶的感觉。但不知道为什么,这几天把它撤下来了。

这四篇综述绝对是精品中的精品,如果完全能领会其内容,按照他们的要求进行统计,自己的论文在统计学处理环节极有可能是无懈可击的!

大家拭目以待吧!

社论在附件中。


页: [1]
查看完整版本: [转]诊断准确性性试验的设计、统计分析与解释要点(读Clinical Chemistry统计学系列论