你所在位置: 首页 学术分享 DART BOARD

随机对照试验证明乳腺癌筛查可以挽救生命

2020-11-29 10:00

“毫无疑问,仅靠治疗方法的进步可以使乳腺癌的死亡延迟;但是如果及早发现,可以治愈乳腺癌。筛查导致乳腺癌早期发现,从而减少死亡。”

“早期发现乳腺癌可以挽救生命,这是事实。乳腺X射线摄影筛查并不完美:它不能检测到所有乳腺癌;有些乳腺癌在筛查发现时已经转移。但是通过乳腺X射线摄影检查,早期发现已经挽救了数十万人的生命。在我们等待有效治疗乳腺癌的方法,或安全预防乳腺癌的方法(尚不存在)的同时,RCT已经证明:挽救40-74岁女性生命的最佳方法是通过筛查及早发现乳腺癌。

挽救乳腺癌患者生命

自1940年美国康涅狄格州肿瘤登记处开始收集数据以来,美国乳腺癌的死亡率一直没有变化(1)。在美国国家癌症研究所(National Cancer Institute)的指导下,于1974年开始的监视流行病学和最终结果(SEER)计划开始之前,美国没有国家数据库。SEER项目监控美国19个地区的乳腺癌发病率和死亡率,并根据这些数据以推断和了解整个国家的发病率和死亡率。

乳腺X射线摄影筛查始于1980年代中期(2)。正如预期的那样,不久之后的1990年,这是50年来的第一次,乳腺癌的死亡人数开始下降。从那以后,死亡率每年继续下降,因此死于乳腺癌的妇女比过去50年的死亡率要少40%。Hendrick等人估计,自1990年以来,已经挽救了600,000多条生命(3)。关于为什么乳腺癌死亡率如此急剧下降的争议一直存在:一些人声称死亡人数的下降是由于治疗方法的改进。治疗已有所改善,但治疗仍无法治愈晚期转移性乳腺癌。实际上,数据强烈表明死亡人数有所下降,是因为通过筛查早期发现,在可能治愈的情况下(转移扩散之前)治疗乳腺癌。一个支持事实是,自1990年以来,男性乳腺癌死亡率从未下降(4)(乳腺癌治疗方面男性与女性类似),而女性乳腺癌死亡率却一直在稳定地且显著地下降(3)。

乳腺癌早发现早治疗和单纯治疗对于死亡率减少相对贡献的最佳估计,来自于瑞典的两项研究。

第一个研究关于40-69岁(5)的女性中的死亡率:参加筛查的女性与未参加筛查的女性进行了比较。所有人都可以接受现代治疗法,即使不参加筛查的妇女死亡人数也有小幅下降;但是参加筛查女性在10年后的死亡率比未参加筛查女性低10%;筛查参与者在20年后的死亡率更是降低了47%。

在对瑞典超过500,000名妇女进行的超大型跟踪分析中,结果相似。“参加乳腺X射线摄影筛查的妇女在10年内死于乳腺癌的风险在统计学上降低了41%。”导致此临床收益的部分原因是,在接受筛查的妇女中,晚期癌症的发病率降低了25%。

毫无疑问,仅靠治疗方法的进步可以使乳腺癌的死亡延迟;但是如果及早发现,可以治愈乳腺癌。筛查导致乳腺癌早期发现,从而减少死亡。

随机对照试验是证明筛查可以挽救生命的唯一方法

如前所述,仅看女性在发现癌症后的存活时间并不能证明早期发现可以挽救生命。基于女性从诊断到死亡的存活时间进行分析,存在着许多需要注意的偏差,使这个分析复杂化。

如前所述,仅看女性在发现癌症后的存活时间并不能证明早期发现可以挽救生命。基于女性从诊断到死亡的存活时间进行分析,存在着许多需要注意的偏差,使这个分析复杂化。

“前置时间偏差”(Leadtime bias):表示筛查可能会在病程中更早发现癌症,但是该女性,假使没有早发现癌症,也会在同一时间死亡。这里虽然表现出更长的存活时间(从发现到死亡的时间),但是死亡的时间并没有改变。(译者评:参与筛查并发现癌症的女性貌似生存期更长,但实际生命终点没有改变,此筛查无收益)

“选择偏差”(Selection bias):决定参加筛查的女性对健康的意识更强,她们的患癌生命期更长。因此当结果归因于更健康的女性自我选择参与筛查时,会表现出筛查会延长生存期。(译者评:参与筛查的女性更注重健康,此人群本来就可能生存期更长,未必是筛查所致。)

“长度偏差采样”(Length bias sampling):毫无疑问,定期的筛查更有可能发现生长缓慢的癌症(生长极快的癌症不太可能被检测到,并常常在两次筛查之间其临床表现已经很明显)。如果我们比较筛查发现的癌症(生长较慢)的女性与所有类型癌症的女性的生存率,就可能误认为差异是筛查影响的结果。(译者评:如果筛查发现的癌症生长缓慢,致命度相对低,那么筛查发现癌症的患者和所有种类癌症患者相比,表现出患癌后生存期可能更长,但这未必是筛查所致。)

消除这些偏见并证明筛查可以挽救生命的唯一方法是使用随机对照试验(RCT)。RCT的目标是制造两组“相同”的女性人群:一组接受筛查,另一组为未筛查对照组。尽管乳腺癌是一种常见癌症,但实际上每年新发的癌症,每千名女性中只有几例,因此,进行RCT须成千上万的女性参与。

如果女性,在不露信息的情况下,被随机化盲分到两个组,这样避免了分配偏差。如果有足够多的参与者,并且分配过程严格随机,最终形成的两个组将是“相同”的:如果不采取任何筛查措施,那么两个组中将会有同样乳腺癌患者人数,也将会有同样乳腺癌死亡人数。

在RCT中,对一组进行乳腺癌筛查,而另一组充当未筛选的对照。正确执行RCT消除了前面提到的所有“偏差”。除了相同的群体外,RCT的研究对象不是生存率,而是研究绝对的死亡人数(死亡率),这没有偏差。由于不能强迫女性接受筛查,参与筛查的女性是受邀参加的。RCT是“邀请”进行筛查的临床试验。

重要提示:由于是邀请女性参加筛查,所以并非每个女性都会同意参加。如果一名女性被随机分配到筛查组,但她拒绝接受筛查(“不遵从”)并且最终死于乳腺癌,统计中仍然被视为接受筛查组。同样,如果将一名女性被指定到未筛查的对照组,但她在试验之外接受了乳腺X射线摄影检查(“数据污染”)并得以挽救生命,统计中仍将其视为未筛查的对照组。这听起来不合理,但这是防止“自我选择”对临床研究造成偏见所必需的代价。无论如何,重要的是要意识到:由于“不遵从”和“数据污染”的存在,RCT实际低估了乳腺癌筛查的益处。

统计功效和“证明”收益

在设计临床试验时,至关重要的是估算试验是否将有足够的女性人数,使得如果死亡人数下降,则筛查组死亡率和对照组死亡率之间的差异将是“具有统计学意义”。“功效计算”则是在设计试验时进行的,确定两组之间的预期差异,然后估算需要参加人数,使得差异“具有统计学意义”。

由于进行临床试验的成本很高,因此试验涉及人数常常恰好或不足,这样可能结果可能造成误导。如Lachin所说:“ 如果统计检验未能达到“统计学显著性”,检验的功效将成为推论的关键因素。尚未被人们普遍理解的是:未能达到“统计学显著性”通常与临床试验设计的功效不足有关,并非两种被检测疗法之间缺乏差异。因此,样本量不足的临床试验在开始之前就注定会失败,而且实验结果会对确定有效疗法造成困惑。”(7)。

实际上,这正是1993年美国国立癌症研究院(NCI)得出的结论:筛查40-49岁的女性没有益处。NCI犯了一个错误:要求临床试验证明受益,必须在试验开始5年内就体现死亡率降低。由于“长度偏差采样”问题(8),这个要求在科学上是没有意义的(译者评:筛查发现“慢癌”,无法在短短5年内体现死亡率降低)。他们从所有参加试验的40-74岁女性的RCT数据中分离出40-49岁女性数据,并在试验设计不允许这样做的情况下分别进行分析,从而加剧了错误。参加40-49岁年龄段的妇女人数不足,不足以表明NCI在试验开始后的5年内要求的死亡人数下降。RCT的设计,不允许进行计划外的回顾性亚组分析,更何况数量不足缺乏统计功效(9)。试验最终入组了仅仅1/3的所需人数(真正验证40-49岁女性,实验开始5年内乳腺癌死亡率降低,并具有统计学显著性的,所需人数)。事实证明,NCI提出的是一个科学上无法支持的要求,因为在开始试验后至少5年内预计死亡人数不会下降。这个数字还需要几年的时间才能达到统计学显著性(10)。尽管如此,最终该试验已证明筛查对40-74岁的女性有益。

如果RCT包括足够数量女性,并且筛查组死亡人数减少,并且筛查组与未筛查组对照相比死亡人数差异大到“具有统计学意义”,那么就可以证明筛查的益处。实际上,这是证明医疗干预有效的唯一方法,除非医疗干预的收益如此之大以至于不能被忽略(译者评:此处逻辑是,如果临床干预的收益非常大,可以免于RCT验证。如果进行RCT,其对照组人群未进行干预,不能获得收益,对于对照组不人道)。例如,宫颈癌筛查的优势从未在RCT中证明,但是与Pap检测有关的子宫颈癌死亡人数下降幅度如此之大,以至于不能被忽视。在一项研究中,当采用Pap检测法时,死亡率下降了;而在停止检测法时,死亡率又上升了;但随着恢复检测法再次下降。这是个很不寻常的案例。RCT是证明干预效果的最佳方法。

目前已进行了8次乳腺癌筛查RCT(如果将瑞典双郡试验计为两次试验,则为9个)。

1.纽约健康保险计划(HIP)

2.瑞典双郡试验–科帕尔伯格(现达拉马)和奥斯特戈兰

3.马尔默试验

4.斯德哥尔摩试验

5.哥德堡试验

6.爱丁堡试验

7.加拿大国家乳腺癌筛查研究

8.英国年龄试验

 

Duffy等人(11)写了关于这些RCT的非常好的总结。

在纽约进行的健康保险计划(HIP)试验是乳腺癌筛查的第一个RCT。HIP是第一个证明通过筛查及早发现可以减少40-64岁女性死亡的方法(12)。

爱丁堡试验显示受筛查妇女的乳腺癌死亡人数大幅下降(13),但其结果受到了质疑,因为受筛查女性与对照组之间的社会经济因素不平衡。

加拿大试验(CNBSS)实际上是两次试验:一项评估了40-49岁女性的筛查,另一项评估了50-64岁女性的筛查。不幸的是,这些试验的设计和执行不力。除了使用过时的乳腺X射线摄影设备,以及未经培训的技术人员和放射科医生,他们还违反了RCT的主要规定。随机分配对于确保两组相同至关重要,但CNBSS的分配过程非盲,导致更多患有晚期癌症和较大癌症病灶的女性被纳入了筛查组(14)。因此,与爱丁堡的数据一样,CNBSS结果(与其他试验不同,没有显示筛查的益处)应排除在考虑范围之外。

瑞典乳腺X射线摄影筛查试验概述提供了乳腺癌筛查益处的最佳证据(15)。这些试验中的女性仅接受乳腺X射线摄影检查(瑞典的试验中涉及其他乳房临床检查)。在所有试验中,使用最高质量的乳腺X射线摄影设备的瑞典双郡试验显示出乳腺癌筛查的最佳结果:乳腺癌死亡人数减少了30%,并且还显示,死亡人数在数十年后仍继续下降,由于乳腺癌致死可能会发生在多年后(16)。

由于在随访的早期,对缺乏统计功效的数据进行回顾性亚组分析,使用不当,对筛查40-49岁的女性造成了很大的困惑。Hendrick等人(17)在1997年的一项分析中对此进行了澄清,该分析表明:随着随访时间的延长(统计功效的提高),该试验证明了筛查40-49岁女性的益处,与筛查50岁以上的女性一样显著且确凿。没有任何数据支持50岁作为筛查年龄分界,在50岁或任何其他年龄(18),筛查数据不会突然改变。

遗憾的是,从来没有一个RCT来评估筛查间隔(两次筛查之间的时间)的重要性。我们自己的模型和逻辑表明:筛查频率越高,就会挽救更多生命(19)。每年一次乳腺癌筛查似乎是合理的,观察研究表明:每年一次筛查和每两年一次筛查相比,前者发现的癌症的更小且处于更早期阶段。

高风险女性筛查

如前所述,除了身为女性和年龄之外,绝大多数女性(75%)没有明显的患乳腺癌的风险。RCT没有进行风险区分,所有试验均涉及普通人群中的女性。因此,没有证据表明只筛查高危女性会挽救生命,而且我们也不知道哪个女性不会患乳腺癌。所有女性都处于风险之中,在找到准确的方法来确定无风险之前,所有女性都应该接受筛查。

由于某些女性乳腺癌的风险显著增加,建议这些女性除每年进行乳腺X射线摄影筛查外,还可以进行磁共振成像(MRI)检查(但是,这个建议其实并无临床证据)。MRI是检测乳腺癌最灵敏的方法。建议所有女性都应进行年度乳腺X射线摄影检查,高危女性每6个月用乳腺X射线摄影和MRI交叉筛查。

底线

早期发现乳腺癌可以挽救生命,这是事实。乳腺X射线摄影筛查并不完美:它不能检测到所有乳腺癌;有些乳腺癌在筛查发现时已经转移。但是通过乳腺X射线摄影检查,早期发现已经挽救了数十万人的生命。在我们等待有效治疗乳腺癌的方法,或安全预防乳腺癌的方法(尚不存在)的同时,RCT已经证明:挽救40-74岁女性生命的最佳方法是通过筛查及早发现乳腺癌。

 

REFERENCES

1 Anderson WF, Jatoi I, Devesa SS. Assessing the impact of screening mammography: Breast cancer incidence and mortality rates in Connecticut (1943-2002). Breast Cancer Res Treat. 2006 Oct;99(3):333-40.

2 Kopans DB. Beyond Randomized, Controlled Trials: Organized Mammographic Screening Substantially Reduces Breast Cancer Mortality.  Cancer 2002;94: 580-581

3 Hendrick RE, Baker JA, Helvie MA. Breast cancer deaths averted over 3 decades.

Cancer. 2019 May 1;125(9):1482-1488.

4 http://seer.cancer.gov/csr/1975_2010/results_merged/sect_04_breast.pdf  kopTable 4.6   Last accessed 10/24/2020

5 Tabár L, Dean PB, Chen TH, Yen AM, Chen SL, Fann JC, Chiu SY, Ku MM, Wu WY, Hsu CY, Chen YC, Beckmann K, Smith RA, Duffy SW. The incidence of fatal breast cancer measures the increased effectiveness of therapy in women participating in mammography screening. Cancer. 2018 Nov 8.doi: 10.1002/cncr.31840. [Epub ahead of print] PubMed PMID: 30411328

6 Duffy SW, Tabár L, Yen AM, Dean PB, Smith RA, Jonsson H, Törnberg S, Chen SL, Chiu SY, Fann JC, Ku MM, Wu WY, Hsu CY, Chen YC, Svane G, Azavedo E, Grundström H, Sundén P, Leifland K, Frodis E, Ramos J, Epstein B, Åkerlund A, Sundbom A, Bordás P, Wallin H, Starck L, Björkgren A, Carlson S, Fredriksson I, Ahlgren J, Öhman D, Holmberg L, Chen TH. Mammography screening reduces rates of advanced and fatal breast cancers: Results in 549,091 women. Cancer. 2020 Jul 1;126(13):2971-2979. doi: 10.1002/cncr.32859. Epub 2020 May 11. PMID: 32390151; PMCID: PMC7318598.

7 Lachin JM.  Introduction to Sample Size Determination and Power Analysis for Clinical Trials. Controlled Clin Trials 1981;2:93-113.

8 Kopans DB. Screening for breast cancer and mortality reduction among women 40-49 years of age. Cancer. 1994 Jul 1;74(1 Suppl):311-22.

9 Kopans DB, Halpern E, Hulka CA. Statistical Power in Breast Cancer Screening Trials and Mortality Reduction Among Women 40-49 with Particular Emphasis on The National Breast Screening Study of Canada. Cancer 1994;74:1196-1203.

10 Hendrick RE. Smith RA, Rutledge JH, Smart CR. Benefit of Screening Mammography in Women Ages 40-49: A New Meta-analysis of Randomized Controlled Trials.  Monogr Natl Cancer Inst 1997;22:87-92.

11 Duffy SW, Tabar L, Smith RA.  The Mammographic Screening Trials:  Commentary on the Recent Work by Olsen and Gotzsche.   CA A Cancer J Clin.  2002;52:68-71.

12 Shapiro S. Evidence on Screening for Breast Cancer from a Randomized Trial.  Cancer. 1977;39:2772-278

13 Alexander FE, Anderson TJ, Forrest APM, Hepburn W, Kirkpatrick AE, Muir BB, Prescott RJ, Smith A.  14 Years of Follow-up from the Edinburgh Randomised Trial of Breast-cancer Screening.  The Lancet 2000;353:1903-1908.

14 Kopans DB. The Canadian National Breast Screening Studies are compromised and their results are unreliable. They should not factor into decisions about breast cancer screening. Breast Cancer Res Treat. 2017 Aug;165(1):9-15.

15 Nyström L, Rutqvist LE, Wall S, Lindgren A, Lindqvist M, Rydén S, Andersson I, Bjurstam N, Fagerberg G, Frisell J, et al. Breast cancer screening with mammography: overview of Swedish randomised trials. Lancet. 1993 Apr 17;341(8851):973-8. doi: 10.1016/0140-6736(93)91067-v. Erratum in: Lancet 1993 Nov 27;342(8883):1372. PMID: 8096941.

16 Yen AM, Duffy SW, Chen TH, Chen LS, Chiu SY, Fann JC, Wu WY, Su CW, Smith RA,  Tabár L. Long-term incidence of breast cancer by trial arm in one county of the Swedish Two-County Trial of mammographic screening. Cancer.2012 Dec 1;118(23):5728-32. doi: 10.1002/cncr.27580. Epub 2012 May 17

17 Hendrick RE. Smith RA, Rutledge JH, Smart CR.  Benefit of Screening Mammography in Women Ages 40-49:  A New Meta-analysis of Randomized Controlled Trials.  Monogr Natl Cancer Inst 1997;22:87-92.

18 Kopans DB, Moore RH, McCarthy KA, Hall DA, Hulka C, Whitman GJ, Slanetz PJ, Halpern EF.  Biasing the Interpretation of Mammography Screening Data By Age Grouping:  Nothing Changes Abruptly at Age 50.  The Breast Journal 1998;4:139-145.

19 Michaelson JS, Halpern E, Kopans DB. Breastcancer: computer simulation method for estimating optimal intervals for screening. Radiology.1999 Aug;212(2):551-60.