加拿大国家乳癌筛查研究(CNBSS)筛查试验的缺陷确凿,不能作为筛查指南制订的依据
前言
如果有研究者进行了一项乳腺癌治疗的临床试验,将接受化疗的女性与未接受化疗的女性进行比较,不过:
1. 他们选择了一种过时的化疗药物(类比 CNBSS试验中使用的过时的乳腺X射线摄影设备)
2. 分配入组之前,他们首先确认出患有晚期癌症的女性
3. 他们未将受试者随机分配入组,而是将更多癌症晚期女性分配到治疗组
4. 他们发现,与未进行治疗的对照组相比,治疗并未挽救生命
5. 于是,研究者声称“任何形式的化疗都没有益处”
6. 这种的研究结果,不应通过同行审评,也不应被发表。这才是处理有重大缺陷的临床试验结果的正确方式。
难以想象这样一个乳腺癌“筛查试验”,进行对比的人群是,每年进行乳腺X射线摄影的女性(但使用的是过时X光检查设备)和进行临床乳房检查的女性(也就是接受“常规护理”,发现乳房肿块去看医生的女性),而且:
1. 试验招募的入组者,不具普通人群代表性;
2. 允许招募具有乳腺癌临床症状的女性参与试验(而这些女性无法从筛查中受益);
3. 先对入组女性进行临床乳房检查,找到具有乳腺癌临床症状的女性和有晚期乳腺癌症状的女性(如腋下淋巴结肿大);
4. 在未匿名的名单上进行入组分配,将参与试验的女性有选择地放入任何一组;
5. 将更多患有晚期癌症的女性选择性放入筛查组,而非随机入组;
6. 使用已经过时的、质量差的筛查设备;
7. 在试验开始后7-10 年,筛查组中更多女性死于乳腺癌,筛查没有任何益处;
8. 与所有其他筛查试验的结果相反,这个试验得出的结论是:对 40-60 岁的任何女性进行如下筛查都没有益处
9. 这个研究得到发表,尽管严重违反了随机对照试验的规则,但仍被称为“金标准研究”,并被指导小组用来拒绝女性(特别是 40 多岁的女性)进行乳腺癌筛查。
为什么科学的研究方法在众多癌症治疗临床试验中能被正确运用,但在加拿大国家乳癌筛查研究 (CNBSS) 中却缺严重缺失?
背景
我们最近发表在《医学筛查杂志》上发表论文:“乳腺 X射线摄影筛查的随机试验:一个警示性的故事”(1)。论文研究了多年来针对“加拿大国家乳癌筛查研究(CNBSS)”提出的各种质疑,以及该试验中使用非盲分配造成的不良结果。 CNBSS的研究者多年来一直阻挠对该研究的协调员进行采访,但现在有目击者的证词表明:1)有临床明显癌症症状的女性(无法从筛查中受益)被招募到这些筛查试验中,2)许多人被置于筛查组中;3)用过时的设备进行筛查;4)未进行随机入组导致数据失衡;5)选择性对筛查组不利的方式入组,导致试验结果无效。
基本事实
随机对照试验(RCT)是确定医疗干预效果的最严格、最科学的方法。 RCT 是评估新治疗方法的金标准。众多乳腺癌筛查的随机对照试验(加拿大国家乳腺癌筛查研究CNBSS除外)已经证明,早期发现可以挽救 40-74 岁女性的生命,这些女性的年龄与参与的参与试验的女性年龄段相同。
1980 年代在加拿大进行了两项 随机对照试验,统称为加拿大国家乳房筛查研究 (CNBSS)。 CNBSS1 评估了 40-49 岁女性的筛查,而 CNBSS2 使用不同的方案对 50-59 岁的女性进行了相同的筛查。这些加拿大试验的结果被证明是主要的“异常值”,因为与其他试验不同,它们没有显示对任何年龄的女性进行筛查有好处。他们的结果已被指南小组用来拒绝女性乳腺癌筛查,尤其是 40-49 岁的女性。三十多年来,人们对 CNBSS 的设计、执行和结果一直存在重大担忧,从而质疑其负面结果。一个简单的解决方案是,让一个公正的第三方调查实际发生的情况:采访当年执行分配入组的研究协调员,并保护免受报复。实际上我本人促成了此事,两位评审员被派遣评审CNBCC试验(2)。然而,CNBSS 的研究者们一直阻挠对研究协调员进行采访。最近有目击者站出来提供证词,证明该试验中确实发生了重大违规行为,这解释了发表的结果中出现的数据不平衡。CBNSS试验被破坏,导致其结果不可靠。
RCT非常重要,试验中严格遵守“规则”至关重要,其原因在于:它们的有效性依赖于将大量女性“随机”划分为两个“相同”的群体。随机分配入组是绝对的关键。 RCT 要求效果是:如果不采取任何其他措施,两组中患上乳腺癌的女性数量相同,并且死于乳腺癌的女性数量相同。基本上,筛查组中的每个女性(的性状)在对照组中都有一个(对应的相同性状的)双胞胎。 要做到这一点,随机分配是基本且绝对关键的。
为确保随机分配入组,在分配(盲法)之前对参与者一无所知,避免无意或有意地用造成数据不平衡。理想的RCT筛查试验,首先确定女性试验人群,并且在了解她们的任何其他信息之前,随机划分她们入组。随机分配后,邀请其中一组的女性参加筛选计划,其他女性充当不做筛查的对照组。随着时间的推移,将接受筛查的女性的死亡人数与未接受筛查的对照组女性的死亡人数进行比较。如果试验做得好,被筛查的女性死亡人数较少,并且两组死亡人数的差异具有“统计学意义”,那么这就是筛查和早期发现可以挽救生命的证据。
CNBSS 研究违反了 RCT 试验的基本规则
为了使RCT试验的结果有效,盲法分配是必不可少的。不幸的是,CNBSS 忽略了这一基本规则。恰恰相反,参与 CNBSS试验的女性在分配入组前进行了临床乳房检查(触诊)。有明显乳腺癌临床症状的女性被挑选出来,尽管她们无法从筛查中受益,但仍然被允许继续参加试验。不幸的是,触诊结果被传达给了分配入组的研究协调员。这些违规行为,因女性信息在开放列表中(未匿名),使分配入组变得更加复杂。研究协调员可以将女性分配到任一组中,而非随机入组。这在 RCT 治疗试验或任何其他 RCT试验中绝不会被允许,因为它导致了无法追踪的、破坏随机分配的可能。
从对CNBSS公布数据的分析一直表明:通过对试验记录的审查 (3),试验中违反 RCT 规则的行为确实导致了参与试验者的分配不平衡,并且筛查组中包含更多患癌女性和更多晚期癌症的女性。CNBSS研究者们否认这一点,但他们一直拒绝采访这些试验的协调员,以查明是否发生了非随机分配。现在我们的论文现在证实,通过参与该试验的放射技师的目击证词,确实有已具备癌症临床症状、无法从筛查中受益的女性,被招募参加试验,其中一些有癌症临床症状的女性被非随机地分配到筛查组。这就解释了为什么与其他任何筛查试验不同,筛查组有更多女性腋窝淋巴结癌(晚期癌症),因此至少在 CNBSS1 试验后的 7 年中,筛查组女性死亡人数更高( 4)。
CNBSS试验是唯一未能显示出乳腺X射线摄影筛查益处的试验。 其负面结果已被制定筛查指南的美国预防医学服务工作组 (USPSTF) 等用做依据来抹杀乳腺癌筛查的价值。
历史问题
从 CNBSS(在 1980 年代进行)开始,人们就对试验中使用的乳腺X射线摄影的影像质量提出了担忧。试验中使用的设备远非最先进的。放射科医生没有接受培训,技师也没有接受培训。所有对该试验影像质量的评估都表明:在该试验中,影像质量很差甚至无法接受。低质量反映在筛查中检测到的癌症中只有 32% 仅通过乳腺X射线摄影检测到。这比十年前进行的一项名为“乳腺癌检测示范项目 (BCDDP)” 的结果更糟糕,BCDDP使用更旧的设备,在 1970 年代,其中 42% 的癌症仅通过乳腺X射线摄影检测到。很明显,参与 CNBSS 试验的放射科医生们,没有人站出来捍卫乳腺X射线摄影的质量。甚至试验的医学物理师也担心:“在我作为研究的医学物理师的工作中,我发现了许多关于在乳腺X射线摄影质量的担忧。其质量即使在那个时代(1980年代初),也远低于当时先进的水平” (5)。
乳腺X射线摄影设备的质量问题不仅是由于某些情况下设备不足,而且还源于不适当的影像采集条件以及缺乏对技师和放射科医师的专业培训。我受邀参加的一项审查证实:在大多CNBSS试验中,乳腺X射线摄影设备的质量很差,甚至无法接受 (6,7)。 即使在那个时期,所使用的设备也已经过时。后来筛查指南制订专家组忽略了这一事实,因为他们故意排除了乳腺X射线摄影方面的专家。 我毫不怀疑,这些不专业的指南制订小组成员,错误地认为“乳腺X射线摄影就是拍张乳腺的X光片而已”(实际是个专业的系统工程,远比他们假设的复杂和专业)。
数据显示的主要问题
无论如何,CNBSS 试验中的问题为根本性错误。RCT 的基础在于将女性随机分配入组。 如果这一点受到影响,癌症的分布不是随机的,而是向一组偏移,那么试验结果无效。如前所述,在分配入组之前应对参与试验的女性一无所知,避免有意无意地将最终死于乳腺癌女性更多地偏向分配到某一组。我们看极端情况:如果所有无法治愈的患癌女性都被分配到筛查组,那么该试验尚未开始就注定会失败。随机分配是有效 RCT 的基础和关键。
CNBSS 违反了 RCT 最关键的规则:“盲法分配”。 如果将注定要死于癌症的女性更多分配到其中一组,那么该组死于乳腺癌的女性就会更多,RCT结果将无效。
随着这些年来发表的越来越多临床试验结果,人们担心存在违反随机分配的行为导致试验结果出现偏差。在 40-49 岁的女性中,第一次筛查时有 24 名女性患有晚期癌症。 24 名晚期乳腺癌女性中有 19 人被分配到筛查组,只有 5 人被分配到对照组(这个偏移差异具有统计学意义)。研究者们错误地声称:乳腺X射线摄影发现“更多的一切”,而忽略了 19 例癌症中的17 例在临床触诊检查中就已经很明显的事实。
其他公布的数据强烈表明CNBSS试验入组数据分配不平衡:
与其他筛查试验不同,被分配到筛查组的患有淋巴结阳性癌症(腋下淋巴结癌)的女性人数几乎是对照组的两倍 (8)。
CNBSS1 未筛查对照组的女性 5 年生存率大于 90%,而加拿大国家乳腺癌的 5 年生存率仅为 75%。这可能是因为患有晚期癌症的女性并未平衡地入组到对照组,反而被非随机地分配到筛查组。
在 CNBSS1 试验开始后 7 年中,筛查组中的女性死亡人数再次高于对照组,这可能是因为更多的晚期癌症女性被非随机地分配到筛查组。
如前所述,在筛查组中检测到的癌症中只有 32% 仅通过乳腺X射线摄影检测到(意味着大部分癌症症状明显,容易被检测到)。这不仅支持了以下事实,即在乳腺X射线摄影筛查试验中,检查完全不充分。而且还支持了以下事实:许多临床上症状明显的癌症可能被非随机地分配到筛查组,从而增加了临床症状明显的癌症案例数量。
多年来对入组分配不平衡的担忧一直存在。1995年,我写信给受聘审查入组分配过程的 Brian MacMahon (3):
“我强烈敦促你采访那些参与检查试验女性的人,以及那些参与将她们分配到研究组或对照组的人。然而,我怀疑,如果该试验过程受到损害,参与个体将不愿承认可能产生如此重要后果的行为。要么必须确保他们完全保密(以避免任何报复),要么必须在某种形式的宣誓承诺下接受采访。”
不幸的是,这从未发生。CNBSS研究者们从未允许协调员和护士在免受报复的受保护环境下接受采访。这强烈表明在入组分配过程中存在他们不想为人所知的重大问题。
目击者现已证实:女性是被非随机分配入组
一位参与 CNBSS研究的技师最近站出来,提供了目击者证词:事实上,试验中女性未被随机分配,而患有可能癌症的女性被分配到研究组的人数更多。
“如果患者实际上有任何异常发现,她们就会被纳入研究的 Mammo 组。如果护士增加了一个病人,那么他们经常会在当天晚些时候删除另一个已经在名单上的病人,以便加入一个 Mammo案例。当然,除非那个人也有可疑的发现。当我对此提出质疑时,护士们告诉我,她们可以添加人员,并且对于有临床触诊可疑发现的患者需要一个 Mammo。我该质疑谁?正如向我指出的那样,在我来之前她们已经这样做了很长时间。”
“护士们非常认可这项研究是为了确认研究中触诊部分的重要性,而非Mammo筛查组的重要性。”
“因此,我做过乳腺X射线摄影的这些女性中的大多数,已经有一个预先存在的 HX,包括多个囊肿、穿刺抽吸,或者当天/过去感觉到的可疑东西。”
研究者认为,两组的人口统计信息相似,即可支持入组分配是随机的。然而,在总计超过 80,000 名女性的试验中,即使将多达 100 名或更多患有癌症的女性从对照组转移到筛查组,也不会对人口统计数据产生影响(因此研究者的解释不成立)。
这是如何被允许发生的?
我毫不怀疑,非随机分配不是研究人员的主观意图,但研究设计方案的失误允许它发生。我怀疑以前没有 RCT 经验的协调员和护士只是出于好意,没有意识到他们正在损害试验。然而,临床方案允许非随机分配。数据也是一贯表明实际中发生了这种情况;现在我们有第一手的证据证明这件事发生了。
事实上,CNBSS 临床方案严重违反了 RCT 的基本准则:1)分配入组前的触诊首先确定患有临床明显晚期癌症的女性;2)然后,正如已发表的数据清楚地显示的那样,女性未被随机分配,导致显著的的入组不平衡;3)有明显临床癌症症状的女性被招募参加,并很多被非随机分配,这一事实现在也得到了目击者的证实。这些违规行为已经无可救药地破坏了试验结果。现在很明显,CNBSS 试验从根本上失败,其结果不可靠,不能用于制订筛查指南的依据。
REFERENCES
1. Yaffe MJ, Seely JM, Gordon PB, Appavoo S, Kopans DB. The randomized trial of mammography screening that was not-A cautionary tale. J Med Screen. 2021 Nov 23:9691413211059461. doi: 10.1177/09691413211059461. Epub ahead of print. PMID: 34812692.
2. Kopans DB. NBSS: opportunity to compromise the process CMAJ 1997;157:247
3. Bailar JC, MacMahon B, Randomization in the Canadian National Breast Screening Study: A Review for Evidence of Subversion. Can Med Assoc J 1997;156:193-199.
4. Miller AB, Baines CJ, To T, Wall C. Canadian National Breast Screening Study: 1. Breast cancer detection and death rates among women aged 40 to 49 years. CMAJ. 1992 Nov 15;147(10):1459-76. Erratum in: Can Med Assoc J 1993 Mar 1;148(5):718 Miller AB, Baines CJ, To T, Wall C. Canadian National Breast Screening Study: 1. Breast cancer detection and death rates among women aged 40 to 49 years. CMAJ. 1992 Nov 15;147(10):1459-76. Erratum in: Can Med Assoc J 1993 Mar 1;148(5):718
5. Yaffe MJ. Correction: Canada Study. Letter to the Editor JNCI 1993;85:94
6. Baines CJ, Miller AB, Kopans DB, Moskowitz M, Sanders DE, Sickles EA, To T,Wall C. Canadian National Breast Screening Study: assessment of technical quality by external review. AJR Am J Roentgenol. 1990 Oct;155(4):743-7.
7. Kopans DB. The Canadian Screening Program: A Different Perspective. AJR 1990 155:748-749
8. Miller AB, et al. Canadian National Breast Screening Study: 1. Breast cancer detection and death rates among women aged 40 to 49 years. CMAJ. 1992 Nov 15;147(10):1459-76. Erratum in: Can Med Assoc J 1993 Mar 1;148(5):718