你所在位置: 首页 Breast Imaging Events

公共数据能否加快DBT人工智能的发展?

2021-08-31 11:19

数字乳腺体层合成(DBT)仍然是人工智能(AI)算法面临的最棘手的挑战之一。如果公共数据库中提供更多DBT数据,能否克服这一挑战?这个问题在8月16日的JAMA Network Open发表的文章中有了答案。


北卡罗来纳州Duke University的Mateusz Buda领导的研究团队写道:问题一部分来自于如何收集大量DBT数据并将其公开,这是一项棘手的任务。原因有很多,尤其是对患者医疗信息的隐私的要求。


“医学影像自然而然就是深度学习算法的应用,”研究者写道“然而,精心规划收集的数据很少有,这给训练和验证深度学习模型带来了挑战。”


美国每年进行近4000万次乳腺癌筛查检查。尽管人们对将人工智能应用于乳腺X射线摄影的兴趣很高,但开发有效的算法很困难,特别是对于DBT摄影。


为此,Buda和同事试图创建一个系统地标注DBT图像的数据集,用于创建乳腺癌筛查的AI算法(标注包括记录已经活检的肿块或结构扭曲。)


研究者从2014年8月至2018年1月在杜克大学进行的16,802个DBT案例中收集信息,每个病例至少包括一个DBT重建视图。他们从5,610个案例中筛选出22,032个DBT重建图像,进行匿名化处理,并将其分成训练集和测试集,用于深度学习模型。在模型的敏感度评估中,研究者以每个DBT数据发生两个假阳性为上限阈值。


这些研究分为以下四类:


l 5,129个正常案例(91.4%)


l 280个提示需补充其他影像学信息,但未进行活检(5%)


l 112个经活检证实为良性的病例(2%)


l 89个癌症病例(1.6%)


AI模型表现如何?该小组指出,在418名患者的460次检查中,敏感度为65%(每个DBT案例允许两个假阳性上限)。尽管这个性能显得一般,但与之前研究相比有所提高:以前研究中敏感度低于20%(每个DBT案例允许两个假阳性上限)。


很明显,要使AI用于DBT检查,还需要更多的工作。Buda和同事写道:“[该数据集]是一个具有挑战性但很现实的基准工作,用于未来在DBT图像中检测肿块和结构扭曲算法的开发。”研究者已将数据集发布在癌症影像档案中,并计划向公众公布其模型。研究者总结道:“[公开数据集]将允许其他学术团体用其进行算法训练,并在同一数据集上进行测试,这可以提高模型的质量和进行不同算法之间的比较。”


重要的努力


UCLA大学的Joann Elmore博士和西雅图华盛顿大学的Christoph Lee博士在随附的评论中写道:该AI模型的表现并不出色,但将AI与DBT结合使用是一项艰巨的任务。两人指出“与其他一些被报道用于乳腺X射线摄影的商业化AI产品的性能相比,他们的模型的性能并不是那么出色。然而,与二维数字乳腺X线摄影相比,让AI在DBT中检测出乳腺癌仍然是众所周知的挑战。”


Elmore和Lee写到:Buda团队已经做出了宝贵的努力。测试和训练人工智能算法需要大量的数据,由于缺乏大规模的公共数据集,人工智能算法的发展受到阻碍。“Buda等人正在迎难而上,公开他们

注释的图像数据集,包括他们实验的完整代码和加权网络模型结构。研究者的科学精神值得赞扬,我们认为这是向前发展的标志:科学家们共享数据和代码,推动人工智能在医学领域的发展。”


本篇为新闻译文,全篇原文发表于AuntMinnie.com,作者为该网站特约撰稿人Kate Madden Yee