返回

新研究發現多種人工智慧演算法在檢測糖尿病視網膜病變方面存在性能差異

-Diabetes Care

2021年3月17日 · 人工智慧醫學

糖尿病仍然是美國成人失明新病例的主要原因。糖尿病視網膜病變是導致視力下降的最常見的糖尿病相關眼病。但是,目前缺乏眼科保健提供者,這將不可能滿足為這一人群提供必要的年度篩查的需求。一項新的研究考察了七種基於人工智慧的篩查演算法在診斷糖尿病視網膜病變方面的有效性。相關研究結果於2021年1月5日線上發表在Diabetes Care期刊上,論文標題為“Multicenter, Head-to-Head, Real-World Validation Study of Seven Automated Artificial Intelligence Diabetic Retinopathy Screening Systems”。

圖片來自Diabetes Care, 2021, doi:10.2337/dc20-1877

在這項研究中,研究人員將這些演算法與視網膜專家的診斷專業知識進行了比較。5家公司開發了這些測試演算法:兩家在美國(Eyenuk,Retina-AI Health),一家在中國(Airdoc),一家在葡萄牙(Retmarker)和一家在法國(OphtAI)。

這些研究人員將基於演算法的技術部署在2006年至2018年期間在退伍軍人事務普吉特海灣衛生保健系統(Veterans Affairs Puget Sound Health Care System)和亞特蘭大退伍軍人醫療保健系統(Atlanta VA Health Care System)尋求糖尿病視網膜病變篩查的近2.4萬名退伍軍人的視網膜圖像上。

這些研究人員發現,這些演算法的性能並不像它們聲稱的那樣好。其中的多家公司在臨床研究中報告了出色的結果。但是,它們在真實世界環境中的表現是未知的。他們進行了一項測試:每種演算法的性能和在VA遠距離視網膜篩查系統中工作的人類篩查員的表現都與專家眼科醫生在查看相同圖像時給出的診斷進行了比較。與醫生的診斷相比,有三種演算法表現相當好,一種演算法表現較差。但在這項測試中,只有一種演算法的表現與人類篩查人員一樣好。

論文第一作者、華盛頓大學醫學院眼科助理教授Aaron Lee說,“令人震驚的是,雖然這些演算法在世界上的某些地方被使用,但是它們的表現並不一致。”

攝像設備和技術的不同可能是一種解釋。這些研究人員表示,他們的試驗表明,對於任何想要先使用人工智慧篩選演算法進行測試並遵循如何正確獲取患者眼睛圖像的指導原則的實踐來說,這有多麼重要,這是因為這些演算法被設計為在最低品質的圖像上工作。

這項研究還發現,在分析來自西雅圖和亞特蘭大保健系統的患者群體的圖像時,這些演算法的性能有所不同。這是一個令人驚訝的結果,這可能表明這些演算法需要用更多類型的圖像進行訓練。