כלי אינטליגנציה מלאכותית מסחרית (AI) בשימוש מחוץ לתווית היה יעיל באי הכללת פתולוגיה והיה לו שיעורים שווים או נמוכים יותר של החמצות קריטיות בצילום רנטגן של החזה מאשר רדיולוגים, לפי מחקר שפורסם היום ב- רדיולוגיהכתב עת של האגודה הרדיולוגית של צפון אמריקה (RSNA).
ההתפתחויות האחרונות בתחום הבינה המלאכותית עוררו עניין גובר באבחון בעזרת מחשב, מונע בחלקו מהעומס הגובר שעומד בפני מחלקות הרדיולוגיה, המחסור העולמי ברדיולוגים והפוטנציאל לשחיקה בתחום. לפרקטיקות רדיולוגיה יש נפח גבוה של צילומי חזה חסרי ערך (ללא ממצאים משמעותיים מבחינה קלינית), ובינה מלאכותית עשויה לשפר את זרימת העבודה על ידי אספקת דוח אוטומטי.
חוקרים בדנמרק יצאו להעריך את חלקן של צילומי רנטגן בלתי ראויים לציון שבהם בינה מלאכותית יכולה לשלול פתולוגיה נכונה מבלי להגדיל את שגיאות האבחון. המחקר כלל דוחות רדיולוגיה ונתונים של 1,961 חולים (גיל חציוני, 72 שנים; 993 נשים), עם צילום חזה אחד לכל חולה, שהתקבל מארבעה בתי חולים דנים.
הקבוצה שלנו ואחרות הראו בעבר שכלי בינה מלאכותית מסוגלים לשלול פתולוגיה בצילומי חזה בביטחון גבוה ובכך לספק דיווח נורמלי אוטונומי ללא אדם במעגל. אלגוריתמי AI כאלה מחמיצים מעט מאוד צילומי חזה חריגים. עם זאת, לפני המחקר הנוכחי שלנו, לא ידענו מה הסף המתאים למודלים האלה".
לואי לינד פלסנר, MD, מחבר ראשי מהמחלקה לרדיולוגיה בבית החולים הרלב וגנטופטה בקופנהגן, דנמרק
צוות המחקר רצה לדעת האם איכות הטעויות שנעשו על ידי AI ורדיולוגים הייתה שונה והאם טעויות AI, בממוצע, גרועות יותר מבחינה אובייקטיבית מטעויות אנושיות.
כלי הבינה המלאכותית הותאם ליצירת הסתברות של "הצטיינות" בצילום רנטגן, ששימשה לחישוב סגוליות (מדד ליכולת של בדיקה רפואית לזהות נכון אנשים שאין להם מחלה) ברגישויות שונות לבינה מלאכותית.
שני רדיולוגים בחזה, שהיו עיוורים לפלט הבינה המלאכותית, תייגו את צילומי הרנטגן של החזה כ"מופלאים" או "בלתי ראויים לציון" בהתבסס על ממצאים לא ראויים לציון. צילומי רנטגן של החזה עם ממצאים שהוחמצו על ידי AI ו/או דו"ח הרדיולוגיה דורגו על ידי רדיולוג חזה אחד – עיוורת אם הטעות נעשתה על ידי AI או רדיולוג – כקריטית, משמעותית קלינית או חסרת משמעות קלינית.
תקן הייחוס תייג 1,231 מתוך 1,961 צילומי חזה (62.8%) כמדהימים ו-730 מתוך 1,961 (37.2%) כבלתי ראויים לציון. כלי הבינה המלאכותית הוציא בצורה נכונה את הפתולוגיה ב-24.5% עד 52.7% מצילומי רנטגן לא ראויים לציון ברגישות גדולה או שווה ל-98%, עם שיעורים נמוכים יותר של החמצות קריטיות מאשר נמצאו בדוחות הרדיולוגיה הקשורים לתמונות.
ד"ר פלסנר מציין כי הטעויות שנעשו על ידי AI היו, בממוצע, חמורות יותר מבחינה קלינית עבור המטופל מאשר טעויות שנעשו על ידי רדיולוגים.
"סביר להניח שהסיבה לכך היא שרדיולוגים מפרשים ממצאים בהתבסס על התרחיש הקליני, מה שאין בינה מלאכותית", אמר. "לכן, כאשר בינה מלאכותית נועדה לספק דו"ח נורמלי אוטומטי, היא חייבת להיות רגישה יותר מהרדיולוג כדי להימנע מירידה ברמת הטיפול במהלך ההטמעה. ממצא זה מעניין בדרך כלל גם בעידן זה של יכולות בינה מלאכותית המכסות סביבות מרובות עם סיכון גבוה. לא רק שירותי בריאות."
בינה מלאכותית יכולה לדווח באופן אוטונומי על יותר ממחצית מכל צילומי הרנטגן הרגילים של החזה, לפי ד"ר פלסנר. "באוכלוסיית המחקר שלנו בבית החולים, המשמעות היא שיותר מ-20% מכל צילומי הרנטגן של החזה יכלו להיות מדווחים באופן אוטונומי באמצעות מתודולוגיה זו, תוך שמירה על שיעור נמוך יותר של טעויות רלוונטיות מבחינה קלינית מהסטנדרט הנוכחי", אמר.
ד"ר פלסנר ציין כי יש צורך ביישום פרוספקטיבי של המודל תוך שימוש באחד מהספים שהוצעו במחקר לפני שניתן יהיה להמליץ על פריסה נרחבת.
"שימוש בבינה מלאכותית לזיהוי צילומי חזה בלתי ראויים לדיווח אוטומטי." בשיתוף פעולה עם ד"ר פלסנר היו פליקס סי מולר, MD, Ph.D., Mathias W. Brejnebøl, MD, Christian Hedeager Krag, MD, Lene C. Laustrup, MD, Finn Rasmussen, MD, DMSc., Olav Wendelboe Nielsen, MD, Ph.D., Mikael Boesen, MD, Ph.D., ומייקל B. Andersen, MD, Ph.D.