בעת קבלת החלטות אבחנתיות, רדיולוגים ורופאים אחרים עשויים להסתמך יותר מדי על בינה מלאכותית (AI) כאשר היא מציינת תחום עניין ספציפי בצילום רנטגן, על פי מחקר שפורסם היום ב- רדיולוגיהכתב עת של האגודה הרדיולוגית של צפון אמריקה (RSNA).
"נכון לשנת 2022, 190 תוכנות רדיולוגיה AI אושרו על ידי מנהל המזון והתרופות האמריקני", אמר אחד הכותבים הבכירים של המחקר, פול ה.יי, MD, מנהל אינפורמטיקה של הדמיה חכמה וחבר שותף במחלקה לרדיולוגיה ב- בית החולים לחקר הילדים סנט ג'וד בממפיס, טנסי. "עם זאת, נוצר פער בין הוכחת בינה מלאכותית לבין השימוש הקליני בעולם האמיתי שלה. כדי לגשר על הפער הזה, טיפוח האמון המתאים בייעוץ בינה מלאכותית הוא בעל חשיבות עליונה".
במחקר הפרוספקטיבי הרב-אתר, 220 רדיולוגים ורופאים פנימיים/רפואת חירום (132 רדיולוגים) קראו צילומי חזה לצד עצות בינה מלאכותית. על כל רופא הוטל להעריך שמונה מקרי רנטגן בחזה לצד הצעות של עוזר בינה מלאכותית מדומה עם ביצועי אבחון דומים לאלו של מומחים בתחום. הוויגנטים הקליניים הציעו צילומי רנטגן חזה חזיתיים, ואם זמינים, תואמות, שהתקבלו מבית החולים בית ישראל דיאקוניס בבוסטון באמצעות מאגר הקוד הפתוח MIMI Chest X-Ray Database. פאנל של רדיולוגים בחר את מכלול המקרים המדמים פרקטיקה קלינית בעולם האמיתי.
עבור כל מקרה, הוצגו למשתתפים ההיסטוריה הקלינית של המטופל, עצות ה-AI ותמונות רנטגן. בינה מלאכותית סיפקה אבחנה נכונה או שגויה עם הסברים מקומיים או גלובליים. בהסבר מקומי, AI מדגיש חלקים מהתמונה הנחשבים החשובים ביותר. להסברים גלובליים, AI מספקת תמונות דומות ממקרים קודמים כדי להראות כיצד היא הגיעה לאבחנה שלה.
הסברים מקומיים אלו מנחים את הרופא ישירות לאזור הדאגה בזמן אמת. במחקר שלנו, ה-AI ממש שם קופסה סביב אזורים של דלקת ריאות או חריגות אחרות."
ד"ר פול ה.יי, ד"ר, מנהל אינפורמטיקה של הדמיה חכמה וחבר שותף במחלקה לרדיולוגיה בבית החולים לחקר הילדים של סנט ג'וד
הבודקים יכולים לקבל, לשנות או לדחות את הצעות הבינה המלאכותית. הם גם התבקשו לדווח על רמת האמון שלהם בממצאים ובהתרשמות ולדרג את התועלת של עצות הבינה המלאכותית.
בעזרת מודלים של אפקטים מעורבים, למדו את המחברים הראשונים דרו פרינסטר, MS, ו-Amama Mahmood, MS, Ph.D במדעי המחשב. סטודנטים באוניברסיטת ג'ונס הופקינס בבולטימור, הובילו את החוקרים בניתוח ההשפעות של משתני הניסוי על דיוק האבחון, היעילות, תפיסת הרופא לגבי שימושיות בינה מלאכותית ו"אמון פשוט" (כמה מהר המשתמש הסכים או לא הסכים לעצות AI). החוקרים שלטו בגורמים כמו דמוגרפיה של משתמשים וניסיון מקצועי.
התוצאות הראו שסוקרים נוטים יותר ליישר את החלטת האבחון שלהם עם עצות בינה מלאכותית ועברו תקופה קצרה יותר של שיקול דעת כאשר בינה מלאכותית סיפקה הסברים מקומיים.
"בהשוואה להסברים גלובליים של בינה מלאכותית, הסברים מקומיים הניבו דיוק אבחון טוב יותר של רופא כאשר העצות של הבינה המלאכותית היו נכונות", אמר ד"ר יי. "הם גם הגבירו את יעילות האבחון הכוללת על ידי צמצום הזמן שהושקע בבחינת עצות בינה מלאכותית."
כאשר עצת הבינה המלאכותית הייתה נכונה, דיוק האבחון הממוצע בקרב סוקרים היה 92.8% עם הסברים מקומיים ו-85.3% עם הסברים גלובליים. כאשר עצות AI היו שגויות, דיוק הרופא היה 23.6% עם הסברים מקומיים ו-26.1% עם הסברים גלובליים.
"כאשר סיפקו הסברים מקומיים, הן רדיולוגים והן רדיולוגים שאינם רדיולוגים במחקר נטו לסמוך על אבחנה של AI מהר יותר, ללא קשר לדיוק העצות של AI", אמר ד"ר יי.
מחבר שותף בכיר במחקר, Chien-Ming Huang, Ph.D., John C. Malone עוזר פרופסור במחלקה למדעי המחשב באוניברסיטת ג'ונס הופקינס, הצביע על כך שהאמון הזה בבינה מלאכותית יכול להיות חרב פיפיות מכיוון שהוא מסתכן הסתמכות יתר או הטיית אוטומציה.
"כשאנחנו מסתמכים יותר מדי על מה שהמחשב אומר לנו, זו בעיה, כי בינה מלאכותית לא תמיד נכונה", אמר ד"ר יי. "אני חושב שכרדיולוגים המשתמשים בבינה מלאכותית, עלינו להיות מודעים למלכודות הללו ולהישאר מודעים לדפוסי האבחון וההכשרה שלנו."
בהתבסס על המחקר, ד"ר Yi אמר שמפתחי מערכות בינה מלאכותית צריכים לשקול היטב כיצד צורות שונות של הסבר בינה מלאכותית עשויות להשפיע על ההסתמכות על עצות בינה מלאכותית.
"אני באמת חושב ששיתוף פעולה בין חוקרי התעשייה והבריאות הוא המפתח", אמר. "אני מקווה שהמאמר הזה יתחיל דיאלוג ושיתופי פעולה מחקריים עתידיים פוריים."
"אכפת להסביר? סוגי הסברים בינה מלאכותית משפיעים באופן דיפרנציאלי על ביצועי אבחון צילום חזה ואמון הרופא ב-AI." בשיתוף פעולה עם ד"ר יי, ד"ר הואנג, פרינסטר ומחמוד היו סוצ'י סריה, ד"ר, ז'אן ג'ודי, ד"ר וצ'נג טינג לין, ד"ר