בעוד שטכנולוגיית בינה מלאכותית נמצאת יותר ויותר בשימוש – פורמלית ובלתי פורמלית – כדי לתמוך באבחונים רפואיים, התועלת שלה במסגרות רפואיות חירום נותרה שאלה פתוחה. האם בינה מלאכותית יכולה לתמוך ברופאים במצבים שבהם קבלת החלטות בשבריר שנייה יכולה להוות את ההבדל בין חיים למוות? חוקרים מאוניברסיטת דרקסל העלו את השאלה עם קלינאים במרכז הרפואי הלאומי לילדים בוושינגטון, כדי להבין טוב יותר כיצד ומתי הטכנולוגיה יכולה לעזור להם להציל חיים.
בהנחיית אנג'לה מסטריאני, PhD, בוגרת Drexel שהיא פוסט-דוקטורט ב-NYU Langone Health ואלכסנדרה Sarcevic, PhD, פרופסור במכללה למחשוב ואינפורמטיקה של Drexel ומנהלת המעבדה למערכות אינטראקטיביות למחקר בריאות, הצוות בחן שני סוגים של תרחישים שבהם נעשה שימוש בטכנולוגיית רפואת AI בקבלת החלטות רפואיות בחירום.
בתרחיש הראשון, מידע מפתח המשמש בקבלת החלטות – כולל גיל המטופל, כיצד התרחשה הפציעה וסימנים חיוניים – סונתז והוצג לצוות בזמן אמת. בתרחיש השני, ניתנו המלצות טיפול, בנוסף למידע המסונתז.
בניסוי שכלל 35 ספקי שירותי חירום משש מערכות בריאות, החוקרים גילו שלמשתתפים יש סיכוי גבוה יותר לקבל החלטות נכונות כאשר הן מידע והמלצות בינה מלאכותית סופקו, בהשוואה ללא קבלת תמיכה בבינה מלאכותית.
עם זאת, הם גם גילו שהמשתתפים היו חלוקים בתפיסה שלהם לקבל המלצות מעוזר בינה מלאכותית בזמן חירום רפואי. למרות שרובם העדיפו לקבל המלצות וסינתזה של בינה מלאכותית, לחלק מהרופאים היו חששות שההמלצות עלולות לפגוע בסוכנות ובקבלת החלטות מוטות.
המחברים הציגו לאחרונה את ממצאיו בכנס מכונות המחשוב האמריקאיות בנושא עבודה שיתופית נתמכת במחשב ומחשוב חברתי (CSCW).
למרות שהמחקר שלנו כלל מדגם קטן של ספקי שירותי בריאות, זהו סוג החקירה שתהיה חשובה מכיוון שקהילת רפואת החירום בוחנת כיצד טכנולוגיית בינה מלאכותית יכולה לתמוך בעבודתה מצילת החיים. אין ספק שהטכנולוגיה יכולה להגביר את עבודתם של בני אדם במסגרות רפואיות, אבל ההבנה מתי ואיפה היא מתאימה ומקובלת תהיה המפתח לניווט באימוצה".
אלכסנדרה סרסביץ', דוקטורט, פרופסור, מכללת דרקסל למחשוב ואינפורמטיקה
כדי להגיע לממצאים שלהם, הצוות עיצב תחילה אב טיפוס של תצוגת תומכת החלטות התומכת בינה מלאכותית – המכונה "DecAide" – לשימוש במסגרת החייאת טראומה לילדים. על ידי סקר וראיון של מגוון ספקי רפואת חירום, הצוות השיג הבנה של סוגי המידע שהספקים משתמשים בהם כדי לתמוך בקבלת החלטות במהלך החייאה וכיצד הטוב ביותר להציגו.
עם הנחיה זו, התצוגה קיבלה צורה כרשימה תמציתית של מידע מפתח על המטופל, תוך הדגשת חריגות וקידוד צבע כל שינוי בסימנים חיוניים. גרסה אחת הציגה רק את המידע הזה, בעוד גרסה שנייה הציעה גם המלצה – כמו עירוי דם או הליך נוירוכירורגי – יחד עם ההסתברות להצלחתה בהתבסס על מודל חישוב סיכונים המתבסס על נתוני החייאה מאתר המחקר הראשי, בית החולים הלאומי לילדים.
הצוות העריך את האינטראקציה של המשתתפים עם המערכת על ידי יצירת 12 תרחישי וינייט תסריט שבמהלכם הוצג מידע בהדרגה על חולי טראומה. בתרגיל וירטואלי מתוזמן, 35 ספקים הוצגו כל אחד מהתרחישים הללו בשלושה תנאים: בוויגנט אחד, תצוגת תמיכת ההחלטות לא הציעה מידע או הדרכה מ-AI; במהלך אחר הוא הציע מידע מסונתז בינה מלאכותית ובשלישי, הן הוצעו מידע מסונתז בינה מלאכותית והן המלצה. המשתתפים התבקשו לבצע הערכות בזמן אמת בכל תרחיש ולהחליט אם החולה זקוק להתערבות מצילת חיים, כגון עירוי דם, ניתוח מוח, שחרור חזה או מחט, אינטובציה או ניתוח חזה.
הצוות תיעד כל החלטה בתהליך הטיפול והאבחון של המשתתפים – יותר מ-800 מקרים בסך הכל – תוך השוואה לנתוני האמת הבסיסיים שמהם נוצרו הוויגנטים, כדי לקבוע את דיוק האבחון. כל משתתף גם מילא סקר לגבי אופן השימוש בתצוגת המידע. כדי לבדוק את השפעת אמון המידע וההטיה בתהליך קבלת ההחלטות, באחת מכל שמונה החלטות שהוצגו למשתתפים, תכנתו החוקרים את התצוגה כדי לספק המלצה שגויה.
המשתתפים קיבלו את ההחלטות הנכונות ב-64.4% מהתרחישים כאשר סופקו גם סינתזת מידע בינה מלאכותית וגם המלצה. השיעור ירד ל-56.3% כאשר ניתנה רק סינתזת מידע ללא המלצה ו-55.8% כאשר לא ניתנה תמיכה.
נראה שהטכנולוגיה לא מאטה את קבלת ההחלטות, שכן הזמן שלקח למשתתפים לקבל החלטות נשאר עקבי יחסית בכל שלושת תנאי התצוגה בניסוי. ובמקרים רבים, המשתתפים קיבלו את החלטתם לפני שהמלצה התומכת בינה מלאכותית סופקה על הצג.
עם זאת, השימוש והתפיסה בתמיכת קבלת ההחלטות השתנו מאוד. 18 משתתפים ציינו ששקלו את ההמלצות, אך רק לאחר שכבר קיבלו את החלטתם. 12 משתתפים התעלמו לחלוטין מהמלצות הבינה המלאכותית, בין אם היו חסרים להם ניואנסים או שהמשתתפים לא סמכו על המערכת מכיוון שהנתונים המניעים את ההמלצה שלה לא סופקו. בסך הכל, המשתתפים הביעו פחות דאגות לגבי הצגת מידע מסונתז של AI.
"אנחנו רואים אימוץ הדרגתי של מערכות תומכות החלטות בהתמחויות רפואיות כמו רדיולוגיה, אבל עדיין יש לא מעט היסוס בשימוש בטכנולוגיה החדשה הזו במסגרות רפואיות דינמיות וקריטיות לזמן, כמו רפואת חירום", אמר מאסטריאני. "אמנם יש ראיות לכך שמודלים של AI יכולים לאבחן מחלות ברמות גבוהות של דיוק, אבל אנחנו יודעים שדרוש מחקר נוסף כדי להבין איך הכי טוב לשלב אותו במסגרות קליניות כדי שספקים יתחילו לסמוך ולהשתמש בטכנולוגיה החדשה הזו."
הצוות מציע כי המשך מחקר בתחום זה צריך לכלול מאגרי משתתפים גדולים יותר עם נציגים ממגוון רחב יותר של התמחויות רפואיות וסוגי בתי חולים. הם מציינים שלפני אימוץ כלים כאלה, יש צורך במידע נוסף ותמיכה למנהיגים רפואיים שיחליטו האם וכיצד ליישם אותם וכיצד ליצור מדיניות ברורה סביב השימוש בהם.