כחלק ממגמה כלל ארצית שהתרחשה במהלך המגיפה, רבים נוספים מהמטופלים של NYU Langone Health החלו להשתמש בכלי רישום רפואי אלקטרוני (EHR) כדי לשאול את הרופאים שלהם שאלות, למלא מרשמים מחדש ולבדוק את תוצאות הבדיקות. רבות מהפניות הדיגיטליות הללו הגיעו באמצעות כלי תקשורת בשם In Basket, המובנה במערכת EHR של NYU Langone, EPIC.
למרות שרופאים תמיד הקדישו זמן לניהול הודעות EHR, הם ראו עלייה שנתית של יותר מ-30% בשנים האחרונות במספר ההודעות המתקבלות מדי יום, על פי מאמר של פול א. טסטה, MD, קצין מידע רפואי ראשי ב-NYU Langone . ד"ר טסטה כתב כי אין זה נדיר שרופאים מקבלים יותר מ-150 הודעות בסל ביום. עם מערכות בריאות שלא תוכננו להתמודד עם סוג זה של תעבורה, הרופאים בסופו של דבר מילאו את החסר, בילו שעות ארוכות לאחר העבודה בסינון הודעות. נטל זה מצוטט כסיבה לכך שמחצית מהרופאים מדווחים על שחיקה.
כעת מחקר חדש, בהובלת חוקרים מבית הספר לרפואה של NYU Grossman, מראה שכלי בינה מלאכותית יכול לנסח תשובות לשאילתות EHR של מטופלים בדיוק כמו אנשי מקצוע הרפואה האנושיים שלהם, ועם "אמפתיה" גדולה יותר. הממצאים מדגישים את הפוטנציאל של הכלים הללו להפחית באופן דרמטי את עומס ה-In Basket של הרופאים תוך שיפור התקשורת שלהם עם מטופלים, כל עוד ספקים אנושיים בודקים טיוטות של AI לפני שליחתן.
NYU Langone בחנה את היכולות של בינה מלאכותית גנרטיבית (genAI), שבה אלגוריתמי מחשב מפתחים אפשרויות סבירות למילה הבאה בכל משפט בהתבסס על האופן שבו אנשים השתמשו במילים בהקשר באינטרנט. התוצאה של חיזוי המילה הבאה היא שצ'אטבוטים של genAI יכולים לענות לשאלות בשפה משכנעת, כמו אנושית. NYU Langone העניקה בשנת 2023 רישיון ל"מופע פרטי" של GPT-4, קרוב משפחתו האחרון של הצ'אטבוט המפורסם chatGPT, שאפשר לרופאים להתנסות בנתוני מטופל אמיתיים תוך הקפדה על כללי פרטיות הנתונים.
פורסם באינטרנט ב-16 ביולי ב רשת JAMA פתוחההמחקר החדש בחן טיוטת תגובות שנוצרו על ידי GPT-4 לשאילתות In Basket של מטופלים, וביקשו מרופאים ראשוניים להשוות אותן לתגובות האנושיות בפועל להודעות אלו.
התוצאות שלנו מצביעות על כך שצ'אטבוטים יכולים להפחית את עומס העבודה של ספקי טיפול על ידי מתן מענה יעיל ואמפתי לדאגות המטופלים. מצאנו שצ'אטבוטים של AI המשולבים ב-EHR המשתמשים בנתונים ספציפיים למטופל יכולים לנסח הודעות דומות באיכותן לספקים אנושיים".
וויליאם סמול, MD, מחבר המחקר הראשי, מרצה קליני במחלקה לרפואה בבית הספר לרפואה של ניו יורק גרוסמן
לצורך המחקר, 16 רופאים ראשוניים דירגו 344 זוגות שהוקצו אקראית של תגובות בינה מלאכותית ותגובות אנושיות להודעות המטופלים על דיוק, רלוונטיות, שלמות וטון, וציינו אם הם ישתמשו בתגובת הבינה המלאכותית כטיוטה ראשונה, או יצטרכו להתחיל מ לגרד בכתיבת הודעת המטופל. זה היה מחקר עיוור, כך שרופאים לא ידעו אם התגובות שהם סקרו נוצרו על ידי בני אדם או על ידי כלי הבינה המלאכותית.
צוות המחקר מצא שהדיוק, השלמות והרלוונטיות של תגובות בינה מלאכותית וספקים אנושיים לא היו שונים סטטיסטית. תגובות AI גנרטיביות עלו על ספקים אנושיים במונחים של הבנה וטון ב-9.5 אחוזים. יתרה מכך, תגובות הבינה המלאכותית היו בסבירות גבוהה יותר מפי שניים (125 אחוזים יותר) להיחשב אמפתיים ו-62 אחוזים יותר להשתמש בשפה המשדרת חיוביות (שיכולה להיות קשורה לתקווה) והשתייכות ("אנחנו נמצאים בזה ביחד").
מצד שני, תגובות בינה מלאכותית היו גם ארוכות יותר ב-38% ובסבירות גבוהה יותר ב-31% להשתמש בשפה מורכבת, כך שיש צורך בהכשרה נוספת של הכלי, אומרים החוקרים. בעוד שבני אדם הגיבו לשאילתות מטופלים ברמה של כיתה ו', בינה מלאכותית כתבה ברמה של כיתה ח', על פי מדד סטנדרטי של קריאה שנקרא ציון Flesch Kincaid.
החוקרים טענו ששימוש בצ'אט בוטים במידע פרטי של מטופלים, ולא במידע כללי באינטרנט, מעריך טוב יותר את אופן השימוש בטכנולוגיה הזו בעולם האמיתי. יהיה צורך במחקרים עתידיים כדי לאשר אם נתונים פרטיים שיפרו במיוחד את ביצועי כלי הבינה המלאכותית.
"עבודה זו מוכיחה שכלי הבינה המלאכותית יכול לבנות טיוטת תגובות באיכות גבוהה לבקשות מטופלים", אמר הסופר המקביל דווין מאן, MD, מנהל בכיר לחדשנות אינפורמטיקה ב-NYU Langone's Medical Center Information Technology (MCIT). "עם אישור רופא זה במקום, איכות הודעות GenAI תהיה שווה בעתיד הקרוב באיכות, בסגנון תקשורת ובשימושיות לתגובות שנוצרו על ידי בני אדם", הוסיף ד"ר מאן, שהוא גם פרופסור במחלקות לבריאות האוכלוסייה תרופה.
יחד עם ד"ר סמול וד"ר מאן, מחברי המחקר מ-NYU Langone היו Beatrix Brandfield-Harvey, BS; זואי ג'ונאסן, דוקטורט; סומיק מנדל, דוקטורט; אליזבת ר. סטיבנס, MPH, PhD; וינסנט ג'יי מייג'ור, דוקטורט; ארין לוסטרליו; Adam C. Szerencsy, DO; סיימון א. ג'ונס, דוקטור; Yindalon Aphinyanaphongs, MD, PhD; וסטיבן ב. ג'ונסון, PhD. מחברים נוספים היו עודד נוב, MSc, PhD, בבית הספר להנדסה Tandon NYU, ובתיה משען ויזנפלד, PhD, מבית הספר לעסקים של NYU Stern.
המחקר מומן על ידי מענקי הקרן הלאומית למדע 1928614 ו-2129076 והקרן הלאומית למדע השוויצרית מעניקה P500PS_202955 ו-P5R5PS_217714.