מחקר חדש של חוקרים במערכת הבריאות בהר סיני מציע כי ציוץ פשוט לאופן בו בינה מלאכותית (AI) מקצה קודי אבחון עשויה לשפר משמעותית את הדיוק, ואפילו לעלות על רופאים. הממצאים, שדווחו בגיליון המקוון של ה- 25 בספטמבר של Nejm ai (DOI: 10.1056/AICS2401161), יכול לעזור להפחית את הזמן שרופאים מוציאים על ניירת, לחתוך שגיאות חיוב ולשפר את איכות רישומי המטופלים.
המחקר הקודם שלנו הראה שאפילו ה- AI המתקדם ביותר יכול היה לייצר את הקודים הלא נכונים, לפעמים לא רגישים, כאשר נותר לנחש. הפעם נתנו למודל סיכוי לשקף ולסקור מקרי עבר דומים. השינוי הקטן הזה עשה את ההבדל הגדול. "
אייל קלנג, ד"ר, תואם משותף לסופר בכיר, ראש ה- Generative AI במחלקה לווינדרייך לבינה מלאכותית ובריאות אדם בבית הספר לרפואה איקאהן בהר סיני
רופאים בארצות הברית מבלים שעות בכל שבוע בהקצאת קודי ICD-אלפא-מיתרים, המשמשים לתיאור כל דבר, קרסוליים נקעים ועד התקפי לב. אבל דגמי שפה גדולים, כמו Chatgpt, לעתים קרובות נאבקים להקצות קודים אלה בצורה נכונה. כדי לטפל בכך, החוקרים ניסו שיטה "בדיקת קידוד לפני קידוד" המבקשת תחילה את ה- AI לתאר אבחנה בשפה פשוטה ואז לבחור את הקוד המתאים ביותר מרשימת דוגמאות בעולם האמיתי. הגישה העבירה דיוק רב יותר, פחות טעויות וביצועים בשווי של בני אדם או טובים יותר.
הצוות השתמש ב -500 ביקורי חולים במחלקת חירום בבתי חולים במערכת הבריאות בהר סיני. לכל מקרה, הם האכילו את פתק הרופא לתשעה דגמי AI שונים, כולל מערכות קוד פתוח קטנות. ראשית, הדגמים יצרו תיאור אבחוני ICD ראשוני. בשיטת אחזור, כל תיאור הותאם ל -10 תיאורי ICD דומים ממסד נתונים של יותר ממיליון רשומות בית חולים, יחד עם התדירות האבחנות הללו. בשלב שני, המודל השתמש במידע שאוחזר זה כדי לבחור בתיאור וקוד ICD המדויקים ביותר.
רופאי חירום ושתי מערכות AI עצמאיות העריכו את תוצאות הקידוד באופן עצמאי, ללא מידע אם הקודים נוצרו על ידי AI או קלינאים.
בכל הלוח, דגמים שהשתמשו בצעד האחזור הוציאו את הביצועים של אלה שלא, ואפילו הצליחו יותר מאשר קודים שהוקצו לרופא במקרים רבים. באופן מפתיע, אפילו דגמים קטנים עם קוד פתוח ביצעו היטב כאשר מורשים "לחפש" דוגמאות.
"מדובר על תמיכה חכמה יותר, לא אוטומציה למען האוטומציה", אומר תואם משותף לסופר הבכיר ג'יריש נ. נדקארני, MD, MPH, יו"ר המחלקה לווינדרייך לאינטליגנציה מלאכותית ובריאות האדם, מנהל מכון האסו פלאטנר לבריאות דיגיטלית, ואירן וד"ר ארת'ור מ. פרופסור פרופסור לקצינה של סינאי, אטאיני, אטאיני, אטאייאיי, אטאייאיי, אטאייאיי, אטאיני, אטאיני, אטאיי, אטאיי, אטאיי, אטאיני, אטאייאיי, ומאוט, אטאיאי, ומאסט, "אם נוכל לחתוך את הזמן שהרופאים שלנו מוציאים על קידוד, להפחית שגיאות חיוב ולשפר את איכות הנתונים שלנו, והכל במערכת סבירה ושקופה, זה ניצחון גדול עבור חולים וספקים כאחד."
המחברים מדגישים כי שיטה משופרת זו משופרת נועדה לתמוך, ולא להחליף, פיקוח אנושי. אמנם זה עדיין לא אושר לחיוב ונבדק באופן ספציפי על קודי אבחון ראשוניים מביקורי חירום שפורקו בבית, אך הוא מראה פוטנציאל מעודד לשימוש קליני. החוקרים רואים שימושים מיידיים, כגון הצעת קודים ברשומות אלקטרוניות או שגיאות סימון לפני החיוב.
החוקרים משלבים כעת את השיטה במערכת רשומות הבריאות האלקטרוניות של הר סיני לבדיקת טייס. הם מקווים להרחיב אותו למסגרות קליניות אחרות ולכלול קודים משניים ופרוצדורליים בגרסאות עתידיות.
"התמונה הגדולה כאן היא הפוטנציאל של AI לשנות את האופן בו אנו מטפלים בחולים. כאשר הטכנולוגיה מקלה על הנטל הניהולי של הרופאים שלנו וספקים אחרים, יש להם יותר זמן לטיפול ישיר בחולים. זה טוב עבור הקלינאים, זה טוב לחולים וזה טוב למערכות בריאות בכל גודל", אומר דייוויד ל. רייץ ', הקצין הראשי הקליני של מערכת הבריאות בהר סיני ונשיא בית החולים. "השימוש ב- AI בדרך זו משפר את היכולת שלנו לספק טיפול קשוב וחמלה על ידי בילוי זמן רב יותר עם חולים. זה מחזק את הבסיס של בתי חולים ומערכות בריאות בכל מקום."
העיתון נקרא "הערכת מודלים לשפה גדולה בשליפה לקידוד רפואי."
מחברי המחקר, כמפורט בכתב העת, הם אייל קלאנג, אידיט טסלר, דונלד א. אפאקמה, איתן אבוט, בנימין ס גליקסברג, ארנולד מוניק, אקיני מוזס, אנקיט סאקיון, עלי סורוס, אלכסנדר וו. צ'ארני, דייוויד ל. רייץ ', ניקול, גאווין, גאווין, גאווין, גאווין, גאווין, גאווין, גאווין, ג'יווין, Givy, Givy, Givy, Givy, Govy, Gulevyh, פרימן, וגיריש נדקרני.
יצירה זו נתמכה על ידי פרסי המדע הקליני והתרגומי (CTSA) מענק UL1TR004419 מהמרכז הלאומי לקידום מדעי התרגום. מחקרים שדווחו בפרסום זה נתמכו גם על ידי משרד תשתיות המחקר של המכונים הלאומיים לבריאות תחת מענק מספרים S10OD026880 ו- S10OD030463.