בדיקות גופניות הן כלי אבחון חשוב שיכולים לחשוף תובנות קריטיות לגבי בריאותו של המטופל, אך ניתן להתעלם ממצבים מורכבים אם לרופא חסר הכשרה מיוחדת בתחום זה. בעוד מחקרים קודמים חקרו שימוש במודלים של שפה גדולה (LLMs) ככלים לסיוע במתן אבחונים, השימוש בהם בבדיקות גופניות נותר ללא ניצול. כדי להתמודד עם הפער הזה, חוקרים מגנרל Mass Brigham הניעו את LLM GPT-4 להמליץ על הוראות בדיקה גופנית על סמך תסמיני המטופל. המחקר מצביע על הפוטנציאל של שימוש ב-LLM ככלי עזר לרופאים במהלך בדיקות גופניות. התוצאות מתפרסמות ב- כתב העת לבינה מלאכותית רפואית.
אנשי מקצוע רפואיים בתחילת הקריירה שלהם עשויים להתמודד עם אתגרים בביצוע הבדיקה הגופנית המותאמת למטופל בגלל הניסיון המוגבל שלהם או גורמים תלויי הקשר אחרים, כגון הגדרות נמוכות יותר. ללימודי תואר שני יש את הפוטנציאל לשמש כגשר ולתמוך מקביל לרופאים ולאנשי מקצוע רפואיים אחרים עם טכניקות בדיקה גופנית ולשפר את יכולות האבחון שלהם בנקודת הטיפול."
מארק ד. סוצ'י, MD, סופר בכיר, מנהיג חדשנות אסטרטגית ב-Mass General Brigham Innovation, יו"ר עמית לחדשנות ומסחור עבור רדיולוגיה ארגונית ומנהל בכיר של חממת הפתרונות המהנדסים רפואיים בבריאות (MESH) בחממת Mass General Brigham
סוצ'י ועמיתיו הניעו את GPT-4 להמליץ על הוראות בדיקה גופנית בהתבסס על הסימפטום העיקרי של המטופל, למשל, ירך כואבת. התגובות של GPT-4 הוערכו לאחר מכן על ידי שלושה רופאים מטפלים בסולם של 1 עד 5 נקודות בהתבסס על דיוק, מקיפות, קריאה ואיכות כללית. הם גילו ש-GPT-4 עשה ביצועים טובים במתן הוראות, וקלע לפחות 80% מהנקודות האפשריות. הציון הגבוה ביותר היה עבור "כאבי רגליים בעת מאמץ" והנמוך ביותר היה עבור "כאבי בטן תחתונה".
"GPT-4 פעל היטב מבחינות רבות, אך מעורפלות או השמטות מדי פעם באזורים קריטיים, כמו ספציפיות אבחון, מזכירים לנו את הצורך בשיקול דעת הרופא כדי להבטיח טיפול מקיף בחולים", אמרה הסופרת הראשית אריה ראו, סטודנטית חוקרת ב- חממת MESH לומדת בבית הספר לרפואה בהרווארד.
למרות ש-GPT-4 סיפק תשובות מפורטות, החוקרים גילו שהוא השאיר מדי פעם הוראות מפתח או היה מעורפל מדי, מה שמצביע על הצורך במעריך אנושי. לדברי חוקרים, הביצועים החזקים של ה-LLM מצביעים על הפוטנציאל שלו ככלי למלא פערים בידע של הרופאים ולסייע באבחון מצבים רפואיים בעתיד.