השימוש ב- AI גנוצרי לאבחון משך תשומת לב בתחום הרפואי ומאמרי מחקר רבים פורסמו בנושא זה. עם זאת, מכיוון שקריטריוני ההערכה היו שונים עבור כל מחקר, היה צורך בניתוח מקיף כדי לקבוע את מידת ה- AI ניתן להשתמש במסגרות רפואיות בפועל ואילו יתרונות הוא הציג בהשוואה לרופאים.
קבוצת מחקר בראשות ד"ר הירוטקה טקיטה ופרופסור חבר דאיג'ו אודה בבית הספר לרפואה של אוניברסיטת אוסאקה מטרופוליטן, ערכו מטה-אנליזה של יכולות האבחון של AI של AI באמצעות 83 מאמרי מחקר שפורסמו בין יוני 2018 ליוני 2024 שכיסו טווח רחב של מומחיות רפואיות. מבין דגמי השפה הגדולה (LLMs) שניתחו, Chatgpt היה הנחקר ביותר.
ההערכה ההשוואתית העלתה כי מומחים רפואיים היו בעלי דיוק אבחוני גבוה של 15.8% מאשר AI גנוצרי. הדיוק האבחוני הממוצע של AI הגנריטיבי היה 52.1%, כאשר המודלים האחרונים של AI הגנריטיבי הראו לעיתים דיוק בשווה לרופאים שאינם מומחים.
מחקר זה מראה כי יכולות האבחון של AI של AI דומות לרופאים שאינם מומחים. זה יכול לשמש בחינוך רפואי כדי לתמוך ברופאים שאינם מומחים ולסייע באבחון באזורים עם משאבים רפואיים מוגבלים. יש צורך במחקר נוסף, כמו הערכות בתרחישים קליניים מורכבים יותר, הערכות ביצועים באמצעות רשומות רפואיות בפועל, שיפור השקיפות של קבלת ההחלטות של AI ואימות בקבוצות חולים מגוונות, כדי לאמת את יכולות ה- AI. "
ד"ר הירוטקה טאקיטה, בית הספר לתארים מתקדמים באוניברסיטת אוסאקה מטרופוליטן
הממצאים פורסמו ב NPJ רפואה דיגיטליתו