AI חדש וחזק מנבא כיצד למעלה מאלף מחלות עלולות להתפתח לאורך חייו של אדם, ולפתח דלתות למניעת דיוק, תכנון מדיניות וחדשנות לבריאות מודעת הטיה.
מחקר: לימוד ההיסטוריה הטבעית של מחלות אנושיות עם שנאים גנריים. קרדיט תמונה: song_about_summer / shutterstock
במחקר שנערך לאחרונה פורסם בכתב העת טֶבַעהחוקרים פיתחו מודל למידת מכונה ששימש נתוני בריאות רחבי היקף כדי לחזות את ההתקדמות של 1,256 מחלות ICD-10 ברמה 3 מובחנות על בסיס חולים ' היסטוריות רפואיות בעבר.
המודל הדגים דיוק חזוי הדומה לכלים קיימים המנתחים מחלות בודדות. זה הראה פוטנציאל להדמיית מסלולי בריאות עתידיים לאורך תקופה של עד שני עשורים וסיפק תובנות לגבי סיכונים בריאותיים מותאמים אישית וקומורבידיות.
צורך במודלים מורכבים של מחלות
התקדמות מחלות אנושיות כוללת תקופות של בריאות, מחלה חריפה ומצבים כרוניים, המופיעים לעתים קרובות כאשכולות של קומורבידיות המושפעים מגנטיקה, אורח חיים וגורמים סוציו -אקונומיים.
הבנת דפוסים אלה היא קריטית למתן שירותי בריאות מותאמים אישית, מתן הנחיות אורח חיים ויישום תוכניות סינון מוקדמות יעילות. עם זאת, אלגוריתמים מסורתיים מיועדים בעיקר למחלות בודדות ואינן יכולות לתפוס את המורכבות של למעלה מאלף מצבים בריאותיים מוכרים.
מגבלה זו הופכת חשובה במיוחד בהקשר של אוכלוסיות מזדקנות, בהן נטל המחלות כמו סרטן, סוכרת, מחלות לב וכלי דם ודמנציה צפוי לעלות משמעותית בעשורים הקרובים. דוגמנות מדויקת של מסלולי מחלות חיוניים לפיכך הן לתכנון הבריאות והן למדיניות כלכלית.
בינה מלאכותית, דגמי שפה גדולים במיוחד (LLMS), מספק פיתרון מבטיח. מודלים אלה מצטיינים בתלות למידה על פני רצפי נתונים, בדומה לחיזוי מחלות על בסיס אירועי בריאות קודמים.
בהשראת אנלוגיה זו, החוקרים פיתחו מודלים מבוססי שנאי לחיזוי תנאים ספציפיים, עם עידוד תוצאות מוקדמות. עם זאת, למרות ההתקדמות הללו, לא הוערך מודל מקיף ויציר באמת המסוגל לדמות את הספקטרום המלא של רב -תחומי זמן לאורך זמן.
פיתוח מודל נתונים בקנה מידה גדול
החוקרים יצרו את Delphi-2M, מודל מבוסס שנאי, כדי לחזות מסלולי מחלות לכל החיים. בניגוד למודלים בשפה המעבדים מילים, Delphi-2M עבד עם קודי אבחון מהעדכון העשירי של הסיווג הבינלאומי של מחלות (ICD-10), כמו גם מוות, סקס, BMIוגורמי אורח חיים כמו עישון ושימוש באלכוהול.
כדי לטפל בפערים ברשומות רפואיות, הצוות הכניס אסימונים "ללא אירוע" מלאכותיים. זה כלל אסימוני סקס ואורח חיים, עם אוצר מילים המשתרע על קודי מחלות, רמות אורח חיים, סקס, לא אירוע ואסימוני ריפוד (בסביבות 1,270 סה"כ).
ההדרכה התבססה על רישומי בריאות רחבי היקף של ה- BioBank בבריטניה, הכוללים 402,799 משתתפים לאימונים, 100,639 לאימות, ו- 471,057 לבדיקות אורכיות. כדי לבדוק את ההכללה, המודל אושר גם על נתונים של 1.93 מיליון אנשים דנים.
מספר שינויים התאימו את מודל הבסיס לנתוני בריאות: החלפת קידוד מיקום בקידוד גיל רציף, הוספת ראש פלט כדי לחזות אירוע זמן לשנייה, ושינוי מסכות תשומת לב למניעת אסימונים באותה נקודה להשפיע זה על זה.
Delphi-2M יכול להעריך סיכונים ליותר מ -1,000 מחלות, לחזות את תזמון האבחנות ולדמות מסלולי בריאות מלאים. הביצועים עברו אופטימיזציה באמצעות כוונון Hyperparameter, וכתוצאה מכך מודל פרמטר 2.2 מ 'ששילב דיוק חזוי עם יכולת גנרית, ומספק גישה חדשה למודלים של Multimorbity והתקדמות בריאותית לטווח הארוך.

אסכמטי של מסלולי בריאות המבוססים על אבחנות ICD-10, אורח חיים ואסימוני ריפוד בריאים, שכל אחד מהם נרשם בגיל מובהק. באימונים, אימות ובדיקת נתוני בדיקה הנגזרים מהרישומים הביולוגיים של בריטניה (משמאל) ומרשמי מחלות דניות (מימין). גארכיטקטורת הדגם של דלפי. האלמנטים האדומים מצביעים על שינויים בהשוואה למודל GPT-2 הבסיסי. 'N ×' מציין יישום בלוק השנאי ברצף n פעמים. דדוגמה לקלט מודל (בקשה) ופלט (דגימות) הכוללים זוגות (גיל: אסימון). הקנה מידה של חוקי דלפי, המציג את אובדן האימות האופטימלי כפונקציה של פרמטרי מודל לגדלי נתוני אימונים שונים. גתוצאות אבלציה שנמדדו על ידי ההבדלים בין אנטרופיה חוצה יחסית לקו הבסיס מבוסס הגיל והמין (ציר y) לגילאים שונים (ציר x). זדיוק הזמן החזוי לאירוע. זמני הנצפים (ציר y) והצפוי (ציר x) לאירועים מוצגים עבור כל תחזית הבאה (נקודות אפורות). הקו הכחול מציג את הממוצע על פני פחים רצופים של ציר ה- X.
הערכת ביצועי המודל
הביצועים של Delphi-2M הוערכו באמצעות נתוני בריאות עד גיל 60 מ -63,622 משתתפים בבנקים הביולוגיים בבריטניה. המודל יצר מסלולי בריאות מדומים והשווה אותם עם תוצאות מוחשיות.
תחזיות לשיעורי המחלה בגילאי 70 ו -75 תואמים דפוסים נצפים מקרוב, ומאשרות את יכולתה לתפוס מגמות שכיחות ברמת האוכלוסייה. בעוד שדיוק החיזוי ירד לאורך אופקי זמן ארוכים יותר, מממוצע AUC של כ- 0.76 לכ- 0.70 בעשר שנים, Delphi-2M עדיין הצליח לבצע את הדגמים המבוססים רק על גיל ומין.
המודל הבחין ביעילות בסיכונים בין קבוצות משנה המוגדרות על ידי אורח חיים או מחלות קודמות, ותומך בערכו לפרופיל סיכון מותאם אישית.
חשוב לציין כי Delphi-2M יכול גם לייצר מסלולי בריאות סינתטיים המראים דפוסי מחלות בעולם האמיתי מבלי לשכפל רשומות אינדיבידואליות. מודל שהוכשר אך ורק על נתונים סינתטיים אלה שמר על חלק גדול מביצועי המקור, ומראה רק ירידה של שלוש נקודות ב- AUC. זה מדגיש יישומים פוטנציאליים למחקר שמר פרטיות.
כדי לפרש תחזיות, החוקרים בדקו את מרחב ההטמעה, שחשף אשכולות מחלות התואמות ICD-10 פרקים והראו כיצד אבחנות ספציפיות עיצבו תוצאות, כמו ההשפעה החזקה של סרטן הלבלב על התמותה.
אימות חיצוני על נתונים דנים אישר את ההכללות, עם ממוצע AUC של בערך 0.67, אם כי עם ירידת ביצועים צנועה. לבסוף, המחקר הכיר במגבלותיו, כולל הטיות בתהליך הגיוס הביולוגי בבריטניה ודפוסי נתונים חסרים.
מסקנות
המחקר הציג את Delphi-2M, מודל מבוסס GPT המסוגל לחזות ולהדמה את התקדמותן של מחלות מרובות לאורך זמן. בהשוואה למודלים מבוססי מחלות יחיד או מבוססי ביו-סמנים, Delphi-2M הראתה דיוק חזק בחיזוי סיכונים בריאותיים על פני יותר מ -1,000 תנאים.
עם זאת, עבור סיכון סוכרת הוא ביצע נמוך יותר מהסמן היחיד HBA1C גישה, אם כי עם ירידה צנועה בלבד בביצועים כאשר נבדקה על נתונים דנים.
היכולת שלה לדגום מסלולי עתיד סינטטיים מאפשרת הערכת נטל מחלות לטווח הארוך ויצירת מערכי נתונים שמורים פרטיות. המודל הדגיש גם דפוסים של קומורבידיות והשפעות זמניות של מחלות, כמו סיכוני תמותה מתמשכים מסרטן, והשיג AUC של בערך 0.97 לחיזוי מוות.
עם זאת, נצפו מספר מגבלות. תחזיות שיקפו הטיות בנתוני ביו -בנקים בבריטניה, כולל השפעות מתנדבות בריאות, הטיית גיוס ודפוסי חסרות. ההבדלים נצפו גם בכל קבוצות אבות וקבוצות סוציו -אקונומיות. חשוב לציין כי המודל לוכד אסוציאציות סטטיסטיות אך לא קשרים סיבתיים, המגביל את השימוש הקליני הישיר שלו.
בסך הכל, Delphi-2M מדגים את ההבטחה של מודלים מבוססי שנאי לחיזוי סיכונים בהתאמה אישית, תכנון שירותי בריאות ומחקר ביו-רפואי. שיפורים עתידיים עשויים לשלב נתונים רב-מודאליים, לתמוך בקבלת החלטות קליניות ולסייע בפיתוח מדיניות באוכלוסיות מזדקנות.