חוקרים פיתחו את TxGNN, מודל המופעל על ידי בינה מלאכותית העולה על שיטות קיימות על ידי חיזוי טיפולים למחלות חסרות טיפולים מאושרים, תוך שימוש בהסברים מרובי-הופ כדי לספק שקיפות ואמון גדולים יותר.
מחקר: מודל יסוד ליישום מחדש של תרופות במרכז קלינאי. קרדיט תמונה: unoL / Shutterstock
מחקר שפורסם לאחרונה בכתב העת רפואת טבע פיתח את TxGNN, מודל בסיס מבוסס גרפים לשינוי ייעוד של תרופות ללא זריקה. רק ל-5% עד 7% מהמחלות הנדירות יש תרופות מאושרות. הרחבת השימוש בתרופות קיימות עבור אינדיקציות חדשות יכולה לסייע בהפחתת עומס המחלות העולמי. שימוש מחדש בתרופות ממנף את נתוני הבטיחות והיעילות הקיימים, ומאפשר תרגום קליני מהיר יותר ועלויות פיתוח מופחתות.
חיזוי יעילות התרופה כנגד כל המחלות עשוי לאפשר בחירת תרופות עם פחות תופעות לוואי, עיצוב טיפולים יעילים יותר עבור מספר מטרות במסלול המחלה, ושימוש מחדש בתרופות זמינות לשימושים טיפוליים חדשים.
ניתן להתאים את השפעות התרופה לאינדיקציות חדשות על ידי ניתוח גרפי ידע רפואי (KGs). בעוד ששיטות חישוביות זיהו מועמדים למטרות חוזרות, ישנם שני אתגרים משמעותיים. ראשית, גישות אלו מניחות כי יש צורך בתחזיות טיפוליות עבור מחלות שכבר יש להן תרופות.
שנית, רוב המודלים נוטים לזהות תרופות על סמך קווי דמיון לטיפולים הקיימים, שלא מצליחים לטפל במחלות ללא טיפולים זמינים. לשימוש קליני, מודלים של למידת מכונה חייבים לבצע תחזיות אפס, כלומר לחזות תרופות למחלות עם הבנה מולקולרית מוגבלת וללא תרופות מאושרות. עם זאת, יכולת זו נמוכה באופן ניכר עבור דגמים קיימים.
TxGNN מטפלת בפער הזה על ידי הטמעת גישה של תרופות ללא תכלית, תוך שימוש ב-GNN ובמודול למידה מטרי מיוחד המבוסס על דימיון מחלות כדי להעביר ידע ממחלות הניתנות לטיפול לאלה שאין להם טיפולים.
המחקר והממצאים
במחקר הנוכחי, חוקרים פיתחו את TxGNN, מודל בסיס גרפי ל-Zero-shot repurposing של תרופות, המנבא מועמדים לשינוי ייעוד, כולל אלו החסרים כיום טיפולים. TxGNN הורכב מ-1) מקודד מבוסס רשת עצבית (GNN), 2) מפענח למידה מטרי המבוסס על דמיון למחלה, 3) אימון מקדים סטוכסטי של כל היחסים ואחריו כוונון עדין, ו-4) גרף ריבוי הופים מודול הסבר.
TxGNN הוכשרה ב-KG רפואית, ורכזה עשרות שנים של מחקר על פני 17,080 מחלות. יתר על כן, פותח TxGNN Explainer רב-הופ כדי להקל על הפרשנות של מועמדים לתרופות על ידי קישור צמדי מחלות תרופות דרך נתיבי ידע רפואי הניתנים לפירוש. הסבר זה מספק למומחים אנושיים הסברים שקופים, מרובי הופ, המטפחים אמון בתחזיות שנוצרו על ידי בינה מלאכותית.
ביצועי המודל הוערכו על פני מערכי נתונים שונים. מערך נתונים של holdout נוצר על ידי דגימת מחלות מה-KG, אשר הושמטו במהלך האימון כדי לשמש מאוחר יותר כמקרי בדיקה. מחלות ממושכות אלו היו אקראיות או נבחרו במיוחד כדי להעריך חיזוי אפס.
TxGNN הושווה עם שמונה שיטות מתקדמות, כולל מודל עיבוד בשפה טבעית, BioBERT, שיטות GNN כמו HGT ו-HAN, וטכניקות סטטיסטיות ברפואת רשת. תחת אסטרטגיית ההשוואה הסטנדרטית, שבה למחלות במערך הבדיקות כבר היו כמה אינדיקציות או התוויות נגד במהלך האימון, TxGNN עלתה על השיטה החזקה ביותר, HAN, בפער של 4.3% ב-AUPRC (Area Under Precision-Recall Curve) עבור אינדיקציות.
לאחר מכן, הצוות העריך מודלים בשימוש חוזר באפס זריקה, שבהם נדרשו מודלים לחזות מועמדים טיפוליים למחלות חסרות טיפול. במקרה זה, TxGNN הראה עלייה של 49.2% ב-AUPRC עבור התוויות לתרופה ו-35.1% עבור התוויות נגד בהשוואה למודל הבא הטוב ביותר.
רווחים אלו משמעותיים במיוחד מכיוון שמודלים קונבנציונליים נאבקים בהגדרות של אפס זריקות, שבהן אין קשרים קודמים בין תרופות למחלות זמינות לאימון. TxGNN הוערך גם במסגרות מחמירות על פני תשעה אזורי מחלה, והשיג רווחי AUPRC שנעו בין 0.5% ל-59.3% עבור התוויות לתרופות ו-11.8% עד 35.6% עבור התוויות נגד.
בתרחיש זה, TxGNN הציג שיפורי ביצועים עקביים בהשוואה למודלים קיימים, עם עליות AUPRC שנעו בין 0.5% ל-59.3% עבור התוויות לתרופות ו-11.8% עד 35.6% עבור התוויות נגד. בנוסף, נערך מחקר פיילוט עם מדענים וקלינאים. המשתתפים כללו שני רוקחים, חמישה קלינאים וחמישה חוקרים קליניים. הם התבקשו להעריך 16 תחזיות TxGNN, 12 מהן היו מדויקות.
זמן החקירה של המשתתפים, דיוק ההערכה וציוני האמון של כל תחזית נרשמו. הם השתפרו משמעותית בביטחון ובדיוק כאשר תחזיות סופקו עם הסברים. יתרה מכך, בראיונות ובשאלונים שניתנו לאחר ביצוע המטלות, המשתתפים דיווחו על שביעות רצון גדולה יותר מה-TxGNN Explainer, כאשר 91.6% מהמשתתפים הסכימו שהתחזיות וההסברים של TxGNN היו בעלי ערך.
לעומת זאת, 75% לא הסכימו, בהסתמכו על תחזיות TxGNN ללא הסברים. לאחר מכן, הצוות העריך האם התרופות החזויות וההסברים שלהן עולים בקנה אחד עם ההיגיון הרפואי למחלות הנדירות הבאות: תסמונת קליפסטרה, תסמונת אהלר-דנלוס ותסמונת נפרוגנית של אנטי-דיורזה לא מתאימה (NSIAD).
פרוטוקול הערכה זה כלל שלושה שלבים. ראשית, מומחה אנושי ביקש מ-TxGNN לזהות תרופות פוטנציאליות לשימוש חוזר. לאחר מכן, נשאל TxGNN Explainer כדי להמחיש מדוע התרופה נחשבה. בשלב השלישי נותחו ראיות רפואיות עצמאיות כדי לאמת תחזיות והסברים של TxGNN.
המודל זיהה זולפידם, טרטינואין ועמיל ניטריט עבור תסמונת קליפסטרה, תסמונת Ehlers-Danlos ו-NSIAD, בהתאמה. בכל המקרים, הסברי TxGNN תאמו ראיות רפואיות.
אימות בעולם האמיתי באמצעות EMRs
החוקרים אספו קבוצה של למעלה מ-1.2 מיליון מבוגרים עם מרשם תרופה אחד ומחלה אחת לפחות באמצעות רשומות רפואיות אלקטרוניות (EMRs) ממערכת בריאות ומדדו את ההעשרה של הופעת מחלה-תרופתית. אימות זה מיישר את התחזיות של TxGNN לשימוש קליני בעולם האמיתי.
העשרה נאמדה כיחס בין הסיכויים להשתמש בתרופה למחלה לבין אלו של השימוש בה למחלות אחרות. בסך הכל, נגזרו 619,200 ערכי log(יחס סיכויים) (log(OR)). TxGNN יצר רשימה מדורגת של מועמדים טיפוליים עבור כל מחלה עם פנוטיפ EMR.
תרופות הקשורות למחלה הושמטו, והתרופות המועמדות החדשות סווגו לדירוג העליון, חמש העליון, העליון 5%, ו-50 התחתונים. לתרופות החזויות בדירוג העליון היו ערכי log(OR) גבוהים בכ-107% בממוצע מהלוג(OR) הממוצע של תחזיות 50% התחתונות, מה שמצביע על כך שהתחזיות של TxGNN תואמות היטב מרשמים מחוץ לתווית שנעשו על ידי רופאים.
מסקנות
יחד, המחקר פיתח את TxGNN עבור שימוש חוזר בתרופה עם זריקת אפס המכוונת ספציפית למחלות עם נתונים מוגבלים ואפשרויות טיפוליות. TxGNN מתעלה בעקביות על שיטות קיימות על ידי מתן הסברים הניתנים לפירוש רב-הופ לתחזיות שלה, מה שמשפר את האמון והשימושיות בתהליכי עבודה קליניים. חוץ מזה, תרופות חזויות תואמות את הקונצנזוס הרפואי של מומחים אנושיים ומתיישרות עם שיעורי המרשם מחוץ לתווית ב-EMR.
ההסברים הניתנים לפירוש רב-הופ של TxGNN מספקים רמה חדשה של שקיפות, מטפחים אמון ומשפרים את השילוב של המודל בזרימות עבודה קליניות.