Search
Study: Disease prediction with multi-omics and biomarkers empowers case–control genetic discoveries in the UK Biobank. Image Credit: Xray Computer/Shutterstock.com

שיפור חיזוי מחלות באמצעות מערכי נתונים של ביובנק

פתיחת חיזוי מחלות: כיצד המסגרת של MILTON משתמשת בנתוני ריבוי אומיקה כדי לשנות תובנות בריאותיות.

לִלמוֹד: חיזוי מחלות עם מולטי-omics וסמנים ביולוגיים מעצימים גילויים גנטיים של בקרת מקרה בביובנק הבריטי. קרדיט תמונה: Xray Computer/Shutterstock.com

במחקר שפורסם לאחרונה ב גנטיקה של הטבעקבוצת חוקרים פיתחה ויישמה מסגרת ללימוד מכונה (MILTON) כדי לחזות מחלות ולשפר ניתוחי קשר גנטי באמצעות נתוני מולטי-omics מ-Biobank של בריטניה (UKB).

רֶקַע

זיהוי אנשים בסיכון גבוה לפתח מחלות חיוני לרפואה מונעת. ובכל זאת, כלי הערכת סיכונים מסורתיים, המסתמכים על גורמים כמו גיל והיסטוריה משפחתית, עשויים שלא לתפוס את המורכבות של ביולוגיה של המחלה במלואה.

ביו-בנקים בקנה מידה גדול, כמו UKB, משלבים נתונים רב-אומיקים כמו בדיקות דם, פרוטאומיקה ומטבולומיקה, המספקים הזדמנויות לגלות סמנים ביולוגיים חדשים.

מערכי נתונים מקיפים אלה מאפשרים זיהוי של שילובי סמנים ביולוגיים המשפרים את חיזוי המחלה מעבר לסמנים בודדים. מחקר נוסף נחוץ כדי להבין טוב יותר את התהליכים הביולוגיים העומדים בבסיס מחלות מורכבות ולשפר מודלים חיזויים.

לגבי המחקר

קבוצת ה-UKB כוללת 502,226 משתתפים בגילאי 37 עד 73 שנים, עם גיל חציוני של 58. מתוכם, 54.4% הן נשים. הנתונים מספקים מידע מקיף כגון רשומות אבחון, ביוכימיה של דם, מדדי גודל גוף, גנומיקה ונתוני פרוטאומיקה. כל המשתתפים סיפקו הסכמה מדעת והשתתפו בהתנדבות.

קבוצת הגנים הפינית (FinnGen) מורכבת מ-412,181 פרטים, 55.9% מהם נשים, עם גיל חציוני של 63. המשתתפים גם סיפקו הסכמה מדעת ולקחו חלק בהתנדבות.

לא הייתה גישה לנתוני FinnGen ברמת המטופל; נעשה שימוש רק בסטטיסטיקה של סיכום מחקר הגנום-רחב (GWAS). המחקר עמד בכל התקנות האתיות, עם אישורים שהתקבלו מוועדות האתיקה המתאימות.

המחקר ב-UKB קיבל אישור מהוועדה לאתיקה של מרכז צפון מערב. במקביל, ועדת האתיקה המתאמת של מחוז בית החולים של הלסינקי ואוסימאה אישרה את מחקר FinnGen.

המכון הפיני לבריאות ורווחה, הסוכנות לשירות דיגיטלי ונתוני אוכלוסין, המוסד לביטוח סוציאלי וסטטיסטיקה פינלנד העניקו אישורים נוספים ל-FinnGen.

שני המחקרים עיבדו את הנתונים בקפידה, תוך הבטחת הגדרות מקרה ובקרה מדויקות. סינון נרחב הוחל על מקרים ובקרות כדי לשמור על עקביות בהתפלגות הגיל, המין ומאפיינים בסיסיים אחרים.

תוצאות המחקר

סמנים ביולוגיים קליניים ממלאים תפקיד מכריע באבחון והערכת מחלות על ידי מתן אינדיקציות מדידות לנוכחות ולחומרתו של המצב. בהקשר של מחקרי אסוציאציות ברחבי התופעה (PheWASs), סמנים ביולוגיים מציעים גם הזדמנות לזהות מקרים מסווגים שגויים או סתמיים.

MILTON, שיטת לימוד מכונה, הוכנסה לשימוש בסמנים ביולוגיים כמותיים כדי לחזות את מצב המחלה עבור 3,213 פנוטיפים של מחלות. הטכניקה פועלת על ידי לימוד תחילה חתימה ספציפית למחלה מחולים מאובחנים ולאחר מכן חיזוי מקרים חדשים פוטנציאליים בקרב הבקרות המקוריות. קבוצות מוגברות אלו משמשות לניתוח קריסת וריאציות נדירות כדי להשוות עם קבוצות קו הבסיס.

מודלים לחיזוי מחלות של MILTON מוגדרים על סמך הפרש הזמן בין איסוף דגימת סמנים ביולוגיים לאבחון. ב-UKB, ייתכן שנאספו דגימות עד 16.5 שנים לפני או 50 שנים לאחר האבחנה.

MILTON הוכשרה באמצעות שלושה מודלים שונים של זמן: פרוגנוסטי (עד 10 שנים לאחר איסוף הדגימות), אבחון (עד 10 שנים לפני) וזמן אגנסטי (כל המקרים המאובחנים). ניתוק של 10 שנים נקבע כאופטימלי לאחר ניתוח רגישות של 400 קודי סיווג בינלאומי של מחלות, גרסה 10 (ICD10) שנבחרו באקראי.

MILTON הוכשר על 67 מאפיינים, כולל ביוכימיה וספירה של דם, מבחני שתן, גודל גוף, לחץ דם, מין, גיל, ספירומטריה וזמן צום. ביצועי המודל הוערכו באמצעות מדד השטח מתחת לעקומה (AUC). MILTON השיגה AUC ≥ 0.7 עבור 1,091 קודי ICD10, AUC ≥ 0.8 עבור 384 קודים, ו-AUC ≥ 0.9 עבור 121 קודים בכל מודלים ואבות.

מודלים אבחוניים בדרך כלל הניבו ביצועים טובים יותר מאלה הפרוגנוסטיים ב-1,466 קודי ICD10. לדוגמה, במשתתפים ממוצא אירופאי (EUR), למודלים אבחנתיים היה AUC חציוני גבוה יותר (0.668 לעומת 0.647) ורגישות (0.586 לעומת 0.570).

MILTON גם הראתה ביצועים יציבים עבור מוצאי אירו ואפריקה, בעוד שהביצועים השתפרו עבור מודלים אבחנתיים מדרום אסיה ככל שמספר המקרים גדל.

היכולת של MILTON לחזות מחלה לפני הופעתה אומתה עוד יותר. כאשר נותחו אנשים עם הסתברות גבוהה למקרים (0.7 ≤ Pcase ≤ 1), 97.41% מקודי ICD10 הועשרו באופן משמעותי במשתתפים שאובחנו מאוחר יותר עם התנאים המקבילים. תוצאות אלו מאשרות את היעילות של MILTON בזיהוי מקרים מתעוררים והגברת ניתוחי הקשר הגנטיים.

מסקנות

לסיכום, MILTON חוזה מחלות באמצעות רב-אומיקה וסמנים ביולוגיים, מה שמשפר את מחקרי הביקורת על מקרה על פני חמישה אבות UKB. למרות מערך התכונות הרחב והלא ספציפי למחלות, MILTON השיגה כוח ניבוי גבוה עבור פנוטיפים רבים, עם AUC > 0.7 עבור 1,091 קודי ICD10, AUC > 0.8 עבור 384 ו-AUC > 0.9 עבור 121.

עם זאת, עבור מחלות מסוימות, כוח הניבוי נותר נמוך, מה שמצביע על הצורך בתכונות אינפורמטיביות יותר.

MILTON השיגה לעתים קרובות ביצועים טובים יותר מתוצאות הסיכון הפוליגניות (PRSs) אך השיגה ביצועים נמוכים במחלות כמו מלנומה וסרטן השד. נתוני פרוטאומיקה שיפרו את התחזיות עבור 52 פנוטיפים. MILTON זיהה גם 182 אותות משוערים של מחלות גנטיות חדשות הדורשות אימות נוסף.

דילוג לתוכן