Search
Genetic brain disorders, conceptual 3D illustration.

AI מזהה גרסאות גנים חדשים הקשורים לסיכון של אלצהיימר

מחקר חדש מונע AI מגלה כיצד מודלים של למידת מכונות מתקדמת לא רק מאשרים את הגנים הידועים של האלצהיימר, אלא גם מציבים שישה גרסאות סיכון חדשות.

מחקר: למידת מכונות בגנטיקה של מחלת אלצהיימר. קרדיט תמונה: Kateryna Kon/Shutterstock.com

כלים סטטיסטיים חיוניים בפירוק הבסיס הגנטי של מצבים רפואיים מורכבים. לא הרבה התקדמות התרחשה מעבר למודלים תוספים לינאריים; עם זאת, מאמר שפורסם לאחרונה בפורסם תקשורת טבע מתאר את התוצאה של יישום למידת מכונה (ML) על נתונים גנומיים מקבוצה גדולה של חולי מחלת אלצהיימר (AD) באירופה.

מָבוֹא

מחקרי אסוציאציה רחבי גנום (GWAS) חלוץ תובנות עמוקות יותר לגבי שונות גנטית כגורם סיכון לספירה. גרסאות אלה נבדקות לציוני סיכון פוליגניים (PRS) המסייעים לחזות סיכון למחלות.

כלים אלה מתוכננים מתוך הנחה כי גרסאות מנבאות באופן אחיד את התוצאה. מתווספים סיכונים הקשורים לגרסאות בודדות, בין אם גרסאות אלה מתרחשות באותו לוקוסים גנטיים אחרים או אחרים. זה מתעלם מהידיעה כי הסיכונים משתנים על ידי אינטראקציות בין הגרסאות ועם גורמי סיכון אחרים.

מחקרי מודעות הראו, למשל, שונים Apoe גרסאות משנות את תכונות המחלה וסוג התגובה התאית החיסונית לחלבונים עצביים לא תקינים. מחקרים גנטיים מצביעים על כך שהבדלים ב Apoe הביטוי גורם לאסוציאציות שונות של AD-Gene ולגיל משתנה באבחון.

ככל שגדלי המדגם של GWAS גדלים וכוחם של מישור PRS, פלטפורמות חדשות יותר המיישמות משאבים חישוביים מתקדמים חיוניות כדי לסחוט את התועלת המרבית מנתונים גדולים הזמינים כיום, ומספקים מבט טוב יותר על הבסיס הגנטי של AD. בינה מלאכותית במודלים של ML יושמה במספר מחקרים; עם זאת, גדלי מדגם קטנים גרמו לסיכון גבוה משמעותית להטיה.

המחקר הנוכחי ביקש לטפל בכך באמצעות מערך הנתונים הגדול ביותר זמין כיום לגנום עבור AD.

על המחקר

במחקר זה, החוקרים אימנו שלושה סוגים של מודלים, שהם ידועים וביצועים גבוהים בתחום זה:

  • מכונות הגברת שיפוע (GBMS)
  • רשתות עצביות ביולוגיות מסלול ביולוגי (NNS)
  • הפחתת ממדיות רב-פקטורית מבוססת מודל (MB-MDR).

המטרה הייתה להעריך את היעילות של כל אלגוריתם בביצוע שלושה סוגים של משימות:

  • משכפל ממצאים קודמים
  • מציאת לוקוסים חדשים הקשורים למחלות המשקיפים על ידי GWAS
  • חיזוי אנשים בסיכון גבוה

המחקר השתמש באימות צולב קפדני, ריבוי פיצולים במבחני רכבת אקראיים, והתאמה מדוקדקת למפגשים כמו מין, גיל, מרכז גנוטיפ ומבנה אוכלוסייה.

תוצאות

משכפל ממצאים קודמים

ביחס למטרה הראשונה, הממצאים הראו כי ML תפסה את כל הגרסאות הגנטיות שנפרשו על כל הגנום במערך האימונים. יתר על כן, הוא זיהה 22% מהגרסאות הקשורות ל- AD שדווחו במטא-אנליזות גדולות יותר של GWAS, אם כי גודל המדגם היה רק עשרים משלהם. לפיכך, מחקר זה קובע אמת מידה לשיטות רחבות גנום מבוססות ML.

היכולת של דגמי ה- ML לשכפל ממצאים מ- GWAS גדולים בהרבה מדגישה כי מודלים גמישים יכולים לשחזר חלק ניכר מהסיכון הגנטי הידוע עם מספר קטן יותר של דגימות.

זיהוי לוקוסים גנטיים

שנית, ML זוהה נכון Apoe כגורם סיכון לספירה. זה תפס נכון את הפולימורפיזם של נוקליאוטיד יחיד (SNPs) הקשור באופן סיבתי לספירה. בכל שיטות, ML הדגישה את ה- SNP המוליכים עבור מספר גנים חשובים ב- AD. MB-MDR 1 D מצא 20 SNPs יציבים ביותר, שממוסים לרוב Apoe אזור, עם כל פיצול מבחן רכבת אפשרי.

הדגמים זיהו גם שישה לוקוסים חדשים ששוכפלו במערך נתונים שאינו קשור. לוקוסים אלה מקודדים גנים כמו Arhgap25Ly6hו COG7ו GBMS זיהה את רוב המקומי הרומן.

התגלה עמותה רומן ב AP4E1קרוב לידוע כבר SPPL2A לוקוס. AP4E1 מקודד חלק ממפתח חלבון למטבוליזם עמילואיד, ומחסורו עשוי לקדם היווצרות בטא-עמילואיד, מה שמגדיל את הסיכון לספירה. גישת הרשת העצבית הדגישה גם לוקוס חדשני נוסף (SOD1) עם קישורים ביולוגיים אפשריים לפתולוגיה של AD.

חיזוי סטטוס מודעה

כל הדגמים ניבאו את מצב ה- AD ברמת דיוק דומה. GBM היה מתואם בצורה החזקה ביותר עם NN ו- MDRC 1 D. אף על פי שתואם חלש עם NNS, PRS היה קשור מאוד ל- GBMs.

GBM ו- PRS היו טובים יותר בחיזוי מקרים שנבדלו מבקרות. התחזיות קיבלו תוקף באמצעות אימונים אקראיים ובדיקה סידור מחדש של נתוני נתונים, מה שמצביע על השחזור גבוה.

נקבות היו מיוצגות יתר על המידה בקרב מקרים חזויים, כצפוי מהרוב הנשי של הנתונים. GBM היה היוצא מן הכלל, עם פרופורציות דומות של גברים ונשים במקרים ובקרות הן.

כל תחזיות המודל נותרו יציבות על פני קבוצות שונות ופיצולים אקראיים חוזרים ונשנים, מה שמרמז כי הממצאים אינם מונעים על ידי ממצאים יתר או טכניים.

השוואה עם GWAS

החוקרים השוו את הגרסאות העיקריות המופעלות על ידי ML עם כל SNPs החשובים הקשורים ל- AD המדווחים במטא-אנליזות. מתוך 130 גנים שדווחו בעבר התואמים 86 לוקוסים, אלגוריתמים של ML אחד או יותר הרים 19. כל הדגמים זוהו Apoeואילו שני דגמים זיהו שבעה לוקוסים.

עוזב את Apoe אזור מתוך מערך האימונים הוביל לזיהוי של גנים ידועים יותר לסיכון AD אך ברמת דיוק נמוכה יותר. כאשר נעשה שימוש רק בנתונים הנוכחיים, דגמי ML אחד או יותר זיהו כל SNP שנקבע ב- GWAS במערך האימונים.

ה- SNPs המזוהים עם ML עם עדיפות גבוהה היו מרוכזים יותר באזורים מיקרוגליאליים ואסטרוציטים. אלה היו מעורבים בנתיבים שונים הקשורים למודעות, כמו ויסות חלבון העמילואיד בטא-סימן AD, או שינויים בריכוז החלבונים כמו LY6H. מולקולה זו נקשרת לקולטני אצטילכולין המעורבים בהעברה עצבית, ורמתה בנוזל המוח השדרה מתואמת עם חומרת הספירה. אחרים מיוצרים על חריגות גליקוזילציה המעורבות בעיבוד חלבון AD טאו.

האופן בו דגמי ML מדורגים חשיבות SNP (למשל, באמצעות ערכי SHAP עבור GBM, ערכי p פרמוטציה עבור MB-MDR, או משקולות רשת עבור NN) לא תמיד מתורגמת ישירות למשמעות GWAS קונבנציונאלית, ומשקפת את ההבדלים הבסיסיים בבחירת התכונות בין ML לסטטיסטיקה מסורתית.

חשיבות המחקר

מחקר זה המונע היטב ומתוחכם מדגיש כי ML יכול לחזות גרסאות גנטיות מקושרות ל- AD באופן דומה לשיטות מסורתיות בגנום, בהתחשב במערכי הנתונים הגדולים הזמינים.

הדיוק החזוי המתון של מטה-אנליזות GWAS יכול להיות בגלל ההטרוגניות של מחקרים כלולים, המשקפת את ההבדלים במאפיינים רלוונטיים מרובים. יותר דגימות הומוגניות מספקות יחסי סיכויים גבוהים יותר מאשר דגימות קליניות. חלק מה- SNP המזוהים על ידי דגמי ML עשויים להיות בעלי השפעות ניתנות לגילוי בקבוצות מסוימות או בתנאים ספציפיים, אשר עשויים שלא להיות גלויים במערכי נתונים חיצוניים גדולים והטרוגניים.

זה גם מסביר מדוע לא ניתן היה לשכפל את כל ה- SNP שזוהו על ידי דגמי ה- ML במערכי נתונים חיצוניים. השפעותיהם עשויות להיות משמעותיות רק במצבים ספציפיים, ואינם מצליחים להראות משמעות רחבה בגנום במחקרים שונים מאוד עם הקשרים שונים.

למרות זאת, הרומן SNPs כאן השפיע על מסלולי סביר ביולוגית. מחקר נוסף חיוני כדי להבין כיצד לזהות SNPs חשובים מאלו שנלכדו בשיטות שונות.

מסקנות

"התוצאות שלנו מדגימות ששיטות למידת מכונות יכולות להשיג ביצועים חזויים הדומים לגישות קלאסיות באפידמיולוגיה גנטית. " מלבד חיזוי סיכון, הם זיהו לוקוסים חדשים שהוחמצו בגישות GWAS מסורתיות.

בסך הכל, עבודה זו מדגימה את ההבטחה והמגבלות הנוכחיות של ML בגנטיקה של AD. הוא מציע תוספת חשובה ל- GWAS אך גם מדגיש את הצורך בפרשנות מדוקדקת, שכפול ועידון מתודולוגי נוסף.

המחקר הנוכחי פותח את הדרך להתפתחות עתידית ואימות של מודלים של ML כדי להשלים שיטות קונבנציונאליות במחקר גנטי של AD.

הורד את עותק ה- PDF שלך עכשיו!

דילוג לתוכן