ברצף של כמעט חצי מיליון גנומים, החוקרים מראים שרוב ההשפעות הגנטיות התוספות על גובה, שומנים ותכונות מורכבות אחרות ניתנות כעת למדידה ישירה, תוך איתור גרסאות נדירות ומבניות במיוחד כחשודות מרכזיות מאחורי התורשה שנותרה חסרה.
מחקר: הערכה ומיפוי של התורשה החסרה של פנוטיפים אנושיים. קרדיט תמונה: Buntan / Shutterstock
במחקר שפורסם לאחרונה בכתב העת טֶבַעקבוצת חוקרים כימתה את התרומה של וריאנטים נדירים ושכיחים של קידוד ולא קידוד, כפי שנמדדה על ידי רצף גנום שלם (WGS), לתורשה על פני תכונות אנושיות מגוונות, והעריכו את המידה שבה תורשה מבוססת מובן צר הם מסבירים ביחד.
מגבלות של GWAS ו-WES עבור שונות גנטית
רוב התכונות האנושיות מראות תורשה מסוימת, אך החומצה הדאוקסיריבונוקלאית (DNA) השינויים מאחורי הדמיון המשפחתי הזה נותרו חמקמקים. מחקרי תאומים ומשפחה מצביעים על השפעות גנטיות תוספיות חזקות, אך מחקרים הקשורים לגנום (GWAS) באמצעות פולימורפיזמים נפוצים של נוקלאוטידים בודדים (SNPs) להסביר רק חלק צנוע מהווריאציות. רצף אקסום שלם (WES) מדגיש גרסאות קידוד נדירות אך מכסה רק מתחת ל-3% מהגנום. WGS יכול לסקור שונות נדירה בין אזורי קידוד ואזורי קידוד; עם זאת, תרומתם להבדלים בתכונות נותרה לא ברורה. יש צורך במחקר נוסף כדי למדוד את מידת התורשה החסרה של הווריאציות הנדירות הללו מסבירות.
ערכת נתונים של רצף ביובנק בבריטניה בקנה מידה גדול
החוקרים השתמשו WGS נתונים מ-490,542 ביובנק של בריטניה (UKB) משתתפים והתמקד ב-347,630 פרטים לא קשורים ממוצא אירופי. הם ניתחו 40.6 מיליון אוטוזומליים SNPs והכנסה-מחיקה (indel) גרסאות עם תדירות אללים מינורית (MAF) מעל 0.01%. עבור 41 תכונות מורכבות ומחלות עם תורשה ניתנת למדידה מבוססת אילן יוחסין, הם העריכו תורשה מבוססת WGS תוך שימוש בסבירות מקסימלית מוגבלת גנטית (גרמל) עם חוסר שיווי משקל (LD) וריבוד תדירות אללים מינורי, מיושם במודל המעורב ותורשת החלוקה (MPH) תוכנה. הם פירקו תורשה מוחלטת לתרומות מגרסאות נדירות עם MAF מתחת ל-1% וגרסאות נפוצות בתדירות גבוהה יותר. יתר על כן, הם חילקו את הרכיבים הללו להערות גנומיות מקודדות ולא מקודדות.
תורשת יוחסין ואסטרטגיית מיפוי GWAS
תורשתיות מבוססת אילן יוחסין נאמדה מ-171,446 זוגות קשורים, מה שמאפשר השוואה ישירה עם הערכות מבוססות רצף. הצוות גם ניהל GWAS ב-452,618 אנשים למפות אסוציאציות עצמאיות של וריאנטים נפוצים ונדירים, תוך תיקון קללת המנצח. ניתוחים מותאמים לגיל, מין, מרכיבים גנטיים עיקריים ואשכולות מקום לידה, והסקת מסקנות ממוקדות על 34 פנוטיפים עם משמעותיים WGS ותורשת וריאנטית נדירה. עבודה זו השתרעה הן על תכונות כמותיות והן על מחלות נפוצות. יש לציין כי עבור תכונות התנהגותיות כגון הישגים חינוכיים ואינטליגנציה נוזלית, המחקר דרש תיקון נוסף להזדווגות מגוונת וריבוד גיאוגרפי כדי למנוע הערכות תורשה מנופחות. ניואנס זה מדגיש את המורכבות של ניתוח תרומות גנטיות עבור פנוטיפים ספציפיים.
וריאציות נדירות ודפוסי תורשה של אזור קידוד
על פני 34 תכונות עם אותות וריאציות נדירים, הערכות תורשתיות מבוססות WGS נעו בין 8% למספר הילדים ל-71% לגובה, בממוצע של 28%. גרסאות נדירות עם MAF מתחת ל-1% היוו כ-20% מהתורשה המבוססת על אילן יוחסין, בעוד וריאנטים נפוצים תרמו 68% מתורשתיות על בסיס אילן היוחסין, מה שמותיר כ-12% עדיין חסרים. לפיכך, בתוך 88% מהתורשה שנלכדה על ידי WGSגרסאות נדירות מהוות כ-23%, וגרסאות נפוצות מהוות 77%. אזורי קידוד ייצגו פחות מ-1% מכל הגרסאות המנותחות, אך תרמו בערך 17% מסך הכל WGS תורשתיות וכ-20% מתורשת וריאנטית נדירה, מה שמרמז על העשרה של פי 26 עד פי 36 לשינויי קידוד פונקציונליים. גרסאות שאינן מקודדות, למרות שהן בנפרד חלשות יותר, הסבירו ביחד את רוב תרומתו של הווריאציה הנדירה.
הבדלים ספציפיים לתכונה במורשת WGS
כאשר הושוו תורשתיות מבוססות רצף עם הערכות מבוססות אילן יוחסין מ-171,446 זוגות יחסיים, WGS תפס 88% מהתורשה במובן הצר בממוצע. עבור 15 תכונות בעלות עוצמה גבוהה, לא היה הבדל משמעותי בין הערכות מבוססות רצף ואומדנים מבוססי אילן יוחסין, מה שמצביע על כך שרוב השונות הגנטית הנוספת שלהם נלקחת כעת בחשבון על ידי וריאנטים שנצפו. לעומת זאת, תכונות כמו מספר ילדים ואורך הטלומרים שמרו על תורשה משמעותית, מה שמרמז על תפקידים של גרסאות נדירות במיוחד, שונות מבנית או השפעות גנטיות לא-תוסף. המחקר גם הזהיר כי כולל גרסאות נדירות במיוחד (MAF פחות מ-0.01%) הניבו הערכות תורשתיות שליליות עבור תכונות מסוימות, סימן קלאסי למפרט שגוי של המודל, המצביע על כך שהשיטות הנוכחיות עדיין אינן אמינות עבור מחלקת וריאנטים זו.
אסוציאציות וריאציות נדירות ושונות מבנית
יחס התורשה המוסבר, המוגדר כיחס בין תורשתיות מבוססת WGS לתורשה מבוססת אילן היוחסין, עמד על ממוצע של 0.88 אך השתנה בין תכונות, מה שממחיש שהארכיטקטורה הגנטית והכוח הסטטיסטי מעצבים את מידת השלמות של מפות הנוכחיות. GWAS שימוש באותם גנומים זיהה יותר מ-12,000 אסוציאציות עצמאיות, כולל 11,243 פגיעות וריאנטיות נפוצות ו-886 פגיעות וריאנטיות נדירות על פני 34 תכונות. כל קשר נדיר הסביר יותר שונות פנוטיפית מאשר כל קשר משותף. אותות נדירים היו אינפורמטיביים עבור תכונות שומנים, כאשר ליפופרוטאין בצפיפות נמוכה (LDL) כולסטרול וליפופרוטאינים בצפיפות גבוהה (HDL) לכולסטרול היו אסוציאציות של וריאנטים נדירים, שיחד הסבירו יותר מ-33% מתורשת הווריאציות הנדירה שלהם. פוספטאז אלקליין (ALK) הייתה התכונה היחידה שאינה שומנית שהראתה כוח הסבר גבוה באופן דומה. רבים מהאסוציאציות הנדירות הללו נמצאות בלוקוסים או בסמוך אליהם שכבר מסומנים על ידי אותות וריאנטים נפוצים, ומראים קולקליזציה.
הפלוטיפים מבניים ורצף חסר
בכמה אזורים, אשכולות של אסוציאציות נדירות ושכיחות עלו בקנה אחד עם גרסאות מבניות, מה שמחזק את הרעיון שהפלוטיפים מורכבים עומדים בבסיס כמה מההשפעות הגנטיות החזקות ביותר. הניתוח גם גילה שעבודות קודמות מצביעות על כך שכרומוזום X תורם פחות מ-3% לתורשה, ושמבנה הגנום hg38 בו נעשה שימוש מחמיץ כ-8% מהגוף. DNA רצף, שני הגורמים המהווים חלק קטן מהתורשה שעדיין חסרה.
רלוונטיות קלינית של מיפוי תורשתיות WGS
בסך הכל, התוצאות מצביעות על כך שחלק ניתן למדידה מהתורשה שחסרה בעבר כבר ניתן למיפוי עם פחות מ-500,000 גנומים ברצף מלא, במיוחד עבור תכונות מוגדרות היטב כמו שומנים בדם ואנזימי כבד. עבור מטופלים ורופאים, ממצאים אלה מצביעים באופן סביר על ציוני סיכון גנטי מדויקים יותר, זיהוי מוקדם יותר של פרופילי סיכון גבוה ואסטרטגיות מניעה ממוקדות יותר ברחבי העולם בפועל, אם כי תרגום קליני לא נבדק ישירות במחקר זה.
פערים שנותרו ומחקר גנומי עתידי
מחקר זה מדגים זאת WGS יכול לשחזר את רוב התורשה במובן הצר שהסיקו בעבר מעיצובים מבוססי משפחה עבור תכונות אנושיות רבות. על ידי חלוקת התורשה לרכיבים נדירים ונפוצים וכן לרכיבים מקודדים ולא מקודדים, היא מצמצמת את החלל שנותר לגורמים גנטיים לא ידועים ומבהירה היכן עדיין נותרה תורשתית חסרה. עבור משפחות, רופאים וקובעי מדיניות, הממצאים מצביעים על כך שציונים פוליגניים המשלבים גרסאות נדירות יכולים לשפר את חיזוי הסיכון, במיוחד עבור תכונות הקשורות לשומן. סגירת הפער הנותר תדרוש קבוצות גלובליות גדולות יותר ומגוונות יותר ממוצא אבות וכלים משופרים לשונות מבנית נדירה ומורכבת במיוחד.