כלי סטטיסטי חדש שפותח על ידי חוקרים מאוניברסיטת שיקגו משפר את היכולת למצוא וריאנטים גנטיים הגורמים למחלות. הכלי, שתואר במאמר חדש שפורסם ב-26 בינואר 2024, ב גנטיקה של הטבעמשלב נתונים ממחקרי אסוציאציה רחבה של גנום (GWAS) ותחזיות של ביטוי גנטי כדי להגביל את מספר התוצאות החיוביות השגויות ולזהות בצורה מדויקת יותר גנים סיבתיים וגרסאות למחלה.
GWAS היא גישה נפוצה לניסיון לזהות גנים הקשורים למגוון תכונות אנושיות, כולל המחלות הנפוצות ביותר. חוקרים משווים רצפי גנום של קבוצה גדולה של אנשים עם מחלה ספציפית, למשל, עם סט אחר של רצפים מאנשים בריאים. ההבדלים שזוהו בקבוצת המחלה יכולים להצביע על וריאנטים גנטיים שמגבירים את הסיכון למחלה זו ומצדיקים מחקר נוסף.
עם זאת, רוב המחלות האנושיות אינן נגרמות על ידי וריאציה גנטית אחת. במקום זאת, הם תוצאה של אינטראקציה מורכבת של גנים מרובים, גורמים סביבתיים ושלל משתנים אחרים. כתוצאה מכך, GWAS מזהה לעתים קרובות וריאנטים רבים באזורים רבים בגנום הקשורים למחלה. עם זאת, המגבלה של GWAS היא שהוא מזהה רק קשר, לא סיבתיות. באזור גנומי טיפוסי, גרסאות רבות נמצאות בקורלציה גבוהה זו עם זו, עקב תופעה הנקראת חוסר שיווי משקל בהצמדה. הסיבה לכך היא שה-DNA מועבר מדור לדור בגושים שלמים, לא בגנים בודדים, ולכן וריאנטים הקרובים זה לזה נוטים להיות מתואמים.
ייתכן שיש לך וריאנטים גנטיים רבים בבלוק שכולם קשורים לסיכון למחלה, אך אינך יודע מי מהם הוא למעשה הווריאציה הסיבתית. זה האתגר הבסיסי של GWAS, כלומר איך אנחנו עוברים מקשר לסיבתיות".
Xin He, PhD, פרופסור חבר לגנטיקה אנושית, ומחבר בכיר של המחקר החדש
כדי להקשות עוד יותר את הבעיה, רוב הווריאציות הגנטיות ממוקמות בגנום לא מקודד, מה שמקשה על פירוש ההשפעות שלהם. אסטרטגיה נפוצה להתמודדות עם אתגרים אלו היא שימוש ברמות ביטוי גנים. לוקוסים של תכונה כמותית של ביטוי, או eQTLs, הם וריאנטים גנטיים הקשורים לביטוי גנים.
הרציונל של שימוש בנתוני eQTL הוא שאם וריאנט הקשור למחלה הוא eQTL של גן X כלשהו, אז X הוא אולי הקשר בין הוריאנט למחלה. הבעיה עם נימוק זה, לעומת זאת, היא שוריאנטים קרובים ו-eQTLs של גנים אחרים יכולים להיות מתואמים עם ה-eQTL של הגן X תוך השפעה ישירה על המחלה, מה שמוביל לחיוב שגוי. שיטות רבות פותחו למינוי גנים סיכון מ-GWAS באמצעות נתוני eQTL, אך כולן סובלות מבעיה בסיסית זו של בלבול על ידי אסוציאציות קרובות. למעשה, שיטות קיימות יכולות ליצור גנים חיוביים כוזבים ביותר מ-50% מהמקרים.
במחקר החדש, פרופ' הוא ומתיו סטפנס, PhD, פרופסור ראלף וו. ג'רארד ויו"ר המחלקות לסטטיסטיקה ופרופסור לגנטיקה של האדם, פיתחו שיטה חדשה הנקראת Causal-Transcriptome-wide Association studies, או cTWAS, כי משתמש בטכניקות סטטיסטיות מתקדמות כדי להפחית שיעורי חיובי שווא. במקום להתמקד רק בגן אחד בכל פעם, מודל cTWAS החדש אחראי על מספר גנים וגרסאות. באמצעות מודל רגרסיה מרובה בייסיאני, הוא יכול לנשל גנים וגרסאות מבלבלים.
"אם אתה מסתכל על אחד בכל פעם, יהיו לך תוצאות חיוביות שגויות, אבל אם אתה מסתכל על כל הגנים והווריאציות הסמוכים ביחד, יש סיכוי גבוה יותר שתמצא את הגן הסיבתי", אמר.
המאמר מדגים את התועלת של טכניקה חדשה זו על ידי לימוד גנטיקה של רמות כולסטרול LDL. כדוגמה אחת, שיטות קיימות של eQTL ציינו גן המעורב בתיקון DNA, אך גישת ה-cTWAS החדשה הצביעה על וריאנט שונה בגן המטרה של סטטין, תרופה נפוצה המשמשת לטיפול בכולסטרול גבוה. בסך הכל, cTWAS זיהה 35 גנים סיבתיים משוערים של LDL, יותר ממחציתם לא דווחו בעבר. תוצאות אלו מצביעות על מסלולים ביולוגיים חדשים ויעדי טיפול פוטנציאליים עבור LDL.
תוכנת cTWAS זמינה כעת להורדה מאתר המעבדה של He. הוא מקווה להמשיך לעבוד על זה כדי להרחיב את היכולות שלו לשלב סוגים אחרים של נתוני אומיקה, כגון שחבור ואפיגנטיקה, כמו גם שימוש ב-eQTLs מסוגי רקמות מרובים.
"התוכנה תאפשר לאנשים לבצע ניתוחים המחברים וריאציות גנטיות לפנוטיפים. זה באמת האתגר המרכזי שעומד בפני כל התחום", אמר. "יש לנו עכשיו כלי הרבה יותר טוב ליצור את הקשרים האלה."