מודל AI חדש מנבא ביטוי גנים על פני סוגי תאים אנושיים

07:11
, 1 פברואר 2025
, בריאות ורפואה

תַקצִיר: צוות חוקרים ממכון סרטן דנה-פרבר, המכון הרחב של MIT והרווארד, גוגל ואוניברסיטת קולומביה יצרו מודל בינה מלאכותית שיכול לחזות אילו גנים באים לידי ביטוי בכל סוג של תא אנושי. המודל, שנקרא Epibert, נוצר בהשראת ברט, מודל למידה עמוקה שנועד להבין ולייצר שפה דמוית אדם.

Epibert הוכשר על נתונים ממאות סוגי תאים אנושיים בשלבים מרובים. הוא ניזון מהרצף הגנומי, שאורכו 3 מיליארד זוגות בסיס, יחד עם מפות של נגישות כרומטין המיידיעות אילו רצפים אלה מתנתקים מהכרומוזום וקוראים על ידי התא. המודל הוכשר לראשונה ללמוד את הקשר בין רצף DNA לנגישות כרומטין על גבי נתחים גדולים של הגנום בסוג תאים ספציפי. לאחר מכן הוא משתמש במערכות יחסים מלומדות אלה כדי לחזות אילו גנים היו פעילים בסוג התא המתאים. היא זיהתה במדויק אלמנטים רגולטוריים – חלקים מהגנום המוכרים על ידי גורמי שעתוק – והשפעתם על ביטוי גנים על פני סוגים רבים של תאים, ובניית "דקדוק" הניתן להכללה וצפוי. ניתן לדמות את תהליך בניית הדקדוק הזה לאופן בו מודל שפה גדול, כמו צ'אט, לומד לבנות משפטים ופסקאות משמעותיות מדוגמאות רבות לטקסט. מודל Epibert יכול לעבד נגישות ולחזות בסיסים פונקציונליים כמו גם ביטוי RNA לסוג תאים שלא נראה לפני כן.

מַשְׁמָעוּת: לכל תא בגוף יש אותו רצף גנום, כך שההבדל בין שני סוגים של תאים אינו הגנים בגנום, אך אילו גנים מופעלים, מתי וכמה. בערך 20% מקודי הגנום עבור אלמנטים רגולטוריים קובעים אילו גנים מופעלים, אך מעט מאוד ידוע על היכן הקודים הללו נמצאים בגנום, איך נראים הוראותיהם, או כיצד משפיעים מוטציות בתפקוד בתא. Epibert ישפוך אור על אופן הוסדרת הגנים בתאים, ובאופן פוטנציאלי, כיצד ניתן למתן את המערכת הרגולטורית של אותו תא בדרכים המובילות למחלות כמו סרטן.

מימון: המכון הרחב, קרן נובו נורדיסק, המכון הלאומי לחקר הגנום, הקרן לחקר סרטן ירוק של שרף, משפחת ריצ'רד וננסי לובין והחברה האמריקאית לסרטן. גישה ותמיכה של יחידת עיבוד Tensor (TPU) המסופקים על ידי גוגל.

ניקולס וינשטיין

ניקולס וינשטיין הוא העורך הראשי של אתר Datilin.