פרופיל חלבון וגנים בקנה מידה גדול הרחיב באופן מסיבי את הנוף של חלבונים ומוטציות גנים הקשורים לסרטן, אך היה קשה להבחין אם הם ממלאים תפקיד פעיל במחלה או שהם עוברי אורח תמימים. במחקר שפורסם ב סרטן הטבעחוקרים ממכללת Baylor of Medicine חשפו גישה מבוססת למידת מכונה חזקה וחסרת פניות בשם FunMap להערכת התפקיד של מוטציות הקשורות לסרטן וחלבונים שלא נחקרו, עם השלכות רחבות על קידום הביולוגיה של הסרטן והסברה של אסטרטגיות טיפוליות.
"השגת מידע תפקודי על הגנים והחלבונים הקשורים לסרטן היא צעד חשוב לקראת הבנה טובה יותר של המחלה וזיהוי מטרות טיפוליות פוטנציאליות", אמר המחבר המקביל ד"ר בינג ג'אנג, פרופסור לגנטיקה מולקולרית ואנושית וחלק ממחקרי לסטר וסו סמית'. מרכז השד בביילור.
"הגישה שלנו להשיג תובנות פונקציונליות לגבי הגנים והחלבונים הללו הכרוכה בשימוש בלמידת מכונה לפיתוח רשת הממפה את הקשרים התפקודיים ביניהם", אמר ג'אנג, חבר במרכז הסרטן המקיף של דן ל. דאנקן של ביילור ומלומד מקנייר. "זה כאילו, אולי אני לא יודע עליך כלום, אבל אם אני יודע את הקשרים שלך בלינקדאין, אני יכול להסיק מה אתה עושה."
הצוות פיתח את FunMap, רשת פונקציונלית של 10,525 גנים שנבנתה באמצעות שיטת למידת מכונה מפוקחת המשלבת מערכי נתונים של חלבונים ונתוני רצף RNA מ-11 סוגי סרטן שהותאמו לאחרונה על ידי קבוצת העבודה הפאן-סרטנית (Clinical Proteomic Tumor Analysis Consortium (CPTAC).
"עם FunMap מצאנו 196,800 אסוציאציות בין 10,525 חלבונים – כיסוי פרוטאומי מקיף וחסר פניות ורמה גבוהה של רלוונטיות תפקודית", אמר ג'אנג. "שני הבדלים מרכזיים בין הגישה שלנו ובין מחקרי רשת ביטוי משותף של גנים קודמים הם ראשית, השילוב של נתוני חלבון סרטן עם נתוני ביטוי mRNA ושנית, היישום של למידת מכונה מפוקחת כדי ליצור סינרגיה של כל מערכי הנתונים כדי למקסם את כוח הניבוי. באופן בלתי צפוי, שלנו הגישה הובילה לביצועים טובים יותר מרשתות אינטראקציה בין חלבונים בהבחנה בין צמדי גנים רלוונטיים פונקציונליים ובלתי רלוונטיים."
באמצעות ניתוח רשת, FunMap חושף מודולי חלבון וארגון מודולרי היררכי הקשור לסימני היכר ומאפיינים קליניים של סרטן, מנבא את הפונקציות של חלבוני סרטן שלא נחקרו, מציע תובנות מעמיקות יותר לגבי גורמי סרטן מבוססים ומזהה נהגים עם תדירות מוטציות נמוכה.
יותר מ-200 גנים מתבטאים בצורה מוגזמת או בתת-ביטוי בסרטן, אך אנו יודעים מעט מאוד על התפקידים הספציפיים שלהם במחלה. כשמיפינו את הגנים האלה ברשת שלנו, הצלחנו להסתכל על השכונה ולעשות תחזית לגבי תפקודם".
ד"ר בינג ג'אנג, פרופסור לגנטיקה מולקולרית ואנושית, מכללת ביילור לרפואה
לדוגמה, הביטוי של הגן שלא נחקר MAB21L4 נמוך באופן משמעותי בשלושה סוגים של גידולי סרטן. FunMap הראה ששכונת הרשת של הגן הזה מועשרת בגנים הקשורים להתמיינות תאי אפיתל, שלדיכוי יש תפקיד קריטי בהתקדמות הגידול. נתוני דירוג גידולים קליניים, יחד עם מחקר שנערך לאחרונה הראה כי אובדן של MAB21L4 חוסם התמיינות כדי להניע התפתחות של קרצינומה של תאי קשקש, מספקים ראיות חזקות לתמוך בתפקיד מדכא הגידול של MAB21L4.
יתרה מכך, מינוף שיטות למידה עמוקה מתקדמות עם FunMap חשף מספר גורמי סרטן שלא זוהו בעבר עם תדרים נמוכים של מוטציות, כולל תפקיד חדש של מדכא גידולים עבור LGI3נתמך בנתונים ניסיוניים של נוקאאוט גנים.
מחקר זה מדגיש את הפוטנציאל הגדול של שילוב למידת מכונה ופרופיל פרוטאוגנומי כדי להשיג הבנה מעמיקה יותר של מערכות סרטן מורכבות. על ידי יצירת רשת תפקודית מקיפה, גישה זו מספקת מסגרת חזקה למחקר גנומיקה תפקודית של סרטן, ומציעה תובנות חשובות לגבי מוטציות וחלבונים הקשורים לסרטן.
"ממצאים אלה יכולים לסייע רבות בתעדוף יעדים לתרגום קליני, ובסופו של דבר לתרום לפיתוח של טיפולים יעילים יותר לסרטן", אמר ג'אנג.
חבילת FunMap Python היא קוד פתוח לחלוטין וזמינה להורדה מאינדקס חבילות Python (https://pypi.org/project/funmap).
ליצירה זו תרמו גם המחברים הראשונים, Zhiao Shi וג'ונתן T. Lei, וג'ון M. Elizarraras. כולם קשורים למכללת ביילור לרפואה.
המחברים מכירים בתרומות מה- CPTAC וקבוצת העבודה שלו לניתוח הפאן-סרטן. עבודה זו נתמכה על ידי מענקים של המכון הלאומי לבריאות מהמכון הלאומי לסרטן (U24 CA210954, U24 CA271076, R01 CA245903 ו-U01 CA271247), על ידי המכון למניעת סרטן וחקר הסרטן של טקסס (CPRIT) (פרס RR160027), מלגת CPRIT מלגת סרטן של המכון הרפואי מקנייר ב-Robert and קרן ג'ניס מקנייר.