Search
Brief Communication: MassiveFold: unveiling AlphaFold’s hidden potential with optimized and parallelized massive sampling. Image Credit: Shutterstock AI

MassiveFold מקדם חיזוי מבנה חלבון עם עיבוד מקביל יעיל

עם MassiveFold, מדענים פתחו את מלוא הפוטנציאל של AlphaFold, והפכו את תחזיות החלבון בעלות ביטחון גבוה למהירות יותר ונגישות יותר, מה שמניע פריצות דרך בביולוגיה ובגילוי תרופות.

תקשורת קצרה: MassiveFold: חשיפת הפוטנציאל החבוי של AlphaFold עם דגימה מאסיבית אופטימלית ומקבילה. קרדיט תמונה: Shutterstock AI

במחקר שפורסם לאחרונה בכתב העת מדע חישובי הטבעחוקרים מצרפת פיתחו את MassiveFold, גרסה משופרת של AlphaFold המותאמת במיוחד לעיבוד מקביל. הם שאפו להפחית את זמן החיזוי עבור מבני חלבון מחודשים לשעות. הם גילו כי MassiveFold שיפר ביעילות מודלים מבניים עבור חלבונים ומכלולי חלבונים תוך הורדת עלויות חישוב, הגדלת איכות החיזוי והיותה ניתנת להרחבה על פני מערכי חומרה שונים.

רֶקַע

AlphaFold ומסד הנתונים של מבנה החלבון של AlphaFold שינו את הגישה לחיזוי מבנה החלבון, ומאפשרים מודלים של שרשרות בודדות ומכלולי חלבון מורכבים. עם זאת, למרות היתרונות של דגימה נרחבת עם AlphaFold, היא נותרת תובענית מבחינה חישובית וגוזלת זמן.

דגימה מסיבית הוכחה כחושפת מגוון מבני ושונות קונפורמציה במונומרים ובמתחמי חלבון, כולל מכלולים מורכבים כמו קומפלקסים של ננו-גוף ואינטראקציות אנטיגן-נוגדנים. אבל הדגימה הגבוהה הזו, תוך שיפור דיוק הניבוי, מגיעה עם אתגרים גדולים במונחים של ביקוש ל-GPU וזמני עיבוד ארוכים.

באופן ספציפי, הדרישות הגבוהות של יחידת העיבוד הגרפית (GPU) של AlphaFold וחוסר היכולת שלה לפעול במקביל יוצרים מגבלות מעשיות. ריצות סטנדרטיות של AlphaFold-Multimer, במיוחד עבור מכלולים גדולים, חורגות לעתים קרובות מזמני אשכול ה-GPU שנקבעו על ידי תשתיות מחשוב, מה שמפריע להשלמת תחזיות מורכבות. זה הופך את מלוא הפוטנציאל של AlphaFold למאתגר למימוש במסגרת מגבלות המשאבים הקיימים של GPU, מה שמניע לפיתוח פתרונות יעילים יותר עבור תחזיות מבניות עם שרשרת בודדת ומורכבות כאחד.

כדי להתמודד עם האתגרים הללו, החוקרים במחקר הנוכחי פיתחו את MassiveFold, גרסה מקבילה הניתנת להתאמה אישית של AlphaFold שמפיצה משימות מחשוב בין CPUs ו-GPUs כדי להאיץ את החיזוי של מבני חלבון.

על המחקר

MassiveFold גרסה 1.2.5, שפותחה ב-Bash ו-Python 3, שילבה את יכולות חיזוי המבנה של AlphaFold עם דגימה משופרת באמצעות AFmassive או ColabFold והקבילה מיטבית בין יחידות עיבוד מרכזיות (CPUs) ו-GPUs. תוכנן לגמישות, הוא מאפשר למשתמשים להתאים פרמטרים כמו שיעורי נשירה, שימוש בתבניות ושלבי מיחזור המצוינים בקובץ JavaScript Object Notation (JSON) כדי להגדיל את הגיוון המבני. מנהל עומסי העבודה של SLURM מאזן משאבים ביעילות על ידי התאמת גדלי אצווה כדי להבטיח שעבודות יושלמו בזמן המיועד.

התהליך כלל את השלבים הבאים: (1) יצירת יישור בליבות מעבד (באמצעות JackHMMer, HHblits או MMseqs2), (2) הסקת מבנה מבוססת אצווה על GPUs, ו-(3) שלב אחרון עיבוד אחרון לדירוג תחזיות ו ליצור עלילות. תכונה חוסכת זמן היא שניתן לעשות שימוש חוזר גם ביישורים מחושבים מראש. סקריפט אוסף תוצאות מריצות מרובות לאיחוד דירוגים, כפי שנעשה במחקר Critical Assessment of Structure Prediction 16 (CASP16), שבו MassiveFold יצר ודירג עד 8,040 תחזיות לכל יעד.

תוצאות ודיון

נמצא כי MassiveFold מגדיל ביעילות את הגיוון והביטחון של תחזיות מבניות חלבון על ידי התאמת פרמטרי דגימה, מיחזור ונשירה, ובכך מייצרת מבנים בעלי ביטחון גבוה עבור יעדי חלבון מורכבים. לדוגמה, ביעד CASP15 H1140, MassiveFold יכול ליצור מבנים מגוונים מרובים עם ציוני ביטחון גבוהים על ידי הרחבת הדגימה ושימוש בנשירה ללא תבניות.

בנוסף, השימוש במחזור מורחב הגביר את המגוון המבני, גישה שאושרה עם יעדי CASP שונים.

בדיקות שהשוו בין MassiveFold ל-AlphaFold3 על יעדי CASP15 הראו שגישת הדגימה המאסיבית של MassiveFold יצרה מודלים טובים עבור שבעה מתוך שמונה יעדים, בעוד ש-AlphaFold3 השיגה ביצועים שוליים על MassiveFold רק בשלושה מתוך שמונה היעדים. שילוב של AlphaFold3 ב- MassiveFold מתוכנן כדי לשפר עוד יותר את המודלים לחיזוי נוגדנים-אנטיגן, תוך שילוב פוטנציאלי של היתרונות הייחודיים של שני הכלים.

מַסְקָנָה

לסיכום, MassiveFold מדגים כי ניתן להשיג את ההתגברות על המגבלות החישוביות של AlphaFold הסטנדרטי, במיוחד עבור מכלולי חלבון גדולים ומורכבים. MassiveFold עשתה אופטימיזציה של השימוש באשכולות GPU לחיזוי מבנה חלבון בקנה מידה גדול, תוך איזון משאבי GPU ו-CPU כדי להתמודד עם דגימה מאסיבית ביעילות.

עיצוב זה לא רק שיפר את הגיוון המבני והפחית את זמן החישוב, אלא גם איפשר גמישות הן להגדרות גדולות של ריבוי GPU והן לסביבות עם GPU יחיד. היכולות של MassiveFold הופכות אותו למתאים היטב לחקירה נרחבת של נוף חיזוי מבנה החלבון AlphaFold, המבטיח יישומים משמעותיים במחקר ובגילוי תרופות.

דילוג לתוכן