Search
Image Credit: ESB Professional/Shutterstock.com

ראיון עם רמי מהיו, מומחה התוכנה והאינפורמטיקה של אילומינה

בראיון זה, Rami Mehio, ראש תחום תוכנה ואינפורמטיקה ב- Illumina, חולק את חוויותיו ותרומותיו לפרויקטים גנומיים גדולים כמו ריצוף הגנום המלא של בנק הביולוגי הבריטי. הוא דן באתגרים ובחידושים בניתוח נתונים גנומי, ומדגיש את תפקידה של אילומינה בקידום המחקר הגנטי ורפואה מדויקת.

תוכל בבקשה להציג את עצמך ולתת לנו תיאור קצר של הרקע המקצועי שלך?

שמי רמי מהיו. אני מוביל את פיתוח התוכנה והאינפורמטיקה באילומינה. הצטרפתי לאילומינה בשנת 2018 כחלק מרכישת Edico Genome ומאז אני אחראי לפיקוח על ביואינפורמטיקה, תוכנות סיקוונסר, פלטפורמות נתונים בענן ותוכנות קליניות בכל הפורטפוליו של Illumina. לפני שהצטרפתי לאילומינה, הייתי ב-Edico ועמדתי בראש הפיתוח של מעבד ה-DRAGEN BioIT ועזרתי במסחור שלו.

האם תוכל לתאר את התפקיד והתרומות הספציפיות של Illumina בפרויקט ריצוף הגנום המלא של הביובנק הבריטי, במיוחד במונחים של הטכנולוגיה והמומחיות הניתנת?

Illumina היא שותפת טכנולוגיית הרצף של הפרויקט, כלומר רצף הגנום השלם (WGS) נעשה עם רצפי Illumina. Illumina נבחרה גם כשותפה לביואינפורמטיקה בניתוח של כל גנום והקריאה המשותפת שלו לקבוצה. ככזה, הניתוח המשני בוצע באמצעות צינור הנבט עטור הפרסים של DRAGEN עם מיפוי גרף מרובה גנומים וקריאת וריאנטים. כדי לעמוד בקצב של משימות החישוב והאחסון של 500,000 WGS, הצבירה בוצעה עם DRAGEN iterative gVCF genotyper (IGG) על פלטפורמת הענן Illumina Connected Analytics (ICA) והשתמשה בסינון מבוסס ML המאפשר רגישות ודיוק משופרים של גרסאות.

קרדיט תמונה: ESB Professional/Shutterstock.com

טיפול וניתוח של מערך נתונים נרחב כל כך חייבות להציג אתגרים ייחודיים. מה היו האתגרים הללו, וכיצד הטכנולוגיה של אילומינה התייחסה אליהם?

האתגר העיקרי היה להבטיח שיש לנו את התשתיות החישוביות הנכונות כדי לתמוך בניתוח 500,000 גנומים. הניתוח המשני של 500,000 הגנומים נעשה תוך כשישה שבועות בשירות האינטרנט של אמזון (AWS). היינו צריכים להקים תהליכי אבטחת איכות כדי לוודא שעבודות הניתוח של שאר הלקוחות שלנו לא היו מורעבות מצמתי מחשוב.

אתגר נוסף שחווינו היה עם צבירה, במיוחד עם מספר הקבצים, מספר קריאות ה-API, גודל הנתונים והעלות. התרגיל הזה אפשר לנו לתכנן ולכוון את DRAGEN IGG ו-ICA כדי להפוך אותו למוצר שאין שני לו ומסוגל לצבור מיליוני גנומים בדיוק גבוה ובעלות נמוכה. הארכיטקטורה אפשרה גם לפתור את בעיית N+1. זה אומר שאם היינו צוברים אלף גנומים נוספים, נוכל לעשות זאת בהדרגה ולא לבצע את העבודה של 510,000.

כיצד הטכנולוגיה של Illumina משפרת את הזיהוי של גרסאות גנטיות שכיחות פחות, ואיזו השפעה יש לכך על המחקר הגנטי?

לצינור DRAGEN יש תכונות ייחודיות המשפרות את הרגישות והדיוק של הנתונים, כלומר אנחנו יכולים לזהות גרסאות שצינורות אחרים מתקשים לזהות. DRAGEN עושה זאת על ידי שימוש בטכנולוגיית גנום מרובה התייחסות התואמת טוב יותר את ההתייחסות לדגימות. זה מאפשר זיהוי ומיפוי מדויקים באזורים קשים ופולימורפיים מאוד של הגנום. הכנסנו גם למידת מכונה בגרסאות המאוחרות שלנו של DRAGEN, מה שמאפשר לנו להפחית באופן משמעותי תוצאות חיוביות שגויות תוך שיפור הרגישות. הדיוק והרגישות של DRAGEN הועמדו למבחן ואושרו עם שני פרסי PrecisionFDA בתחום מחלות נבט, מחלות תורשתיות ואונקולוגיה.

באילו דרכים הטכנולוגיה שלך מבטיחה שהנתונים מהפרויקט הזה תואמים וניתנים להשוואה למחקרי בריאות אחרים בקנה מידה גדול?

הקרדיט על כך מגיע לביובנק הבריטי ולחברי קונסורציום הפארמה שלו, כמה מהמובילים בתוכנית כולנו ומרכזי הרצף הקשורים אליו, והמנהיגות ב- Genomics England. הם הסכימו לאמץ את אותה גרסה של צינור ה-DRAGEN, ואילומינה הצליחה לתמוך ולהסיר מכשולים. סיפקנו פרטים על הצינור והתצורות במיקום המרכזי שלנו ועבדנו בצמוד לכל תוכנית כדי להבטיח עקביות בין הקבוצות. צינור משותף הוא הכרחי מרכזי כדי שהנתונים יהיו תואמים ויגדילו את הכוח הסטטיסטי של הקבוצות.

אילו התקדמות בתוכנה ובאינפורמטיקה צמחו מהפרויקט הזה, וכיצד הם פורצים את גבולות המחקר הגנומי?

זהו כנראה האגרגציה הגדולה ביותר של רצף גנום שלם בעולם בזמן זה. בדרך כלל, צבירת קבוצות גדולות היא די קשה. מניסיוננו, פרויקטים נוטים לעתים קרובות להיאבק כאשר הם מתמודדים עם יותר מ-10,000 דוגמאות. DRAGEN IGG ב-ICA מסוגלת כעת להתאים למאות אלפי דגימות תוך פתרון בעיית N+1 – הוספת עוד 10,000 דגימות לקוהורט של 500,000 לא מחייבת את המשתמש להתחיל מחדש את ההתקשרות המשותפת מההתחלה.

בהתבסס על התוצאות של פרויקט זה, מהן ההשלכות הרחבות יותר על מחקר ושירותי בריאות עתידיים, במיוחד בהקשר של רפואה מדויקת?

נתוני WGS יאפשרו לחוקרים לזהות גרסאות נדירות שאינן מקודדות התורמות להתפרצות המחלה ולהתקדמותן. זה גם יזהה מוטציות המגנות מפני מחלות. על ידי שילוב של נתוני ה-WGS עם הנתונים הקליניים וסגנון החיים העשירים של משתתפי ביובנק בבריטניה, החוקרים מצוידים כעת באופן ייחודי לענות על שאלות לגבי מדוע אנשים מסוימים מפתחים מחלות מסוימות אך אחרים לא ומדוע מצבים מסוימים מחמירים אצל אנשים מסוימים עם הזמן.

קרדיט תמונה: Mongkolchon Akesin/Shutterstock.com

קרדיט תמונה: Mongkolchon Akesin/Shutterstock.com

זה גם יעזור להאיץ את הגילוי והפיתוח של תרופות על ידי כך שיאפשר לחוקרים לזהות מטרות תרופות חדשות. זה חשוב מכיוון שחברות תרופות מצאו שמטרות תרופות פוטנציאליות הנתמכות בראיות גנטיות ברורות הן בסבירות גבוהה פי שניים להוביל לתרופות יעילות.

האם אתה יכול לדון בחשיבות של שיתוף פעולה ושותפות, כמו זה שניתן לראות בפרויקט הביובנק הבריטי, בקידום המחקר הגנומי?

באמצעות שיתוף פעולה, שותפות זו אפשרה את החלום של ריצוף וניתוח של מספר רב של גנומים במטרה לשפר את שירותי הבריאות להפוך למציאות.

החזון של הביובנק הבריטי להפקה והפיכת קבוצות הנתונים הללו לזמינות לציבור ראוי לשבח. זה פותח את הדלת להערכות ציוני סיכון פוליגניים וגילויי תרופות מדויקים יותר.

באמצעות שיתוף הפעולה הזה, התוכנה של Illumina הבשילה, והיכולות שלנו גדלו. ביססנו את היכולות שלנו בתחום האינפורמטיקה וזה אפשר לנו להביא משמעות מדויקת יותר לנתונים.

היכן יכולים הקוראים למצוא מידע נוסף?

על רמי מהיו

רמי הוא ראש פיתוח תוכנה ואינפורמטיקה העולמי באילומינה. הוא הצטרף לאילומינה ב-2018 כחלק מרכישת Edico Genome והרחיב את המנהיגות שלו ללא הרף, הכוללת כעת פיקוח על כל תוכנות המכשירים, פלטפורמות הענן, הביואינפורמטיקה והתוכנות הקליניות על פני כל הפורטפוליו של Illumina. במהלך השנים האחרונות, ארגונו של Rami סייע לבסס את Illumina כספקית מובילה באינפורמטיקה, המספקת מוצרי תוכנה חדשניים ואמינים שפותחו בשיתופי פעולה עמוקים עם KOLs.

דילוג לתוכן