פתיחת סודות הדמיון הסלולרי: כיצד SCimilarity הופכת נתונים של תא בודד לתובנות על מחלות, התפתחות וביולוגיה של רקמות.
מנוע חיפוש Scimilarity. קרדיט תמונה: Scimilarity
במחקר שפורסם לאחרונה בכתב העת טֶבַעחוקרים בקנדה ובארצות הברית פיתחו את הדמיון של תא יחיד (SCimilarity), מסגרת לחיפושים מהירים ניתנים לפירוש של נתוני ריבונוקליין חומצה בודדת או גרעיני יחיד (sc/snRNA-seq). מסגרת זו מאפשרת גילוי של מצבי תאים דומים ברחבי אטלס התא האנושי.
רֶקַע
למעלה מ-100 מיליון תאים טופלו באמצעות sc/snRNA-seq בתנאים שונים, מה שמספק הזדמנויות חסרות תקדים לקשר בין מצבי תאים בהתפתחות, רקמות ומחלות. עם זאת, ניתוחים בקנה מידה גדול נותרו מוגבלים עקב אתגרים בהרמוניזציה של מערכי נתונים, הגדרת ייצוגים משותפים והיעדר מדדי דמיון חזקים או שיטות חיפוש ניתנות להרחבה.
גישות נוכחיות לרוב אינן מצליחות להכליל על פני מערכי נתונים ואינן יכולות לבצע שאילתות ביעילות באטלסים מסיביים עבור פרופילי תאים דומים. דרוש מחקר נוסף כדי לפתח מודלים בסיסיים המאפשרים חיפושים מדויקים, ניתנים להרחבה וניתנים לפירוש, תוך פתיחת הפוטנציאל המלא של אטלסים חד-תאיים לקידום גילוי ביולוגי.
לגבי המחקר
scRNA-seq יצרה פרופיל של מיליוני תאים בודדים על פני רקמות, מצבים ומחלות שונות, ומציעה הזדמנויות טרנספורמטיביות לקשר מצבים תאיים בהקשרים שונים.
עם זאת, השוואות אפקטיביות בין מערכי נתונים נותרו מוגבלות בשל אתגרים בהרמוניה של נתונים מגוונים, הגדרת ייצוגים משותפים ופיתוח מדדים מדויקים לכימות דמיון סלולרי.
תוך שמירה על מידע ספציפי למערך נתונים, מודלים קיימים לרוב לא מצליחים להכליל או לחפש ביעילות באטלסים גדולים אחר מצבי תאים דומים.
למידה מטרית, טכניקה המיושמת בהצלחה בתחומים כמו עיבוד תמונה, מציעה פתרון מבטיח. על ידי הטמעת פרופילי תאים במרחב משותף נמוך ממדים, ניתן לזהות תאים דומים מבחינה ביולוגית על פני מערכי נתונים עצומים. ייצוגים כאלה יכולים לאפשר חיפושים ניתנים להרחבה של תאים בהקשרים מגוונים, ולאפשר השוואות בין מערכי נתונים וגילוי ביולוגי
תוצאות המחקר
SCimilarity הדגימה הכללה על פני פלטפורמות פרופיל תא בודד מגוונות. למרות שהוכשר בעיקר על פי 10 נתוני Genomics Chromium, הוא הטמיע וסימן ביעילות פרופילי תאים מפלטפורמות מרובות, כולל מערכי נתונים של scRNA-seq ו-snRNA-seq.
לדוגמה, דגימות של תאים מונו-גרעיניים בדם היקפי אנושיים (PBMC) עם פרופיל על פני שבע פלטפורמות הפגינו דיוק עקבי של הערות חוצות פלטפורמות, למעט סוגי תאים נדירים כמו תאים דנדריטים קונבנציונליים (cDCs) ותאים דנדריטים פלסמציטואידים (pDCs).
אמנם נצפו הבדלים קלים במרחקי הטבעה, במיוחד עבור פלטפורמות שאינן 10x כגון Switching Mechanism At 5' End of RNA Template Sequencing (SMART-Seq2), SCimilarity שמרה על ביצועים גבוהים, והראתה את יכולת ההסתגלות שלה למקורות נתונים מגוונים.
יתרון מרכזי של SCimilarity הוא היכולת שלה לשלב מערכי נתונים ללא תיקון אצווה מפורש. על ידי כימות בטחון הייצוג עבור תאים בודדים, המודל מזהה חריגים ומעריך את ההכללה שלו לנתונים חדשים. לדוגמה, הערות בעלות אמון נמוכה היו קשורות לרקמות מיוצגות בצורה גרועה בנתוני אימון, כגון הקיבה ושלפוחית השתן. יכולת זו אפשרה בניית אטלס המשתרע על פני 30 רקמות אנושיות והקלה על השוואות בין רקמות.
המודל גם הצטיין בביאור סוגי תאים באמצעות מדד הדמיון המבוסס על הטבעה. SCimilarity בישר תאים בודדים באופן עצמאי, עוקף את הצורך בקיבוץ ואחזור התאים הדומים ביותר ביעילות. הוא השיג דיוק תחרותי עם שיטות קיימות כמו ANnotation של תא בודד תוך שימוש בהסקת משתנה (scANVI) ו- CellTypist, אפילו התאמת הערות עדינות הנתמכות על ידי סמני חלבון. לדוגמה, SCimilarity הערה 86.5% מהתאים בדגימות כליה בריאות בצורה נכונה בהשוואה לתוויות שסופקו על ידי המחבר, בביצועים דומים למודלים ספציפיים לרקמות.
יכולת הפרשנות של SCimilarity אומתה באמצעות Integrated Gradients, אשר זיהתה תרומות קריטיות של גנים להערות מסוג תאים. ייחוסי גנים אלו התאימו היטב לסמנים ידועים לסוגי תאים עיקריים, כגון גנים פעילי שטח המבדילים בין תאי ריאות מכתשית מסוג 2 (AT2). זה מדגים את היכולת של SCimilarity ללכוד תכונות בעלות משמעות ביולוגית ללא ידע מוקדם על חתימות ספציפיות לסוג תא.
יכולות השאילתה של המודל נבדקו באמצעות מקרופאגים הקשורים לפיברוזיס (FMΦs) ומיופיברובלסטים במחלת ריאות אינטרסטיציאלית (ILD). SCimilarity זיהה תאים דמויי FMΦ על פני מערכי נתונים של ILD, סרטן ומחלות פיברוטיות אחרות, וחשפה מצבים תאיים משותפים. יש לציין כי הוא חשף FMΦs בהקשרים נדירים, כגון אדנוקרצינומה של הלבלב (PDAC), מה שמרמז על הרלוונטיות הרחבה יותר שלהם בפיברוזיס.
כדי להמשיך ולחקור את התועלת שלו, SCimilarity חיפשה תאים דמויי FMΦ במבחנה. באופן מפתיע, הוא זיהה תאים שהתרביתו במערכת הידרוג'ל תלת מימדית כדומים מבחינה תעתיק ל-FMΦs. אימות ניסוי אישר את התחזית של SCimilarity, והדגים את הפוטנציאל שלו לזהות מצבי ניסוי חדשניים ומודל של מצבי תאים רלוונטיים למחלה במבחנה.
מסקנות
לסיכום, SCimilarity מקדמת ניתוח של תא בודד על ידי מתן אפשרות לחיפושים מדרגיים ויעילים על פני מערכי נתונים מגוונים של scRNA-seq ו-snRNA-seq.
בנוי על למידה מטרית, הוא מספק הערות ושאילתות של פרופילי תאים, תוך מינוף פרופילי ביטוי מלאים כדי להפחית הטיות מחתימות גנים שנאספו. דמיון מצטיין בזיהוי תאים דומים מבחינה תעתיק, ומקל על גילויים של מצבים חדשים כמו FMΦs ו-myofibroblasts על פני מחלות.
היכולת שלו להכליל למערכי נתונים בלתי נראים וזמינות הקוד הפתוח שלו הופכים אותו לכלי יסוד לחקר אטלס התא האנושי, תמיכה בחקירות ביולוגיות מגוונות וחשיפת תובנות לגבי ביולוגיה ומנגנוני מחלות אנושיים.