גישת למידת מכונה חדשה משפרת את ניתוח הנתונים של תא בודד

04:57
, 24 ינואר 2025
, בריאות ורפואה

הגוף שלנו מורכב מכ-75 מיליארד תאים. אבל איזה תפקיד ממלא כל תא בודד ובמה נבדלים התאים של אדם בריא מאלה של אדם עם מחלה? כדי להסיק מסקנות, יש לנתח ולפרש כמויות אדירות של נתונים. לשם כך מיושמות שיטות למידת מכונה. חוקרים מהאוניברסיטה הטכנית של מינכן (TUM) והלמהולץ מינכן בדקו כעת למידה בפיקוח עצמי כגישה מבטיחה לבדיקת 20 מיליון תאים או יותר.

בשנים האחרונות עשו החוקרים התקדמות ניכרת בטכנולוגיה של תא בודד. זה מאפשר לחקור רקמות על בסיס תאים בודדים ופשוט לקבוע את הפונקציות השונות של סוגי התאים הבודדים. הניתוח יכול לשמש, למשל, כדי לבצע השוואות עם תאים בריאים כדי לגלות כיצד עישון, סרטן ריאות או זיהום COVID משנים מבני תאים בודדים בריאות.

במקביל, הניתוח מייצר כמויות הולכות וגדלות של נתונים. החוקרים מתכוונים ליישם שיטות למידת מכונה כדי לתמוך בתהליך של פירוש מחדש של מערכי נתונים קיימים, גזירת הצהרות חותכות מהדפוסים ויישום התוצאות לתחומים אחרים.

למידה בפיקוח עצמי כגישה חדשה

פביאן תיס מחזיק בקתדרה למידול מתמטי של מערכות ביולוגיות ב-TUM. עם הצוות שלו, הוא חקר האם למידה בפיקוח עצמי מתאימה יותר לניתוח של כמויות נתונים גדולות מאשר שיטות אחרות. המחקר פורסם לאחרונה ב-Nature Machine Intelligence. צורה זו של למידת מכונה עובדת עם נתונים ללא תווית. אין צורך בנתוני מדגם מסווגים מראש. כלומר, אין צורך להקצות מראש את הנתונים לקבוצות מסוימות. נתונים ללא תווית זמינים בכמויות גדולות ומאפשרים ייצוג חזק של נפחי נתונים עצומים.

למידה בפיקוח עצמי מבוססת על שתי שיטות. בלמידה מסכת – כפי שהשם מרמז – חלק מנתוני הקלט מוסווה והמודל מאומן להיות מסוגל לשחזר את האלמנטים החסרים. בנוסף, החוקרים מיישמים למידה ניגודית שבה המודל לומד לשלב נתונים דומים ונתונים לא דומים נפרדים.

הצוות השתמש בשתי השיטות של למידה בפיקוח עצמי כדי לבדוק יותר מ-20 מיליון תאים בודדים והשווה אותם לתוצאות של שיטות למידה קלאסיות. בהערכתם את השיטות השונות, החוקרים התמקדו במשימות כמו חיזוי סוגי תאים ושחזור של ביטוי גנים.

סיכויים לפיתוח תאים וירטואליים

תוצאות המחקר מראות שלמידה בפיקוח עצמי משפרת את הביצועים במיוחד עם משימות העברה – כלומר, כאשר מנתחים מערכי נתונים קטנים יותר המבוססים על תובנות ממערך עזר גדול יותר. בנוסף, התוצאות של תחזיות תא אפס – במילים אחרות, משימות שבוצעו ללא אימון מקדים – גם הן מבטיחות. ההשוואה בין למידה מסכה ללמידה ניגודית מראה שלמידה מסכת מתאימה יותר ליישומים עם מערכי נתונים גדולים של תא בודד.

החוקרים משתמשים בנתונים כדי לעבוד על פיתוח תאים וירטואליים. אלו הם מודלים ממוחשבים מקיפים המשקפים את מגוון התאים במערך נתונים שונים. מודלים אלה מבטיחים לניתוח של שינויים תאיים כפי שניתן לראות במחלות, למשל. תוצאות המחקר מציעות תובנות חשובות כיצד ניתן לאמן מודלים כאלה בצורה יעילה יותר ולמטב עוד יותר.

ניקולס וינשטיין

ניקולס וינשטיין הוא העורך הראשי של אתר Datilin.