Search
Study: Multi-site benchmark classification of major depressive disorder using machine learning on cortical and subcortical measures. Image Credit: Elena Kalinicheva/Shutterstock.com

המחקר הגדול ביותר באמצעות למידת מכונה בהדמייה עצבית מציב רף חדש לאבחון דיכאון חמור

במחקר שפורסם לאחרונה ב-Scientific Reports, חוקרים קבעו סיווג אמת מידה של הפרעת דיכאון מג'ורי (MDD) באמצעות למידת מכונה (ML) על מדדים קורטיקליים ותת קורטיקליים.

לימוד: סיווג ריבוי אתרים של הפרעת דיכאון מג'ורי באמצעות למידת מכונה על מדדים קליפת המוח ותת קליפת המוח. קרדיט תמונה: Elena Kalinicheva/Shutterstock.com

רקע כללי

ל-MDD יש שכיחות לכל החיים של 14%, עם השפעה חברתית גדולה. לעתים קרובות זה מגביר את הסיכון להתאבדות ומפחית את איכות החיים של אנשים שנפגעו.

אבחון וטיפול מוקדם הם קריטיים, לאור האפשרות להזדקנות מואצת ולהתנגדות טיפולית. יתר על כן, חסרים סמנים ביולוגיים אמינים לניבוי ההתקדמות והתגובה הטיפולית.

אבחון MDD התבסס עד כה באופן בלעדי על תסמינים שדווחו על עצמם, אשר, בכל זאת, מציגים סיכון גבוה לאבחון שגוי. יתר על כן, מחלות נלוות, כגון הפרעות בספקטרום החרדה, הפרעות שימוש בחומרים ומחלות אחרות, תורמות לאתגרים הקשורים לאבחון וטיפול נכונים של MDD.

יש לציין כי שיטות הדמיה עצבית מתקדמות, כגון הדמיית תהודה מגנטית (MRI), אפשרו בחינת שינויים בקליפת המוח ותת-קורטיקליים הקשורים ל-MDD. עם זאת, גדלי אפקט קטנים והסקת מסקנות ברמת הקבוצה מונעים יישום קליני.

כלים כמו ML מאפשרים הסקה ברמת הפרט ועשויים לספק אבחנה טובה יותר בין חולים עם MDD לבין אנשים בריאים.

לגבי המחקר

במחקר הנוכחי, החוקרים קבעו סיווג אמת מידה של MDD באמצעות ML על מדדים קורטיקליים ותת קורטיקליים. הם כללו חולי MDD ובקרות בריאות (HCs) מ-30 קבוצות שהשתתפו בקבוצת העבודה ENIGMA MDD.

אנשים עם פחות מ-75% מהמאפיינים המשולבים של קליפת המוח ותת-קורטיקה ואלה עם נתונים קליניים או דמוגרפיים חסרים לא נכללו.

סריקות MRI מוח תלת מימדיות (3D) מבנות T1 נרכשו מכל אתר ועובדו מראש לפי פרוטוקולי ENIGMA Consortium.

פילוח החומר האפור בקליפת המוח התבסס על אטלס Desikan-Killiany, בעוד שהפילוח התת-קורטיקלי התבסס על אטלס Aseg. הנתונים פוצלו למערכי נתונים של הדרכה ובדיקות לפי גיל/מין ואתר (של רכישת MRI).

עבור שתי אסטרטגיות הפיצול, הנתונים פוצלו לעשרה קפלים; תשעה שימשו לאימון, ואחד שימש למערך המבחן. זה חזר על עצמו באופן איטרטיבי עד שכל קיפול שימש פעם אחת כסט מבחן, ובכך ביצע את האימות הצלב פי עשרה.

הצוות השתמש במודלים של סיווג ליניארי ולא ליניארי רדודים, כגון מכונות וקטור תמיכה (SVM), רגרסיה לוגיסטית עם סוגים שונים של רגוליזציה (LASSO, רכס, רשת אלסטית) ויערות אקראיים.

ממצאים

בסך הכל, 2,288 חולי MDD ו-3,077 HCs נכללו בניתוח. היו הבדלים מהותיים בהתפלגות המין והגיל בין העוקות. כשהם מפוצלים לפי גיל/מין, הקוהורטות חולקו באופן שווה על פני הקפלים.

לעומת זאת, פיצול הנתונים לפי אתרים גרם לפיזור לא אחיד של המשתתפים. ביצועי הסיווג של דגמים היו ניתנים להשוואה.

הדיוק המאוזן הגבוה ביותר היה 0.639 בחלוקה לפי גיל/מין. הביצועים של כל הדגמים הופחתו כאשר הנתונים עברו הרמוניה עם ComBat. בפיצול לפי אתר, לא היו שינויים משמעותיים בביצועי הסיווג, ללא קשר להרמוניזציה.

הדיוק המאוזן היה קרוב למקריות אקראית, דבר המצביע על כך שהמודלים לא יכלו להבחין בין חולי MDD לבין HCs.

לא התרחשו שיפורים מהותיים אפילו עם אלגוריתמי הרמוניזציה מתוחכמים יותר (CovBat ו-ComBat-GAM). הצוות העריך משקלים של SVM עם גרעין ליניארי כדי לקבוע אילו אזורים תרמו לסיווג.

ביצועי SVM הונעו בעיקר על ידי אותן תכונות קורטיקליות עם ובלי הרמוניזציה של ComBat. לתכונות של עובי קליפת המוח היה משקל גדול יותר משטחי פני הקורטיקליים.

יתרה מכך, הדיוק המאוזן הגבוה ביותר היה 0.632 עבור גברים ו-0.585 עבור נשים באסטרטגיית הפיצול לפי גיל/מין, שהצטמצם ל-0.53 ו-0.529 לאחר הרמוניזציה ComBat.

בפיצול לפי אתר, הדיוק המאוזן לא השתנה לאחר ההרמוניה. באסטרטגיית פיצול גיל/מין, הדיוק ירד לאחר הרמוניזציה מ-0.564 ל-0.529 עבור תת-קבוצה של משתתפים שאינם משתמשים בתרופות נוגדות דיכאון ומ-0.716 ל-0.534 עבור תת-קבוצה של משתמשים בנוגדי דיכאון.

מסקנות

החוקרים סימנו את ביצועי ה-ML תוך שימוש במדדים קליפתיים ותת-קורטיקלים כדי להבדיל בין חולי MDD לבין HCs. הדיוק המאוזן היה בסביבות 62% ו-51% כאשר הנתונים פוצלו לקפלים לפי גיל/מין ואתר, בהתאמה.

הרמוניזציית נתונים איזנה את הביצועים עבור שתי אסטרטגיות הפיצול והניבה דיוק מאוזן של עד 52%. זה מרמז שהבדלי ביצועים ראשוניים נבעו מתופעות לוואי, שכנראה נובעות מהבדלים בהליכי רכישת MRI.

הבדלים קלים התרחשו כאשר מערך הנתונים היה ריבד על סמך פרמטרים קליניים ודמוגרפיים. הממצאים מצביעים על כך שאלגוריתמים נפוצים של ML אינם יכולים להבחין בין MDD לבין HCs על סמך נתונים מורפומטריים של מבנה המוח בלבד.

יתרה מכך, ביצועי הסיווג לא השתפרו בקבוצות מרובדות, דמוגרפית וקלינית יותר הומוגניות.

לכן, יש צורך במחקרים נוספים כדי לקבוע אם אלגוריתמים מתוחכמים יותר יכולים להשיג ביצועים טובים יותר.

דילוג לתוכן