במחקר שפורסם לאחרונה בכתב העת NPJ Digital Medicineחוקרים השתמשו במערך הנתונים בקנה מידה גדול של מד התאוצה מ-Biobank של בריטניה (בריטניה), המורכב מנתונים לא מסומנים במשך 700,000 ימי אדם כדי לבנות מודלים לניטור רמות הפעילות הגופנית עם יותר דיוק והכללה.
מחקר: למידה בפיקוח עצמי לצורך זיהוי פעילות אנושית תוך שימוש ב-700,000 ימי אדם של נתונים לבישים. קרדיט תמונה: sutadimages / Shutterstock
רקע כללי
תחום הבריאות ראה עלייה מהירה בפיתוח ושימוש במכשירים לבישים עם חיישנים שיכולים לשמש למעקב בריאות וכושר, ניטור מטופלים מרחוק, ניסויים קליניים הדורשים נתונים בזמן אמת, גילוי מוקדם של מחלות, רפואה מותאמת אישית. , וביצוע מחקרי בריאות בקנה מידה גדול. מכשירים אלה מספקים מדדי סיכום על תנועה, איכות שינה, ספירת צעדים, קצב וזמן ישיבה. עם זאת, יש צורך באלגוריתמים אמינים כדי לקבל מידע על פעילות אנושית מהנתונים שנאספו על ידי החיישן.
בעוד שתחומים כמו עיבוד שפה טבעית וראייה ממוחשבת התקדמו באופן משמעותי בשל הזמינות של עודפי נתונים להכשרת מודלים אלה של למידה, המחסור במערכי נתונים בקנה מידה גדול שניתן להשתמש בהם לאימון אלגוריתמים הגביל את ההתקדמות בפיתוח מודלים המאפשרים אמינות לזהות במדויק פעילות אנושית. המחסור בנתונים מספיקים לאימון מודלים אלה שיבש גם את הממצאים על מודלים של למידה עמוקה, דבר המצביע על כך שמודלים של למידה עמוקה אינם מניבים ביצועים טובים יותר משיטות קונבנציונליות כמו סטטיסטיקה פשוטה.
לגבי המחקר
במחקר הנוכחי, החוקרים השתמשו במערך הנתונים של מד התאוצה מה-Biobank של בריטניה כדי לאמן את המודלים של למידה עמוקה לזהות פעילות גופנית במדויק. ביובנק הבריטי ערך מחקר מד תאוצה רחב היקף בו גויסו קרוב לחצי מיליון משתתפים. למעלה ממאה אלף מהמשתתפים הללו לבשו מד תאוצה על פרק כף היד במשך שבוע אחד בסביבתם הטבעית, בניגוד להגדרה המבוססת על מעבדה. זה סיפק כ-700,00 ימי אדם של נתוני תנועה אנושיים חיים חופשיים.
סקירה כללית של צינור הלמידה המוצע בפיקוח עצמי. שלב 1 כולל למידה מרובת משימות בפיקוח עצמי על 700,000 ימי אדם של נתונים מהביובנק הבריטי. בשלב 2, אנו מעריכים את התועלת של הרשת שהוכשרה מראש בשמונה קווי בסיס לזיהוי פעילות אנושית באמצעות למידת העברה.
החוקרים השתמשו בגישת למידה בפיקוח עצמי, אשר שימשה בהצלחה עבור דוגמאות כגון שנאים מיומנים מראש או GPT. מחקרים אחרונים השתמשו במספר גישות למידה בפיקוח עצמי כגון שחזור רעולי פנים, פיקוח עצמי מרובה משימות, אתחול, ולמידה ניגודית כדי לבחון ניתוח נתונים מחיישנים לבישים. המחקר הנוכחי יישם את שיטת הפיקוח העצמי מרובה משימות על מערך הנתונים הגדול של Biobank בבריטניה כדי להראות כיצד ניתן להכליל מודל מאומן מראש למגוון רחב של מערכי נתונים מבוססי פעילות עם משמעות בריאותית וקלינית.
שיטת הלמידה של הפיקוח העצמי מרובת משימות יושמה לראשונה על מערך מד התאוצה בקנה מידה גדול מה-Biobank של בריטניה כדי לאמן את הרשת העצבית העמוקה. לאחר מכן, שמונה מערכי נתונים שימשו להערכת הביצועים של הרשת העצבית המאומנת מראש ולהעריך את איכות הייצוג על אוכלוסיות וסוגי פעילות שונים.
נעשה שימוש במערכי נתונים מסומנים כדי להעריך את הצלחת המודל בלמידה של העברה. בנוסף, המחקר השתמש גם בגישת דגימה משוקללת כדי לעקוף את הבעיה של תקופות לא אינפורמטיביות של תנועה נמוכה. לנתונים מהעולם האמיתי שנאספים מחיישני תנועה יש תקופות של חוסר פעילות, ואותות סטטיים כאלה אינם משתנים במהלך הטרנספורמציה, ומציגים בעיות עבור משימות למידה בפיקוח עצמי. לכן, כדי לשפר את ההתכנסות והיציבות של תהליך האימון, החוקרים יישמו גישת דגימה משוקללת שבה נדגמו חלונות נתונים בפרופורציה, והשתמשו בסטיית תקן של דגימות אלו לניתוח.
תוצאות
התוצאות הראו שכאשר המודלים שהוכשרו במחקר זה נבדקו על שמונה מערכי נתונים בנצ'מרק, הם עלו על קווי הבסיס עם שיפור יחסי חציוני של 24.4%. יתר על כן, ניתן להכליל את המודל על פני מגוון רחב של התקני חיישני תנועה, סביבות חיים, קבוצות ומערכי נתונים חיצוניים.
שיטת ההדרכה המוקדמת של פיקוח עצמי מרובת משימות נמצאה יעילה גם בשיפור ההכרה במורד הזרם של פעילות אנושית, אפילו במערכי נתונים קטנים ללא תווית. ההדרכה המוקדמת בפיקוח עצמי יכולה גם היא לתפקד טוב יותר מהשיטה המפוקחת.
החוקרים ציינו כי מחקר זה הוכיח שניתן ליישם את שיטת הפיקוח העצמי מרובת משימות ללמידה על מערכי נתונים מחיישנים לבישים ובנה מודלים לזיהוי פעילות מדויקים וניתנים להכללה באמצעות אלגוריתמים של למידה עמוקה.
צוות החוקרים גם פרסם את המודלים שהוכשרו מראש לקהילת המחקר העוסקת בבריאות דיגיטלית, כך שניתן יהיה לבנות על בסיסם מודלים בעלי ביצועים גבוהים לשימוש בתחומים שונים אחרים הכוללים נתונים מסומנים מוגבלים.
מסקנות
לסיכום, המחקר השתמש במערך נתונים בקנה מידה גדול ללא תווית מה-Biobank של בריטניה, המורכב מנתוני מד תאוצה כדי לאמן מראש מודלים של למידה עמוקה באמצעות גישה בפיקוח עצמי. מודלים מאומנים מראש אלה ביצעו מעבר לרמות הבסיס בניתוח מדויק של נתוני חיישני תנועה על פני מערכי נתונים שונים בקבוצות, מכשירי חיישנים וסביבות חיים. החוקרים מאמינים שניתן לבנות על מודלים אלה ולהשתמש בהם עבור תרחישים שונים הכוללים כמויות מוגבלות של נתונים מסומנים.