Search
child eating french fries with sauce

תובנות בינה מלאכותית לגבי סיכון האכילה וההשמנה של ילדים

על ידי לימוד בינה מלאכותית לזהות כל ביס שילד נוטל, מדענים חושפים דפוסי אכילה נסתרים שיכולים לשנות את האופן שבו אנו מונעים השמנת יתר משולחן האוכל כלפי חוץ.

מחקר: ByteTrack: גישת למידה עמוקה לספירת נשיכות וזיהוי קצב נשיכה באמצעות סרטוני ארוחות בילדים. קרדיט תמונה: Andrii Spy_k/Shutterstock.com

התנהגויות אכילה שופכות אור על הסיכון לצריכת יתר והשמנה. מחקר חדש שפורסם בכתב העת גבולות בתזונה מציגה מערכת למידה עמוקה לניתוח התנהגות נשיכה בקרב ילדים, באמצעות סרטונים המתעדים ארוחות ילדים.

מָבוֹא

המיקרו-מבנה של הארוחה מתאר את ההתנהגויות השונות המתרחשות במהלך התקף אכילה: עקיצות, לעיסות, קצב נשיכה וגודל נשיכה. ניתוח המיקרו-מבנה של הארוחה עוזר לזהות דפוסי אכילה אינדיבידואליים והשונות שלהם על פני קשת של סוגי מזון ולחשוף את המנגנונים העומדים בבסיס הפרעות אכילה והשמנה.

ילדים המפתחים השמנת יתר נוטים יותר לנגוס ביסים גדולים יותר ולאכול מהר יותר, שניהם מגדילים את כמות המזון הנצרכת. ניתן להתאים התערבויות מונעות באמצעות מיקרו-מבנה של ארוחה שנצפה, מה שמספק אמצעי חדש לבלימת מגיפה זו.

תקן הזהב לניתוח נשיכה ומיקרו-מבנה הוא קידוד תצפית ידני, הכולל צפייה ידנית של הקלטות וידאו של התנהגויות אכילה של ילדים והערתן באמצעות חותמות זמן. על אף שהיא מאוד אמינה ומדויקת, שיטה זו היא עתירת עבודה ודורשת כמויות גדולות של זמן, בנוסף להיותה יקרה.

בהשוואה לקידוד ידני, מערכות אוטומטיות לזיהוי נשיכות יכולות להיות הרבה יותר יעילות וניתנות להרחבה. עם זאת, אלה משתמשים בעיקר בנתונים למבוגרים מחיישנים אקוסטיים ומדדי תאוצה, בהתבסס על מגבלות תנועה מוגדרות מראש. חיישנים כאלה עשויים לפרש לא נכון שתייה, או תנועות, למשל, כעקיצות.

שוב, שיטות שונות של אכילה (בכפות, מקלות אכילה או ביד) עלולות לגרום לבעיות בזיהוי על ידי הגברת הקושי של הפעולה. יתרה מכך, השונות הרחבה של המעשה עצמו מקשה על אוטומציה של זיהויו בהגדרות שונות.

זה הוביל לשימוש בפלטפורמות אוטומטיות לזיהוי עקיצות. פלטפורמות אלו עשויות להשתמש בקריטריונים מבוססי מיקום (מרחק פנים-יד, פתיחת פה) או בשיטות זרימה אופטיות כדי לעקוב אחר תנועות על פני מסגרות עוקבות. עם זאת, הם אינם יכולים להבחין באופן אמין בין התנהגות אכילה לבין תנועות אחרות הנפוצות במיוחד בילדים.

זה עורר עניין בשיטות למידה עמוקה באמצעות רשתות עצביות קונבולוציוניות (CNNs), שאומנו ונבדקו בעיקר בהקלטות וידאו מבוקרות היטב של אכילה, לרוב על ידי מבוגרים. בעולם האמיתי, סרטונים כאלה אינם נפוצים; הנורמה היא תאורה לקויה והבדלים בתנועות האכילה. טכנולוגיית למידה עמוקה יכולה לעזור להתגבר על קשיי פרשנות הנגרמים על ידי חפצים כאלה.

לגבי המחקר

ByteTrack היא מערכת למידה עמוקה המשתמשת בארוחות ילדים מוקלטות כדי למצוא את ספירת הנשיכות וקצב הנשיכות. הוא הוכשר על 242 סרטונים (1440 דקות) שתועדו מ-94 ילדים בגילאי 7-9, שכל אחד השלים ארבע ארוחות ארוחות בהפרש של שבוע. נעשה שימוש בתת-סט של 52 וידאו כדי להכשיר את רכיב זיהוי הפנים של המערכת. הסרטונים הוגדלו כדי להציג שינויים דמויי עולם אמיתי בתנאי ההקלטה.

לצורך הקלטת הווידאו, הילדים אכלו ארבע ארוחות בהפרש של שבוע, הכוללות את אותו האוכל אך בכמויות שונות. המערכת פועלת בשני שלבים. השלב הראשון משמש לזיהוי פנים, נעילה על פניו של ילד היעד תוך התעלמות מאנשים וחפצים אחרים.

לצורך כך נעשה שימוש בשתי מערכות, האחת מתמקדת בזיהוי פנים מהיר והשנייה בזיהוי במצבים מאתגרים כאשר הפנים חסומות בחלקן. השילוב נועד אפוא להשיג זיהוי פנים יעיל ומדויק.

השני משתמש בנתונים הנקיים האלה כדי להבחין בין פעילות נשיכה לבין תנועות אחרות. לצורך כך, שולבה רשת עצבית קונבולוציונית של EfficientNet (CNN) עם רשת חוזרת של זיכרון לטווח קצר (LSTM). הדגם מותאם לטשטוש, תאורה חלשה, שינוי בכיוון, סיבוב, רעידות מצלמה וידיים או כלים חוסמים את מראה הפה. התוצאות שהושגו במודל הושוו מול קידוד תצפית ידני.

ממצאי המחקר

בדיקת ByteTrack הראתה דיוק גבוה של זכירה ודיוק, בשיעור של יותר מ-98%. זה הראה שהטכנולוגיה איזנה בין מהירות ליכולת לסבול הופעות חזותיות משתנות הקשורות להתנהגות הנשיכה.

השלב השני הראה ביצועים מתונים בזיהוי נשיכה, והשיג בממוצע 79% דיוק, 68% היזכרות וציון F1 של ~71%. הייתה ספירת יתר של עקיצות, במיוחד במהלך החלק המוקדם של הארוחה. פגישות אכילה ארוכות יותר או החלק המאוחר יותר של הארוחה נטו להיות קשורים לאי-ספירת עקיצות.

הסיבות כוללות נשיכה מהירה והגברת זיהוי נשיכה באופן שקרי. מאוחר יותר, ילדים מתחילים לאבד עניין במזון, מה שעלול לייצר יותר תנועה, כולל כאלה שחוסמות את הפה, ומפחיתות את זיהוי העקיצות.

היה לו מקדם מתאם תוך-מחלקה (ICC) של 0.66 עם הקידוד בתקן הזהב, אם כי סרטונים שבהם הילד זז יותר מדי או שבהם ידיים או כלים חסמו את הפה היו פחות אמינים. למרות זאת, ByteTrack משקף מצבים אמיתיים בצורה מדויקת יותר, כאשר אנשים אחרים נוכחים בזמן שהילד אכל (בסביבות 80% מהארוחות המוקלטות כללו אנשים נוספים כדי לדמות סביבות ארוחה טבעיות).

זה פחות חודרני מחיישנים לבישים אחרים המורכבים על משקפי ראייה או שעוני נשיכה שיש להפעיל ולכבות, מה שעלול לשבש את הזרימה הטבעית של תהליך האכילה. למרות שיש להפעיל ולעצור את ByteTrack באופן ידני, הוא עדיין לא מותאם לזיהוי נשיכות בזמן אמת. ובכל זאת, הוא נשאר פחות פולשני וקרוב יותר לתצפיות נטורליסטיות מאשר מערכות לבישות.

מצלמות סמארטפונים יכולות לשמש להקלטה טבעית בעתיד, ובשילוב עם פלטפורמות כמו ByteTrack, בתנאי שניתן להבטיח פרטיות נתונים. הזמן והמאמץ שחוסכים יישומים טכנולוגיים כאלה הם עצומים, מה שמעיד על צורך עצום בפיתוחם. בנוסף, אלה מבטלים מקורות לטעויות אנוש כמו עייפות, חוסר ניסיון ופרשנות שגויה על ידי שימוש באותם קריטריונים כדי לפרש את כל הסרטונים. יש צורך בשיפור נוסף לפני שפלטפורמות כאלה יהיו זמינות לשימוש בזמן אמת.

מסקנות

מחקר פיילוט זה מדגים את היתכנותו של כלי אוטומטי שניתן להרחבה לזיהוי נשיכה בארוחות ילדים."

ByteTrack היא המערכת האוטומטית הראשונה שפותחה במיוחד לניתוח התנהגות אכילה של ילדים, והצלחתה המתונה מעודדת.

המגבלות של שיטה זו היו ברורות, ויש צורך לתכנן טכניקות חדשות יותר כדי להגביר את האמינות בנוכחות חסימות או עם תנועה גבוהה. נדרשת עבודה עתידית כדי להפוך את הפלטפורמה לחזקה יותר על פני אוכלוסיות שונות ותחת מצבי הקלטה שונים.

הורד את עותק ה-PDF שלך עכשיו!

דילוג לתוכן