Search
Study: Predicting multiple taste sensations with amultiobjective machine learning method. Image Credit: TarikVision/Shutterstock.com

מנבא טעם מבוסס למידת מכונה פותח לזיהוי מר, מתוק ואומאמי מתחושות טעם אחרות

במחקר שפורסם לאחרונה ב npj מדע המזוןחוקרים פיתחו את VirtuousMultiTaste, כלי למידת מכונה להבחין בין טעמים מתוקים, אומאמיים ומרירים על בסיס המבנים המולקולריים של התרכובת והמאפיינים הפיזיקליים הכימיים הבסיסיים.

מחקר: חיזוי תחושות טעם מרובות עם שיטת למידת מכונה רב-אובייקטיבית. קרדיט תמונה: TarikVision/Shutterstock.com

רקע כללי

טעם וריח הם חיוניים לתפיסה הכימו-חושית של מזון, המשפיעים על בחירת הארוחה וצריכתו. תפיסת הטעם משתמשת בחמש תחושות בסיסיות כדי לשלוט בצריכת חומרים מזינים ולמנוע חומרים רעילים: מתוק, מר, אומאמי, מלוח וחמוץ. הבנת התכונות הפיזיוכימיות של רכיבי מזון היא קריטית בהשפעה על הטעם והצריכה.

ההתקדמות באלגוריתמים מבוססי למידת מכונה סיווג את הטעמים של תרכובות כימיות; עם זאת, עדיין יש פוטנציאל לשיפור בבניית מודלים רב-מעמדיים שיכולים לצפות את הספקטרום השלם של טעמים בסיסיים, המגביל את מדע המזון והטכנולוגיה.

לגבי המחקר

במחקר הנוכחי, החוקרים השתמשו בגישות למידת מכונה ובגישות אופטימיזציה היוריסטית כדי לצפות חוויות טעם שונות בכימיקלים.

מערך הנתונים של המחקר כלל אוסף של תרכובות זמינות לציבור עם טעמים מאומתים המקובצים לתשע קבוצות טעם. במסד הנתונים הראשון היו 5,290 כימיקלים לטעמים מתוקים ומרירים ו-2,549 לאומאמי. מערך הנתונים הסופי כלל 4,717 כימיקלים, עם בחירה אקראית שנבחרה לאימון. החוקרים דגמו יתר על המידה את מחלקת Umami עם 133 דגימות תוך שימוש בשיטת Adaptive Boosting (AdaBoost) כשלב נוסף בעיבוד מקדים.

החוקרים השתמשו ב-Pensional Component Analysis (PCA) כדי להעריך מאפיינים מולקולריים, וזיהו 1,306 שהיו שונים באופן משמעותי להפחתת הממדיות. האוטוקורלציה של מבנה טופולוגי (ATS) הייתה מחלקת המתארים הנפוצה ביותר מבין 15 התכונות שנבחרו.

החוקרים השתמשו בהפחתת ממדי אנסמבל באמצעות אלגוריתמי אופטימיזציה מבוססי פארטו כדי לשפר את דיוק הניבוי, להקטין את התכונות שנבחרו ולפשט את הסיווג. יעדי האופטימיזציה כללו דיוק (ACC), הקטנת מספר תכונות נבחרות 1, ציון F1 10, דיוק (PRC), ציון F2 1, ריקול (REC), השטח מתחת לעקומת המאפיין ההפעלה של המקלט (AUC), מרחק מנהטן 1 ו מזעור עצים 1 (מספר SV).

חוקרים השתמשו במסווגים אקראיים של יערות (RF) שהעלו על מכונות תמיכה וקטוריות (SVM) על פני יעדים שונים. הם השוו בין 20 דגמי RF שונים ובחרו את הטוב ביותר בהתבסס על הביצועים שלו ומספר מינימלי של תכונות. הם השתמשו באימות צולב פי 10 (CV) על מערך ההדרכה. אוטוקורלציה של מבנה טופולוגי (ATS) הייתה מחלקת המתארים הנפוצה ביותר מבין 15 המאפיינים שצוינו. החוקרים חישבו מתארי קורלציה אוטומטיים תוך שימוש בקורלציות אוטומטיות של Moreau-Broto המשוקללות לפי האלקטרושליליות של Allred-Rocow, Pauling וסנדרסון, מסה, מטען גאסטיגר, מספר אטומי, פוטנציאל יינון, קיטוב ומצב פנימי.

החוקרים העריכו את ביצועי המודל מול מאגרי מידע חיצוניים של מזון ומוצרים טבעיים כגון FooDB, FlavorDB, PhenolExplorer, Natural Product Atlas ו- PhytoHub. הם השוו קפה ושוקולד על סמך התוכן היחסי שלהם ב-FoodDB. הם גם העריכו את המודל מול אלגוריתמים וצינורות של למידת מכונה בשימוש תכוף.

החוקרים העריכו את ישימות המודל על ידי השוואת הדמיון בין חומרים שנבדקו לבין כימיקלים המשמשים במהלך האימון. הם השתמשו בטביעות אצבעות של Morgan ו-Tanimoto Similarity Index כדי להשיג ציוני דמיון ממוצעים בין תרכובות בדיקה ואימון והשוו את VirtuousMultiTaste למנבאי טעם VirtuousBitterSweet ו- VirtuousUmami שפותחו בעבר.

תוצאות

באימות צולב, מודל ה-RF הנבחר קיבל ציון של ערך AUC של 0.92, 77% דיוק ו-77% ריקול. מערך הבדיקות הראה AUC של 0.87, עם דיוק של 79% ו-72% היזכרות. לטעם האומאמי היו ערכי ה-AUC הגבוהים ביותר (0.98), ואחריו הטעם המר (0.92) וקבוצת הטעם ה'אחר' (0.86). מודל VirtuousMultiTaste פעל מעט טוב יותר בניבוי טעם מר, עם דיוק, דיוק, זכירה וערכי F1 ו-F2 של כ-83%. לקפה היה פרופיל טעם מר בעיקר, עם 130 כימיקלים מרירים צפויים, ואילו לשוקולד היו 96 תרכובות מרירות, 33 תרכובות מתוקות, ארבע תרכובות אומאמי ו-13 תרכובות טעם אחרות.

VirtuousMultiTaste גבר על מסווגים אחרים על מדדי ביצועים. ל-VirtuousMultiTaste ול- VirtuousUmami היו דירוגים דומים של דיוק ודירוג AUC, אך ערכי דיוק, זכירה, F1 ו-F2 נמוכים במקצת. שתי השיטות השיגו דיוק של למעלה מ-99% בהערכות תוך שימוש בכימיקלים שאינם אומאמיים מלבד אלו המשמשים באימון. VirtuousMultiTaste עשויה לצפות תרכובות אומאמי ולא פפטידים, מה שמאפשר מחקר כימי רחב יותר. ביצועי המודל נשארו עקביים לאורך רבעוני הדמיון, והראו ישימות נרחבת.

בהתבסס על ממצאי המחקר, כלי לימוד המכונה VirtuousMultiTaste יכול לנתח במהירות מאגרי מידע כימיים עבור תרכובות מועמדות עם איכויות טעם צפויות. הוא הוכיח יכולת מצוינת לצפות תחושות טעם רבות במקביל, מה שמצביע על אפשרות להשתלב בתפיסה רב-חושית. הכלי מנבא ארבעה טעמים ומאפשר ניתוח של כימיקלים שונים וידע על תהליכים כימיים-פיזיקליים המשפיעים על תפיסת הטעם הכוללת.

עם זאת, קשה להבין באופן אינטואיטיבי את המאפיינים הכימיים והפיזיקליים של הטעימות בהתבסס על 15 מאפיינים ראשוניים. מחקר עתידי צריך להתמקד במתארים פשוטים או ליצור גישות מסוימות להתאמה בין מתארים מולקולריים למאפיינים מבניים או לקבוצות פונקציונליות.

דילוג לתוכן