Search
(A) EEG paradigm. Participants viewed 50 images of indoor scenes and were asked to mentally plan possible exit paths through the scenes. On interspersed catch trials participants had to respond whether the exit path displayed on the screen corresponded to any of the exit paths from the previous trial. (B) EEG RDMs. We computed RDMs for each EEG time point (every 10 ms from − 200 to + 800 ms with respect to image onset). (C) DNN RDMs. We calculated RDMs from the activations extracted from the 4th block and output layer of a ResNet50 DNN trained on 2D, 3D, and semantic tasks. (D) NAM model and RDM5. (E) Variance partitioning. We calculated the unique EEG variance explained by each of the models, revealing different temporal activation patterns. Lines below the plots indicate significant times using t-test (FDR corrected p < 0.05). (F) Peak latencies of different models. Error bars indicate the 95% confidence interval. For significance testing, we applied bootstrapping followed by FDR correction. We found no significant differences between the correlation peak latency between 2D and 3D models or 3D and semantic models. However there were significant differences between 2D and semantic models, 2D and NAM models), 3D and NAM models, and semantic and NAM models).

הצצה לחשיבה ניווטית

במחקר שפורסם לאחרונה בכתב העת דוחות מדעיים, חוקרים חקרו את מפל העיבוד העצבי לתכנון נתיב הניווט של המוח האנושי. הם תיעדו תגובות אלקטרואנצפלוגרפיה (EEG) לתמונות של סביבות פנימיות מ-16 משתתפים אנושיים בריאים למחקר. הם עוד פיתחו רשת עצבית עמוקה (DNN), שאומנה באמצעות יותר מ-4.5 מיליון תמונות עם הערות מלאות, כדי לגשת לתכונות סצנה פנימית נמוכה, בינונית וגבוהה.

בשילוב עם מודל הניווט הניווט שתואר קודם לכן (NAM; Bonner and Epstein), ה-DNN הזה חושף שתהליכים עצביים אנושיים מתייחסים למשימות תמונה דו-ממדיות (2D) כתכונות חזותיות ברמה נמוכה, וכאלו של סמנטיות ותלת מימד (3D) ) משימות ברמה גבוהה וברמה בינונית בהתאמה. יש לציין כי המחקר הנוכחי חושף כי תרשים הזרימה של תכנון ניווט אנושי כולל חישוב ראשוני של 2D (משימות ברמה נמוכה), ואחריו עיבוד מקביל של משימות סמנטיות ברמה בינונית (3D) וברמה גבוהה. רק לאחר סיום השלבים ההיררכיים הללו, מופיעים ייצוגי הרשאה לניווט.

האתגרים הקוגניטיביים של הניווט

ניווט בסצנה כרוך בחילוץ מהיר של פיסות מידע חזותי רב-גוני וחישוב מידע זה לנתיבי ניווט. בעוד שהם מייצגים את אחד מהחישובים העצביים היומיומיים האנושיים הבסיסיים ביותר, המנגנונים שבאמצעותם המוח מאפיין נתונים חזותיים והסדר שבו מתרחש עיבוד הנתונים נותרו במחלוקת חריפה ולא מאומתים מדעית עד כה.

מחקר קודם זיהה שלושה סוגים עיקריים של מאפיינים חזותיים האופייניים לרוב הסצנות הניתנות לניווט – דו מימד (2D), תלת מימדי (3D) וסמנטית. מחקרים המתמקדים בחישוב עצבי הניבו שני ממצאים (מבלבלים) – 1. תפוקת ניווט מציגה אסוציאציות חזקות אפילו עם מאפיינים חזותיים ברמה נמוכה (2D), מה שמצביע על כך שמספר חישובי תגמול מוקדם יכולים להתרחש במקביל, ובכך להשפיע על תפיסת הסצנה; ו-2. ניווט, בעיקר דרך סצנות פנימיות מפותלות, מייצג הישג קוגניטיבי מורכב המשלב תכונות של רמות משימה שונות (2D, 3D, וסמנטית) עם משכי חישוב שונים.

"לדוגמה, ניווט מוצלח בסביבה המיידית מצריך התמקמות של מכשולים ומציאת דרך לעקוף אותם, מה שמצריך מידע על סצנה תלת מימדית. באופן דומה, סיווג סצנות סמנטי עשוי להועיל לתכנון המסלול, שכן ניווט במרתפים, מרפסות ומוסכים טיפוסיים דורש נהלים שונים."

מחקרים עדכניים על מתן אובייקטים מצביעים על כך שהאפשרויות הללו הן תוצר של ציפיות, מה שהופך אותן למשניות לתפיסה. יישוב קווי הראיות המנוגדים לכאורה הללו ידרוש הבנה מכניסטית של התהליכים החישוביים העומדים בבסיס הניווט וידע על הסדר שבו החישובים הללו מתבצעים במוח האנושי.

לגבי המחקר

במחקר הנוכחי, החוקרים משערים שהייצוג העצבי של תווי ניווט עוקב (פוגר מאחור) ייצוגים של תכונות חזותיות אחרות מסדר נמוך (2D, 3D וסמנטיות). כדי לאמת השערה זו, הם השתמשו בהקלטות אלקטרואנצפלוגרפיה (EEG) של משתתפים אנושיים בוגרים בריאים במקביל לרשתות עצביות עמוקות (DNNs), ניתוח דמיון ייצוגי (RSA) ומודל ניווט לניוט (NAM) כדי לחשוף את הסדר העצבי של הניווט עיבוד נתונים.

קבוצת המחקר כללה 16 מבוגרים בריאים (נקבה n=7) עם ראייה מתוקנת או תקינה. איסוף הנתונים כלל דמוגרפי, אנתרופומטרי ורפואה. גירויים חזותיים ששימשו במחקר כללו 50 תמונות צבעוניות של ספקטרום של סצנות פנימיות. תמונות אלה היו עקביות עם אלה ששימשו בונר ואפשטיין לצורך עקביות עם ה-NAM שתואר קודם לכן בשימוש כאן. התמונות הוצגו למשתתפים בנפרד למשך 200 אלפיות השנייה עם פער של 600-800 אלפיות השנייה בין הניסויים. למשתתפים ניתנו 1.3 שניות לבחור נתיב ניווט אופטימלי.

(א) פרדיגמת EEG. המשתתפים צפו ב-50 תמונות של סצנות פנימיות והתבקשו לתכנן מנטלית נתיבי יציאה אפשריים דרך הסצנות. בניסויי תפיסה משולבים המשתתפים היו צריכים להגיב אם נתיב היציאה המוצג על המסך תואם לאחד מנתיבי היציאה מהניסוי הקודם. (ב) EEG RDMs. חישבנו RDMs עבור כל נקודת זמן EEG (כל 10 אלפיות השנייה מ -200 עד + 800 אלפיות השנייה ביחס להופעת התמונה). (ג) DNN RDMs. חישבנו RDMs מההפעלות שחולצו מהבלוק הרביעי ושכבת הפלט של ResNet50 DNN שאומן במשימות דו-ממד, תלת-ממד ומשימות סמנטיות. (ד) דגם NAM ו-RDM5. (ה) מחיצות שונות. חישבנו את שונות ה-EEG הייחודית המוסברת על ידי כל אחד מהמודלים, וחשפנו דפוסי הפעלה זמניים שונים. קווים מתחת לחלקות מציינים זמנים משמעותיים באמצעות מבחן t (FDR מתוקן p <0.05). (ו) זמן השיא של שיא של דגמים שונים. פסי שגיאה מציינים את רווח הסמך של 95%. לצורך בדיקת מובהקות, הפעלנו אתחול האתחול ואחריו תיקון FDR. לא מצאנו הבדלים משמעותיים בין שיא השהיית המתאם בין מודלים דו-ממדיים ותלת-ממדיים או תלת-ממדיים וסמנטיים. עם זאת, היו הבדלים משמעותיים בין מודלים דו-ממדיים וסמנטיים, מודלים דו-ממדיים ו-NAM), מודלים תלת-ממדיים ו-NAM, ומודלים סמנטיים ו-NAM).

"הפרדיגמה נועדה להעסיק את המשתתפים בעיבוד מפורש של מחיר ניווט של כל תמונה. תוך כדי צפייה בגירויים, המשתתפים התבקשו לדמיין את כיווני שבילי הניווט ביחס לנקודת המבט של המשתתף, כלומר האם השבילים מובילים לשמאל, למרכז או לימין".

פעילות עצבית מתמשכת של המשתתפים תועדה באמצעות מערכת אלקטרודות סטנדרטית של Easycap 64 ערוצים למדידות EEG. נעשה שימוש במודל ה-NAM של בונר ואפשטיין ללא שינוי, ואחריו בנינג זוויתי ליצירת היסטוגרמת ניווט. זה, בתורו, שולבו עם נתונים התנהגותיים כדי להגיע למטריצת ניווט של מטריצת ייצוג ייצוג (RDM).

"ניתוח RSA עם הקלטות fMRI גילה ייצוגים של הנחה באזור העורף. אנו משתמשים באותו כימות של מתן עלות לניווט (באמצעות NAM RDM) כדי לחקור מתי, ולא היכן, מופיעים ייצוגי תקציב".

יותר מ-4.5 מיליון תמונות פנימיות עם הערות מלאות מ-Taskonomy Task Bank שימשו לאימון 18 מודלים של רשתות עצביות עמוקות (DNN). מתוך 18 המשימות המסווגות מראש הקיימות בתמונות, דגמי ה-DNN הגיעו לשלוש מחלקות שונות ברמות המורכבות החזותית שלהם, בקירוב למשימות דו-ממדיות (רמה נמוכה), תלת-ממדית (רמה בינונית) וסמנטיות (רמה גבוהה). לבסוף, נעשה שימוש בניתוח דמיון ייצוגי (RSA) כדי להשוות בין תגובות המשתתפים (EEG) ותפוקות DNN.

ממצאי מחקר ותוצאות

תוצאות מהמחקר הנוכחי מגלות שכאשר מוצגים בפני ספקטרום של נתונים ויזואליים במורכבות שונה, עוקבים אחר היררכיית עיבוד זמני. משימות דו-ממדיות ברמה נמוכה מעובדות לראשונה כבר ב-128.12 ± 3.56 שניות לאחר חשיפת גירוי. עיבוד נתונים סמנטיים ותלת-ממדיים מתרחשים אז כמעט במקביל ב-161.87 ± 10.45 ms ו-171.87 ± 30.79 ms, בהתאמה.

המשתתפים לקחו, בממוצע, 296.25 ± 37.05 אלפיות השנייה כדי להשלים את עיבוד הנתונים ולהגיע למסלול ניווט אופטימלי פוטנציאלי.

"ייצוג הניווט עלה מאוחר באופן משמעותי מאשר ייצוגים דו-ממדיים, תלת-ממדיים וסמנטיים. זה מצביע על פי סדר זמני שבני אדם ממנפים את התכונות הללו כדי לעבד תקציבי ניווט."

אמנם קיימת מגבלה אקולוגית מיידית של המחקר – התמונות ששימשו במחקר היו סטטיות, בעוד שבתרחישים שגרתיים, בני אדם צריכים לעדכן באופן דינמי את מסלולי הניווט שלהם בשל האופי הדינמי של עצמים בסביבתם – תוצאות אלו מספקות תובנות ראשוניות לגבי המנגנונים המאפשרים לנו לעבור בצורה חלקה דרך הנופים הפיזיים המורכבים שאנו פוגשים כל הזמן בחיי היום-יום שלנו.

דילוג לתוכן