דמיינו מודל של בינה מלאכותית (AI) שיכול לצפות ולהבין תמונות נעות בעדינות של מוח אנושי. כעת, מדענים ב-Scripps Research הפכו זאת למציאות על ידי יצירת MovieNet: AI חדשני שמעבד סרטונים בדומה לאופן שבו המוח שלנו מפרש סצנות מהחיים האמיתיים כשהן מתפתחות לאורך זמן.
מודל AI זה בהשראת המוח, מפורט במחקר שפורסם ב- הליכים של האקדמיה הלאומית למדעים ב-19 בנובמבר 2024, יכולים לתפוס סצנות מרגשות על ידי הדמיית האופן שבו נוירונים; או תאי מוח-; יוצרים תחושה של העולם בזמן אמת. בינה מלאכותית קונבנציונלית מצטיינת בזיהוי תמונות סטילס, אבל MovieNet מציגה שיטה למודלים של לימוד מכונה לזהות סצנות מורכבות ומשתנות – פריצת דרך שיכולה להפוך תחומים מאבחון רפואי לנהיגה אוטונומית, שבה הבחנה בשינויים עדינים לאורך זמן היא חיונית. MovieNet גם מדויק יותר ובר קיימא מבחינה סביבתית מבינה מלאכותית רגילה.
המוח לא רק רואה פריימים דוממים; זה יוצר נרטיב ויזואלי מתמשך. זיהוי תמונה סטטי עבר דרך ארוכה, אבל היכולת של המוח לעבד סצנות זורמות – כמו צפייה בסרט – דורשת צורה הרבה יותר מתוחכמת של זיהוי דפוסים. על ידי לימוד כיצד נוירונים לוכדים את הרצפים הללו, הצלחנו ליישם עקרונות דומים על AI."
הוליס קלינ, דוקטורט, סופר בכיר, מנהל מרכז דוריס למדעי המוח והפרופסור האן למדעי המוח במחקר Scripps
כדי ליצור את MovieNet, קלינ והסופר הראשון מסאקי הירמוטו, מדען צוות ב-Scripps Research, בדקו כיצד המוח מעבד סצינות בעולם האמיתי כרצפים קצרים, בדומה לקטעי סרטים. באופן ספציפי, החוקרים חקרו כיצד נוירוני ראשן הגיבו לגירויים חזותיים.
"לראשנים יש מערכת ראייה טובה מאוד, בנוסף אנחנו יודעים שהם יכולים לזהות ולהגיב לגירויים נעים ביעילות", מסביר הירמוטו.
הוא וקליין זיהו נוירונים המגיבים למאפיינים דמויי סרט – כמו שינויים בבהירות וסיבוב תמונה – ויכולים לזהות אובייקטים בזמן שהם נעים ומשתנים. ממוקמים באזור העיבוד החזותי של המוח המכונה טקטום האופטי, נוירונים אלה מרכיבים חלקים של תמונה נעה לרצף קוהרנטי.
חשבו על התהליך הזה כדומה לפאזל עדשים: כל חלק לבד אולי לא הגיוני, אבל יחד הם יוצרים תמונה שלמה בתנועה. נוירונים שונים מעבדים "חלקי פאזל" שונים של תמונה נעה מהחיים האמיתיים, שהמוח משלב לאחר מכן בסצנה רציפה.
החוקרים מצאו גם כי נוירוני הטקטום האופטי של הראשנים הבחינו בשינויים עדינים בגירויים חזותיים לאורך זמן, ולכדו מידע בקליפים דינמיים של בערך 100 עד 600 אלפיות השנייה ולא במסגרות דוממות. נוירונים אלו רגישים מאוד לדפוסים של אור וצל, ותגובתו של כל נוירון לחלק מסוים בשדה הראייה עוזרת לבנות מפה מפורטת של סצנה ליצירת "קטע סרט".
Cline והירמוטו אימנו את MovieNet לחקות את העיבוד דמוי המוח הזה ולקודד קטעי וידאו כסדרה של רמזים ויזואליים קטנים ומוכרים. זה איפשר למודל AI להבחין בהבדלים עדינים בין סצנות דינמיות.
כדי לבדוק את MovieNet, החוקרים הראו לו קטעי וידאו של ראשנים שוחים בתנאים שונים. לא רק ש- MovieNet השיגה דיוק של 82.3 אחוזים בהבחנה בין התנהגויות שחייה רגילות לעומת חריגות, אלא שהיא עלתה על היכולות של צופים אנושיים מאומנים בכ-18 אחוזים. הוא אפילו עלה על מודלים קיימים של AI כמו GoogLeNet-; שהשיג דיוק של 72 אחוז בלבד למרות משאבי ההדרכה והעיבוד הנרחבים שלו.
"זה המקום שבו ראינו פוטנציאל אמיתי", מציין קלינ.
הצוות קבע ש- MovieNet לא רק טוב יותר מדגמי בינה מלאכותית הנוכחית בהבנת סצנות משתנות, אלא שהיא השתמשה בפחות נתונים וזמן עיבוד. היכולת של MovieNet לפשט נתונים מבלי להקריב את הדיוק מבדילה אותו גם מה-AI הרגיל. על ידי פירוק מידע חזותי לרצפים חיוניים, MovieNet דוחסת נתונים ביעילות כמו קובץ דחוס ששומר על פרטים קריטיים.
מעבר לדיוק הגבוה שלו, MovieNet הוא מודל AI ידידותי לסביבה. עיבוד AI קונבנציונלי דורש אנרגיה עצומה, ומשאיר טביעת רגל סביבתית כבדה. דרישות הנתונים המופחתות של MovieNet מציעות אלטרנטיבה ירוקה יותר שחוסכת באנרגיה תוך ביצועים ברמה גבוהה.
"על ידי חיקוי המוח, הצלחנו להפוך את ה-AI שלנו להרבה פחות תובעני, ולסלול את הדרך למודלים שהם לא רק חזקים אלא ברי קיימא", אומר קלינ. "יעילות זו גם פותחת את הדלת להגדלת הבינה המלאכותית בתחומים שבהם השיטות הקונבנציונליות יקרות".
בנוסף, ל- MovieNet יש פוטנציאל לעצב מחדש את הרפואה. ככל שהטכנולוגיה מתקדמת, היא עשויה להפוך לכלי רב ערך לזיהוי שינויים עדינים במצבים מוקדמים, כגון זיהוי קצב לב לא סדיר או איתור סימנים ראשונים למחלות ניווניות עצביות כמו פרקינסון. לדוגמה, שינויים מוטוריים קטנים הקשורים לפרקינסון, שלעתים קרובות קשה להבחין בעיניים אנושיות, יכולים להיות מסומנים על ידי הבינה המלאכותית בשלב מוקדם, מה שמספק לרופאים זמן יקר להתערבות.
יתר על כן, היכולת של MovieNet לתפוס שינויים בדפוסי שחיית ראשנים כאשר ראשנים נחשפו לכימיקלים עשויה להוביל לטכניקות סקר תרופות מדויקות יותר, שכן מדענים יכלו לחקור תגובות סלולריות דינמיות במקום להסתמך על תמונות סטטיות.
"השיטות הנוכחיות מחמיצות שינויים קריטיים מכיוון שהן יכולות לנתח רק תמונות שצולמו במרווחים", מעיר Hiramoto. "התבוננות בתאים לאורך זמן פירושה ש- MovieNet יכולה לעקוב אחר השינויים העדינים ביותר במהלך בדיקות סמים."
במבט קדימה, Cline ו- Hiramoto מתכננים להמשיך לשכלל את יכולתה של MovieNet להסתגל לסביבות שונות, ולשפר את הרבגוניות והיישומים הפוטנציאליים שלה.
"לקחת השראה מהביולוגיה תמשיך להיות תחום פורה לקידום בינה מלאכותית", אומר קליין. "על ידי עיצוב מודלים שחושבים כמו אורגניזמים חיים, נוכל להגיע לרמות יעילות שפשוט אינן אפשריות בגישות קונבנציונליות."