Search
Google Gemini

Google Gemini 2 הגיע עכשיו להשקת דצמבר – הנה מה שאנחנו יודעים

גוגל צפויה להכריז על הדור הבא של משפחת דגמי ה-AI של Gemini בתחילת דצמבר, שנה לאחר שחשפה את Gemini 1. זה צפוי להיות שינוי משמעותי יותר מגרסאות Gemini 1.5 שיצאו במאי.

לפי The Verge, למרות היותו עליית מדרגה גדולה מ-Gemini 1, הדגם החדש לא ממש חזק כמו שגוגל אולי אהבה. זה יכול להיות בגלל ש-Gemini 1.5 היה טוב מהצפוי, או שיש סיכוי שאנחנו מגיעים לנקודת הרמה שבה תכונות מתחילות להיות חשובות יותר מהביצועים והיכולות הכוללות.

OpenAI התפצלה עם המודלים שלה, ויצרה משפחת o1 חדשה שטובה בהיגיון אבל לא טובה במשימות אחרות. ואז יש את דגמי GPT-4o (Omni), שהם מגוונים יותר. ייתכן שעם Gemini 2 גוגל תלך בדרך דומה.

למעבדות בינה מלאכותית יש הרגל לפרסם הודעות ענק לקראת עונת החגים, ואז לשבת עליהן עד השנה החדשה. סביר להניח שזה יהיה המקרה עם Gemini 2. אני חושד שגוגל תחשוף גרסאות חדשות של Ultra ו-Pro אבל שהם לא יגיעו לאפליקציית Gemini עד 2025.

למה אנחנו יכולים לצפות מג'מיני 2?

כל דור חדש של המודל מביא איתו יכולות חדשות, מערכי אימון חדשים ואולי אפילו דרכים חדשות להנחות על גרסאות קודמות. בהתבסס על חוקי קנה המידה של AI, שאומרים שחישוב + נתונים + זמן = מודלים טובים יותר, כל דור חדש צריך לקבל יותר אינטליגנציה, להיות מסוגל יותר ובעל הנמקה טובה יותר.

לדוגמה, אתה יכול להגיד לג'מיני להזמין את הטיסה שלך לפריז עם פרמטרים מסוימים וזה ייעלם ויעשה את זה בשבילך ופשוט ישלח לך את הכרטיסים.

לא ברור מה יהיו התכונות החדשות עם Gemini 2. כאשר Gemini 1 יצא לאור, ראינו יכולות מולטי-מודאליות, כולל היכולת להבין תמונות או וידאו. סביר להניח שגוגל תרחיב על כך וייתכן שתכלול נתונים מרחביים, ותעניק לה ידע על העולם ועל הפיזיקה של העולם האמיתי. ראינו רמזים לכך עם Project Atlas (Gemini Live + Lens).

אני חושב שסביר יותר שנראה שיפורים רחבים מבחינת הנמקה ומהימנות. ייתכן שנראה גם כמה מיכולות ה"חשיבה" הללו נפתחות בדגם הרחב יותר. השינוי הגדול ביותר צפוי להגיע בדמות סוכנים.

אלו יכולות של המודל המאפשרות לו לבצע משימות בעצמו מבלי להסתמך על קלט אנושי מעבר להנחיה הראשונית. לדוגמה, אתה יכול להגיד לג'מיני להזמין את הטיסה שלך לפריז עם פרמטרים מסוימים וזה ייעלם ויעשה את זה בשבילך ופשוט ישלח לך את הכרטיסים.

סוכני כוח ידרשו מהמודל לחשוב על בעיה לפני נקיטת פעולה, בדומה ל-o1 של OpenAI. אז כנראה שזו תהיה עוד יכולת. זה מאפשר תגובות מפורטות יותר, כמו גם דיוק משופר. אני גם חושד שגוגל תשפר את החיפוש ואת הגישה לנתונים חיים מכיוון שהיא נתונה לתחרות גוברת מצד OpenAI.

דילוג לתוכן