Search
Google Gemini

גוגל משחררת דגם חדש של Gemini והוא עובר ישירות לראש טבלת ה-LLM

גוגל מעדכנת כל הזמן את ג'מיני, ומשחררת גרסאות חדשות של משפחת דגמי הבינה המלאכותית שלה מדי כמה שבועות. הגרסה האחרונה היא כל כך טובה שהיא הלכה ישירות לראש טבלת ה-Imarena Chatbot Arena – והפילה את הגרסה האחרונה של GPT-4o של OpenAI.

ידועה בעבר כזירת LMSys, זוהי פלטפורמה המאפשרת למעבדות בינה מלאכותית להעמיד את הדגמים הטובים ביותר שלהן זו מול זו בעימות עיוור. המשתמשים מצביעים אך אינם יודעים איזה דגם הוא איזה עד לאחר שהצביעו.

לדגם החדש של Google DeepMind יש את השם הקליט Gemini-Exp-1114 והוא התאים לגרסה העדכנית ביותר של GPT-4o וחרג מהיכולות של מודל החשיבה המקדימה o1 מבית OpenAI.

5 הדגמים המובילים בזירה הם כולם גרסאות של דגמי OpenAI או גוגל. הדגם הראשון בטבלת המובילים שלא נוצר על ידי אף אחת מהחברות הללו הוא Grok 2 של xAI.

ההצלחה של הדגם החדש הזה מגיעה כשגוגל משחררת סוף סוף אפליקציית Gemini לאייפון, שניצחה את אפליקציית ChatGPT בהתמודדות שלנו עם 7 סיבובים של Gemini לעומת ChatGPT.

עד כמה הדגם החדש עובד?

נראה שהדגם האחרון של Gemini מתפקד טוב במיוחד במשימות מתמטיקה וחזון, וזה הגיוני מכיוון שהם תחומים שבהם כל הדגמים של Gemini מצטיינים.

Gemini-Exp-1114 אינו זמין כעת באפליקציית Gemini או באתר. אתה יכול לגשת אליו רק על ידי הרשמה לחשבון Google AI Studio בחינם (הפלטפורמה המיועדת למפתחים שרוצים לנסות רעיונות חדשים).

אני גם לא בטוח אם זו גרסה של Gemini 1.5 או שזו תובנה מוקדמת לגבי Gemini 2, שצפויה בחודש הבא. אם זה האחרון, ייתכן שהשיפור לעומת הדור הקודם לא יהיה קיצוני כפי שכמה ציפו.

עם זאת, הוא מצליח בתחומים טכניים ויצירתיים על פי מדדים. זה יתחבר לרעיון שזה יהיה שימושי עבור חשיבה וניהול סוכנים. זה תחילה במתמטיקה, פתרון בעיות קשות, כתיבה יצירתית וחזון.

שלא כמו מדדים אחרים, ה-Chatbot Arena מבוסס על תפיסות אנושיות לגבי ביצועים ואיכות פלט, במקום בדיקות נוקשות מול נתונים.

בין אם זו רק גרסה חדשה של Gemini 1.5 Pro או תובנה מוקדמת לגבי היכולות של Gemini 2, זה הולך להיות כמה חודשים מעניינים בארץ AI.

דילוג לתוכן