גוגל משחררת דגם חדש של Gemini והוא עובר ישירות לראש טבלת ה-LLM

12:37
, 15 נובמבר 2024
, טכנולוגיה

גוגל מעדכנת כל הזמן את ג'מיני, ומשחררת גרסאות חדשות של משפחת דגמי הבינה המלאכותית שלה מדי כמה שבועות. הגרסה האחרונה היא כל כך טובה שהיא הלכה ישירות לראש טבלת ה-Imarena Chatbot Arena – והפילה את הגרסה האחרונה של GPT-4o של OpenAI.

ידועה בעבר כזירת LMSys, זוהי פלטפורמה המאפשרת למעבדות בינה מלאכותית להעמיד את הדגמים הטובים ביותר שלהן זו מול זו בעימות עיוור. המשתמשים מצביעים אך אינם יודעים איזה דגם הוא איזה עד לאחר שהצביעו.

לדגם החדש של Google DeepMind יש את השם הקליט Gemini-Exp-1114 והוא התאים לגרסה העדכנית ביותר של GPT-4o וחרג מהיכולות של מודל החשיבה המקדימה o1 מבית OpenAI.

5 הדגמים המובילים בזירה הם כולם גרסאות של דגמי OpenAI או גוגל. הדגם הראשון בטבלת המובילים שלא נוצר על ידי אף אחת מהחברות הללו הוא Grok 2 של xAI.

ההצלחה של הדגם החדש הזה מגיעה כשגוגל משחררת סוף סוף אפליקציית Gemini לאייפון, שניצחה את אפליקציית ChatGPT בהתמודדות שלנו עם 7 סיבובים של Gemini לעומת ChatGPT.

עד כמה הדגם החדש עובד?

חדשות מסיביות מ-Chatbot Arena🔥@GoogleDeepMind האחרון של Gemini (Exp 1114), שנבדק עם 6K+ הצבעות בקהילה בשבוע האחרון, מדורג כעת במקום הראשון הכולל עם זינוק מרשים של 40+ ציונים – תואם את 4o-האחרון ביותר ב-o1-preview ועולה! הוא גם טוען למקום הראשון ב-Vision… https://t.co/AgfOk9WHNZ pic.twitter.com/HPmcWE6zzI14 בנובמבר 2024

נראה שהדגם האחרון של Gemini מתפקד טוב במיוחד במשימות מתמטיקה וחזון, וזה הגיוני מכיוון שהם תחומים שבהם כל הדגמים של Gemini מצטיינים.

Gemini-Exp-1114 אינו זמין כעת באפליקציית Gemini או באתר. אתה יכול לגשת אליו רק על ידי הרשמה לחשבון Google AI Studio בחינם (הפלטפורמה המיועדת למפתחים שרוצים לנסות רעיונות חדשים).

אני גם לא בטוח אם זו גרסה של Gemini 1.5 או שזו תובנה מוקדמת לגבי Gemini 2, שצפויה בחודש הבא. אם זה האחרון, ייתכן שהשיפור לעומת הדור הקודם לא יהיה קיצוני כפי שכמה ציפו.

עם זאת, הוא מצליח בתחומים טכניים ויצירתיים על פי מדדים. זה יתחבר לרעיון שזה יהיה שימושי עבור חשיבה וניהול סוכנים. זה תחילה במתמטיקה, פתרון בעיות קשות, כתיבה יצירתית וחזון.

שלא כמו מדדים אחרים, ה-Chatbot Arena מבוסס על תפיסות אנושיות לגבי ביצועים ואיכות פלט, במקום בדיקות נוקשות מול נתונים.

בין אם זו רק גרסה חדשה של Gemini 1.5 Pro או תובנה מוקדמת לגבי היכולות של Gemini 2, זה הולך להיות כמה חודשים מעניינים בארץ AI.

idan

גוגל משחררת דגם חדש של Gemini והוא עובר ישירות לראש טבלת ה-LLM

עד כמה הדגם החדש עובד?

הירשם כדי לקבל את המדריך הטוב ביותר של טום ישירות לתיבת הדואר הנכנס שלך.