Search
Gemini screenshot image

גוגל חושפת את Gemini 2.5 – טוענת פריצת דרך AI עם נימוק משופר וכוח רב -מודאלי

גוגל חשפה את Gemini 2.5, מודל ה- AI המתקדם ביותר של ענקית הטכנולוגיה עד כה. המסוגל להניבה משופרת, מיומנות קידוד ופונקציונליות רב -מודאלית, אומרים כי המודל האחרון מסוגל לנתח מידע מורכב, לשלב ניואנסים קונטקסטואליים ולהסיק מסקנות לוגיות עם דיוק חסר תקדים.

על פי הבלוג הרשמי של גוגל, השיפורים האחרונים של הדגם מושגים על ידי שילוב של מודל בסיס משופר משמעותית עם שיפור טכניקות לאחר האימון.

על פי הדיווחים, Gemini 2.5 מוביל במדדי מתמטיקה ומדע, ורשם 18.8% בבחינה האחרונה של האנושות, מערך נתונים שנועד להעריך את יכולתו של AI להתמודד עם שאלות מורכבות מבוססות ידע. לשם השוואה, מודל המחקר העמוק של Openai יכול להשלים 26% מהבחינה האחרונה של האנושות.

אולי תאהב

  • Google Gemini 2.0 כעת בחינם למשתמשים – הנה כיצד לגשת אליו עכשיו

  • גוגל משיקה את 'מצב AI' לחיפוש – הנה כיצד לנסות את זה עכשיו

ביצועי קידוד מעולים

קוד תאומים מסייע ל- GIF

בתחום הקידוד, אומרים כי Gemini 2.5 מפגין מיומנות מדהימה, שיכולים להיות חדשות טובות עבור המשתמש הממוצע או הלא-מפתחים. מכיוון שהמודל מצטיין ביצירת יישומי אינטרנט משכנעים ויזואלית ויישומי קוד סוכן, כמו גם טרנספורמציה ועריכה של קוד, המשתמשים אינם זקוקים לכישורים מתקדמים בעצמם.

לדוגמה, ב- SWE-Bench מאומת, תת-קבוצה מאושרת אנושית של ספסל SWE המעריכה באופן אמין יותר את יכולתם של מודלים של AI לפתור בעיות תוכנה בעולם האמיתי. תקן התעשייה להערכות קוד סוכן, Gemini 2.5 Pro מציג 63.8% עם הגדרת סוכן מותאם אישית.

החל מינואר 2025, אף דגם טרם חצה את השלמת 50% על סוודר SWE, אם כי סונטה המעודכנת של קלוד 3.5 עומדת על 49%.

הבנת הקשר רב -מודליות ומורחבות

כותרת תאומים עם תכונות

Gemini 2.5 נועד להבין כמויות אדירות של נתונים ולטפל בבעיות מורכבות על פני מקורות מידע שונים, כולל מאגרי טקסט, שמע, תמונות, וידאו ואפילו קוד.

הדגם כולל מולטימודליות מקורית ותומך בחלון הקשר של עד מיליון אסימונים, כאשר גוגל מתכננת להרחיב זאת לשני מיליון אסימונים בעתיד הקרוב, אם כי לא נחשף ציר זמן מדויק.

אסימונים וחלונות הקשר

אסימונים וחלונות הקשר הם שני מושגים חיוניים להבנה כשמדובר כיצד AI מעבד ומייצר שפה.

אז מה זה אסימון? אסימון הוא יחידת הנתונים הקטנה ביותר שמודל AI מעבד. תלוי בעיצוב הדגם, אסימון יכול לייצג משהו פשוט כמו מילה אינדיבידואלית או תו יחיד. זה יכול להיות גם פחם של מילה או סימני פיסוק.

לדוגמה, המשפט "החתול קפץ מעל הגדר ונעלם במהירות." מיוסה ל 12 אסימונים. פירוט זה מאפשר ל- AI לנתח ולייצר טקסט ביעילות.

השלכות של חלון הקשר של 2 מיליון אסימון

חלון הקשר מתייחס לכמות המידע שמודל AI יכול לעבד בפעם אחת. אתה יכול לחשוב על זה כזיכרון לטווח הקצר של הדגם, ומקיף את רצף האסימונים שה- AI שוקל בעת יצירת תגובה. גודל חלון ההקשר קובע כמה מידע קודם המודל יכול להשתמש כדי לייצר תפוקות קוהרנטיות ורלוונטיות הקשר. ​

לדוגמה, בעזרת המשפט הקודם: "החתול קפץ מעל הגדר ונעלם במהירות." אם למודל AI יש חלון הקשר מוגבל ל -5 אסימונים, הוא יעבד רק את החלק האחרון של הקלט.

לכן, אם היית שואל את "מי התלהב מעל הגדר ונעלם במהירות?" המודל עשוי לא לזהות נכון את "החתול" כנושא מכיוון שהוא חסר גישה לחלק הראשוני של המשפט.

אם גוגל מגדילה את חלון ההקשר של תאומים 2.5 עד 2 מיליון אסימונים, היא מאפשרת למודל לשקול ולשמור על כמות עצומה של מידע בעת יצירת תגובות.

בעיקרו של דבר, ככל שחלון ההקשר גדול יותר, כך היכולת של המודל גדול יותר לעבד הנחיות נרחבות, וכתוצאה מכך תפוקות עקביות יותר, רלוונטיות ושימושיות יותר. ​

לשם השוואה, ספירת המילים המשולבת של הטרילוגיה של "שר הטבעות" היא בסביבות 500,000 מילים. המשמעות היא שאתה יכול לספק את כל הטרילוגיה – כהקשר ל- Gemini 2.5 Pro וזה יהיה רק ​​מיליון אסימונים בלבד.

זמינות ותפיסה עתידית

המודל הניסיוני של Gemini 2.5 Pro נגיש כעת בסטודיו של Google AI ובתוך אפליקציית Gemini עבור מנויים מתקדמים של Gemini. שחרורו של Gemini 2.5 Pro Experimental מעניק למנויים לשלם 20 דולר לחודש שימוש רחב יותר עם מגבלות קצב גבוהות יותר ליישומים בקנה מידה ייצור.

דילוג לתוכן