Search
The Microsoft logo on a sign at the company

מיקרוסופט חושפת את Phi-3.5 – דגם הבינה המלאכותית הקטן החדש הזה עולה על ביצועיו של Gemini ו-GPT-4o

מיקרוסופט פרסמה את הגרסה האחרונה של דגם השפה הקטנה שלה Phi-3.5. הגרסה החדשה הזו היא שדרוג גדול מהדור הקודם, ומנצחת דגמים קטנים יותר של שחקנים מובילים כמו גוגל, OpenAI, Mistral ומטה במספר מדדים חשובים.

Phi-3.5 מגיע בגרסאות של 3.8 מיליארד, 4.15 מיליארד ו-41.9 מיליארד פרמטרים. שלושתם זמינים להורדה בחינם וניתן להפעיל אותם באמצעות כלי מקומי כמו Ollama.

הוא עשה ביצועים טובים במיוחד בהיגיון, רק זכה להביס על ידי GPT-4o-mini מתוך הדגמים הקטנים המובילים. היא גם הצליחה היטב במדדים מתמטיים, ועברה באופן משמעותי את לאמה ותאומים.

מודלים של שפות קטנות כמו Phi-3.5 מדגימים שיפורי יעילות ב-AI ומוסיפים אמון למטרה של מנכ"ל OpenAI, סם אלטמן, ליצור אינטליגנציה זולה מכדי למדוד.

מה חדש ב-Phi-3.5

Phi-3.5 מגיע בגרסת מודל vision שיכולה להבין תמונות ולא רק טקסט, כמו גם תערובת של מודלים מומחים לפיצול משימות למידה על פני רשתות משנה שונות לעיבוד יעיל יותר.

התערובת של דגמי מומחים מנצחת את Gemini Flash 1.5, שהוא הדגם המשמש בגרסה החינמית של ה-Chatbot של Gemini במספר מדדים ויש לו חלון הקשר גדול של 128k. אמנם זה קטן משמעותית מג'מיני עצמו, אבל זה שווה ל-ChatGPT ולקלוד.

היתרון העיקרי של דגם קטן מאוד כמו זה שהתקנתי הוא שניתן לצרף אותו לאפליקציה או אפילו להתקין אותו במכשיר האינטרנט של הדברים כמו פעמון דלת חכם. זה יאפשר זיהוי פנים מבלי לשלוח נתונים לענן.

הדגם הקטן ביותר הוכשר על 3.4 טריליון אסימונים של נתונים באמצעות 512 Nvidia H100 GPUs במשך 10 ימים. התערובת של מודלים מומחים כללה 16 מודלים של פרמטרים 3.8b, השתמשו ב-4.9 טריליון אסימונים ולקח 23 ימים להתאמן.

עד כמה Phi-3.5 עובד בפועל?

התקנתי והרצתי את גרסת ה-Phi-3.5 הקטנה יותר של 3.8 מיליארד פרמטרים על המחשב הנייד שלי ומצאתי אותה פחות מרשימה ממה שהמדדים מציעים. למרות שהוא היה מפורט בתגובותיו, לעתים קרובות הניסוח הותיר הרבה לרצוי, והוא נאבק בכמה מבחנים פשוטים.

שאלתי את זה קלאסי: "כתוב סיפור קצר בן משפט אחד שבו האות הראשונה של מילה זהה לאות האחרונה של המילה הקודמת." גם לאחר הבירור, זה נכשל באופן מרהיב.

לא ניסיתי את התערובת הגדולה יותר של דגמי מומחים. עם זאת, נאמר לי כי אם לשפוט לפי המדדים, זה פותר חלק מהבעיות עם הגרסה של הדגם שניסיתי. המדדים מצביעים על התפוקה שלו תהיה באיכות דומה ל-GPT-4o-mini של OpenAI, הגרסה שמגיעה עם הגרסה החינמית של ChatGPT.

תחום אחד שנראה כי הוא מתעלה על GPT-4o-mini על פני אחרים הוא בתחומי STEM ומדעי החברה. הארכיטקטורה שלו מאפשרת לו לשמור על יעילות תוך ניהול משימות AI מורכבות בשפות שונות.

דילוג לתוכן