מיקרוסופט פרסמה את הגרסה האחרונה של דגם השפה הקטנה שלה Phi-3.5. הגרסה החדשה הזו היא שדרוג גדול מהדור הקודם, ומנצחת דגמים קטנים יותר של שחקנים מובילים כמו גוגל, OpenAI, Mistral ומטה במספר מדדים חשובים.
Phi-3.5 מגיע בגרסאות של 3.8 מיליארד, 4.15 מיליארד ו-41.9 מיליארד פרמטרים. שלושתם זמינים להורדה בחינם וניתן להפעיל אותם באמצעות כלי מקומי כמו Ollama.
הוא עשה ביצועים טובים במיוחד בהיגיון, רק זכה להביס על ידי GPT-4o-mini מתוך הדגמים הקטנים המובילים. היא גם הצליחה היטב במדדים מתמטיים, ועברה באופן משמעותי את לאמה ותאומים.
מודלים של שפות קטנות כמו Phi-3.5 מדגימים שיפורי יעילות ב-AI ומוסיפים אמון למטרה של מנכ"ל OpenAI, סם אלטמן, ליצור אינטליגנציה זולה מכדי למדוד.
מה חדש ב-Phi-3.5
🔥 דגמי Phi-3.5 חדשים נמצאים כעת ב- Open LLM Leaderboard!• Phi-3.5-MoE-instruct מוביל את כל דגמי מיקרוסופט עם ציון ממוצע של 35.1, במקום הראשון בקטגוריית 3B ומקום 10 מבין כל דגמי הצ'אט• Phi-3.5-mini -instruct קלע 27.4 נקודות, ולקח את המקום השלישי בקטגוריית 3B… pic.twitter.com/yNcOR2bcxX22 באוגוסט 2024
Phi-3.5 מגיע בגרסת מודל vision שיכולה להבין תמונות ולא רק טקסט, כמו גם תערובת של מודלים מומחים לפיצול משימות למידה על פני רשתות משנה שונות לעיבוד יעיל יותר.
התערובת של דגמי מומחים מנצחת את Gemini Flash 1.5, שהוא הדגם המשמש בגרסה החינמית של ה-Chatbot של Gemini במספר מדדים ויש לו חלון הקשר גדול של 128k. אמנם זה קטן משמעותית מג'מיני עצמו, אבל זה שווה ל-ChatGPT ולקלוד.
היתרון העיקרי של דגם קטן מאוד כמו זה שהתקנתי הוא שניתן לצרף אותו לאפליקציה או אפילו להתקין אותו במכשיר האינטרנט של הדברים כמו פעמון דלת חכם. זה יאפשר זיהוי פנים מבלי לשלוח נתונים לענן.
הירשם כדי לקבל את המדריך הטוב ביותר של טום ישירות לתיבת הדואר הנכנס שלך.
קבל גישה מיידית לחדשות מרעננות, לביקורות החמות ביותר, למבצעים מעולים וטיפים מועילים.
הדגם הקטן ביותר הוכשר על 3.4 טריליון אסימונים של נתונים באמצעות 512 Nvidia H100 GPUs במשך 10 ימים. התערובת של מודלים מומחים כללה 16 מודלים של פרמטרים 3.8b, השתמשו ב-4.9 טריליון אסימונים ולקח 23 ימים להתאמן.
עד כמה Phi-3.5 עובד בפועל?
התקנתי והרצתי את גרסת ה-Phi-3.5 הקטנה יותר של 3.8 מיליארד פרמטרים על המחשב הנייד שלי ומצאתי אותה פחות מרשימה ממה שהמדדים מציעים. למרות שהוא היה מפורט בתגובותיו, לעתים קרובות הניסוח הותיר הרבה לרצוי, והוא נאבק בכמה מבחנים פשוטים.
שאלתי את זה קלאסי: "כתוב סיפור קצר בן משפט אחד שבו האות הראשונה של מילה זהה לאות האחרונה של המילה הקודמת." גם לאחר הבירור, זה נכשל באופן מרהיב.
לא ניסיתי את התערובת הגדולה יותר של דגמי מומחים. עם זאת, נאמר לי כי אם לשפוט לפי המדדים, זה פותר חלק מהבעיות עם הגרסה של הדגם שניסיתי. המדדים מצביעים על התפוקה שלו תהיה באיכות דומה ל-GPT-4o-mini של OpenAI, הגרסה שמגיעה עם הגרסה החינמית של ChatGPT.
תחום אחד שנראה כי הוא מתעלה על GPT-4o-mini על פני אחרים הוא בתחומי STEM ומדעי החברה. הארכיטקטורה שלו מאפשרת לו לשמור על יעילות תוך ניהול משימות AI מורכבות בשפות שונות.