Search
WWDC 2024

אפל מכריזה על פרטים על דגמי ה-AI החדשים שלה – זהו מחליף משחק עבור התעשייה

בטח ראיתם כותרות שמזכירות את Apple Intelligence לאחר אירוע ה-WWDC השנתי של אפל למפתחים, אבל ממה בעצם מורכבת Apple Intelligence?

Apple Intelligence היא "מערכת הבינה האישית" החדשה (עד עכשיו כולנו קראנו לזה בינה מלאכותית) שמציבה דגמים מחוללים רבי עוצמה בלב מכשירי אפל שלכם. גרסת בטא אמורה להיות זמינה בסתיו הקרוב.

בפוסט בבלוג, אפל אמרה ש-Apple Intelligence עשויה מדגמים יצירתיים שונים המותאמים למשימות היומיומיות של המשתמש.

בין אם זה כתיבה או שיפור טקסט, תעדוף התראות או יצירת תמונות עבור השיחות שלך עם חברים אפל תחיל את המודל המיוחד ביותר לכל מה שאתה רוצה להשיג.

המערכת כוללת מודל במכשיר עם כ-3 מיליארד פרמטרים ומודל שפה מבוסס שרת גדול יותר עבור משימות מורכבות יותר.

איך Apple Intelligence עובד

גרפיקה של Apple Intelligence

בטח, מודל שפה גדול (LLM) מאסיבי באייפון שלך יהיה שימושי, אבל גבולות הטכנולוגיה הנוכחית שלנו פירושם שהסוללה והאחסון שלך יתרוקנו מהר יחסית, ומכאן הצורך בדגם שני יותר רזה.

לדוגמה, למודל במכשיר יש גודל אוצר מילים של 49,000 בניגוד לגודל של 100,000 אוצר מילים של מודל השרת – זה דומה בגודלו לאוצר המילים של ChatGPT.

סמנכ"ל הנדסת חוויית מערכות חכמה של אפל, סבסטיאן מרינאו-מס, אמר שהם דחפו את הגבולות של מה שניתן להפעיל באופן מקומי עם הדגמים במכשיר.

המטרה הייתה להבטיח שהוא "חזק מספיק לחוויה שרצינו, ועם זאת קטן מספיק כדי לרוץ במכשיר". זה כלל יצירת מודל גדול ואז כוונון עדין שלו שוב ושוב כדי להתאמן למשימות נישה.

לאחר מכן הם פיתחו טכניקה חדשה בשם מתאמים שיושבים על גבי מודל הבסיס המשותף, ומאפשרים לו להתמחות תוך כדי המשימה.

בנוסף למודל השפה יש להם מודל דיפוזיה כדי לספק יצירת תמונה עבור ה-Genmojis ויצירת תמונה.

איך Apple Intelligence משווה

אפל השוותה את הדגמים הגנרטיביים שלה לאחרים בשוק והיא אמרה שהיא התמקדה בהערכה אנושית ולא בבדיקות מכונות, מכיוון שהיא חושבת שזה יתאם טוב יותר לחוויית המשתמש בפועל.

במבחן על יכולות כלליות, שבדק דברים כמו סיעור מוחות, חשיבה מתמטית ומענה על שאלות פתוחות, המודל של אפל במכשיר התפקד טוב יותר מהדגם הפתוח הקל משקל Microsoft Phi-3-mini זכה ב-43% מהבדיקות בהשוואה ל-Phi-3 -מיני של 32.4%.

עם זאת, GPT-4-Turbo התעלה על הדגם מבוסס השרת של אפל זכה ב-41.7% מהבדיקות בהשוואה ל-28.5% של אפל. שני הדגמים האחרונים היו קשורים ב-29.8% מהמקרים.

מבחינת בטיחות, שני הדגמים של אפל עלו על מתחרותיה במהלך בדיקות על תוכן מזיק, נושאים רגישים ועובדות. לדוגמה, לדגם שפועל על שרתי אפל היה שיעור הפרות של 6.6% לעומת 20.1% של GPT-4-Turbo, כאשר ציון נמוך יותר מצביע על ביצועים טובים יותר.

אפל אמרה שהיא אימנה את הדגמים שלה על נתונים מורשים וזמינים לציבור. כמו כן, נאמר כי החברה אינה משתמשת בנתונים האישיים הפרטיים של המשתמשים שלנו או באינטראקציות המשתמשים בעת אימון מודלים של היסודות שלה.

דילוג לתוכן