חברת הבינה המלאכותית של אילון מאסק, xAI, חשפה עדכון חדש וגדול לעוזרת הבינה המלאכותית שלה בשם Grok. האיטרציה האחרונה משלבת כעת יכולות ראייה, המאפשרות לגרוק לנתח ולהבין תמונות, לצד פונקציונליות הטקסט הקיימת שלה.
גרוק כבר יכול ליצור תמונות באמצעות מודל Flux ממעבדות היער השחור וזה היה האחרון במוצרי הצ'אט העיקריים של AI שלא כללו ניתוח תמונה, הידוע גם בשם AI vision.
עם הצגת תכונת החזון הזו, גרוק יכול לנתח תמונות המקושרות לפוסטים בפלטפורמת X, לפרש תוכן ויזואלי כגון מסמכים, דיאגרמות ותצלומים ולהבין יחסים מרחביים בתוך תמונות כדי לעזור לתאר טוב יותר את התוכן.
אתה יכול להשתמש בזה כדי להעלות רעיונות למתכון המבוסס על תמונה של מרכיבים, לזהות את המיקום של ציון דרך בתוך תמונה ששותפה ב-X או אפילו להסביר את התוצאות של גרף. החלק האחרון יכול להיות שימושי במיוחד בפלטפורמה עתירת חדשות כמו Grok.
איך החזון עובד בגרוק
משתמשים יבחינו בקרוב בכפתור חדש בפוסטים המכילים תמונות בפלטפורמת X. כאשר לוחצים עליו, הוא שולח את התמונה לגרוק, ומאפשר למשתמשים להעלות שאלות או לבקש ניתוחים של התוכן החזותי. זה יכול לשמש גם כדי לעזור בתיאור תמונות לאנשים עם בעיות ראייה.
עדיין לא ראינו אמות מידה רשמיות, אבל על פי xAI יכולות החזון של Grok מחזיקות מעמד מול מודלים מבוססים מ-OpenAI, Google ו-Anthropic. לשם כך, החברה הציגה אמת מידה חדשה, RealWorldQA, שנועדה להעריך את מיומנות המודל בהבנה ובנימוקים לגבי העולם הפיזי באמצעות תמונות.
ההכרזה הובילה לתגובות מגוונות מקהילת הבינה המלאכותית ומהמשתמשים, כאשר חלקם התלהבו מהמהירות שבה Grok מתקדמת, בעוד שאחרים נשארו זהירים והטילו ספק בביצועים שלה מול מודלים מבוססים של בינה מלאכותית.
הירשם כדי לקבל את המדריך הטוב ביותר של טום ישירות לתיבת הדואר הנכנס שלך.
כאן ב-Datilin העורכים המומחים שלנו מחויבים להביא לך את החדשות, הביקורות והמדריכים הטובים ביותר שיעזרו לך להישאר מעודכן ולהקדים את העקומה!
מה מגיע אחר כך לגרוק
ל-xAI בבעלות אילון מאסק יש מרכז נתונים של 200,000 GPU שנבנה למטרה היחידה להכשיר גרסאות עתידיות של Grok. אני חושב שזה בטוח לומר שאנחנו הולכים לראות דברים גדולים מהדגם בעתיד.
הקשורים ספציפית ליכולות הראייה, אלה יכולים למצוא את דרכם לרובוטים. מאסק הוא הבעלים של טסלה, שגם לה חטיבת רובוטיקה משלה. בעתיד, אנו עשויים לראות גם ניתוח וידאו וקול מ-Grok מכיוון שאלו תכונות שכבר קיימות עם Gemini ו-ChatGPT.
למרות שעדכון זה מסמן התקדמות בולטת עבור Grok, ברור שהדגם עדיין בפיתוח בהשוואה לדגמי AI בוגרים יותר כמו Gemini או ChatGPT. כמו בכל טכנולוגיות הבינה המלאכותית המתפתחות במהירות, נצטרך לפקח הן על היכולות המשודרגות והן על השיקולים האתיים של התפתחויות אלו בחודשים הבאים.