Search
Project Astra

בדיוק שיחקתי ב-Pictionary עם Project Astra של גוגל – ועכשיו אני מבין את ההייפ של Gemini 1.5

פרויקט אסטרה גנב את ההצגה ב-Google I/O, ונתן לנו הצצה לאיך ייראו האינטראקציות שלנו עם העולם המופעל על ידי Gemini 1.5 – דגם ה-AI של גוגל מהדור הבא. למרות שעשוי לחלוף זמן מה עד שגרסה ציבורית של Project Astra תטפטף למכשירים, הייתה לי ההזדמנות להדגים את היכולות השונות שלה תוך כדי השתתפות בכנס המפתחים השנתי של גוגל.

בקיצור, פרויקט אסטרה הוא בינה מלאכותית מבוססת מצלמה בזמן אמת שיכולה לעשות כל דבר, החל מזיהוי אובייקט בפריים ועד ליצירת סיפור בדיוני על האובייקט האמור ועד לשכתב את הסיפור הזה תוך שימוש בכמות מגונה של אליטרציה. לא ברצינות, כשהתבקש עם תפוח פלסטיק, זה עשה רומנטיזציה של הצעצוע (ככל הנראה נלקח ממערכת משחקים לילדים) כ"תוצרת יפה הממוקמת בצורה מושלמת".

@tomsguide

♬ סאונד מקורי – המדריך של טום

לצורך ההדגמה, גוגל חיברה מצלמה נייחת מלמעלה למטה למכונה שמריצה את Gemini 1.5. עדכון המצלמה בלבד שימש למשחק אליטרציה זה, אם כי הוא גם הראה את צלעות זיהוי האובייקט של הדוגמנית. כאשר הוצגו בפני מערך של פסלוני דינוזאורים, תאומים לא רק קבעו את שמותיהם של כל אחד מהם, אלא גם מצאו שמות וקווי עלילה הרפתקניים שנראו מתאימים באופן מפתיע.

עם אתגר פחות מתוכנן מראש, כתב עמית ביקש מהסוכן לקרוא את הקעקוע הקטן יחסית שהודפס על האמה שלהם ולציין לאיזו תוכנית טלוויזיה הוא מכוון. למרות שתאומים ניחש את "משחקי הכס" בטעות בהתחלה, הוא נחת על "Battlestar Galactica" בניסיון השני. (למקרה שאתה תוהה, הציטוט היה "אז נגיד כולנו").

לגוגל הייתה מסך מגע שהוזן גם לדגם Gemini, מצויד לסיבובים ידידותיים של Pictionary. התגברתי כדי לאתגר את פרויקט אסטרה, והספקתי את הניסיון הטוב ביותר שלי לדרואיד מסוים בצורת כדור מיקום מלחמת הכוכבים כדי להישאר עם נושא המדע הבדיוני. למרות שהשרבוט הזה בהחלט לא הגיע למקום במקרר, כשנשאל, "מה אתה רואה?" הסוכן תפס את זה – BB-8 מטרילוגיית ההמשך.

אמנם להדגמה היה אופי של חידון, הרעיון הוא שהוא מוכיח כיצד תאומים יכולים להועיל עם יכולות הראייה שלו. גוגל אמרה שהיא תגיע תחילה לטלפונים אנדרואיד בצורה של Gemini Live, אבל סרטון ההדגמה הרשמי הזה מציג את הפעולה עם "אבטיפוס של מכשיר משקפיים", מה שמרמז על מבנה חדש בעבודה.

בתרחיש האידיאלי, Gemini Live יוכל לראות את מה שאתה רואה כדי לענות על שאלות, לעורר יצירתיות, או אפילו לעזור לך למצוא חפץ חסר שמסתתר לעין. לעשות זאת דרך אפליקציית Gemini או אפליקציית המצלמה בסמארטפון זה הגיוני מספיק, אבל אני חושב שעיצוב משקפיים כמו ה-Ray-Ban Meta Smart Glasses יספק בסופו של דבר פחות חיכוך.

ככלי בסגנון "הסתכל וספר לי", נראה שפרויקט אסטרה וג'מיני עומדים בהייפ. ישנן גרסאות מתחרות של שתיהן זמינות כעת, אבל אם חברה אחת יודעת לעשות חיפוש נכון, זו גוגל.

דילוג לתוכן