Search
Imagen 3

גוגל חשפה כלי בינה מלאכותית חדשים ליצירת מוזיקה, וידאו ותמונות ב-I/O – הנה איך לקבל גישה

ועידת המפתחים של Google I/O 2024 המיוחלת החלה ביום שלישי עם שלל ההכרזות הצפוי המכסות AI, יישומים וכלים עתידיים.

הביטוי AI הוזכר יותר ממאה פעמים ביום המרכזי בלבד. אבל לצד כל ההייפ של תאומים, היו כמה קטעים מענינים באמת של חדשות וידאו ותמונה שצצו ממעבדות גוגל, שמבשרות טובות לעתיד.

שימו לב לדגש על העתיד. למרבה הצער, הטוב ביותר מבין 'הניסויים' הללו זמינים כרגע רק על בסיס המתנה ונראה. כך תוכל לגשת לכלים שכבר פעילים ולהיכנס לרשימת ההמתנה לאותם דגמים שטרם הושקו.

גישה למטבח בדיקות AI

בראש הרשימה נמצא ה-VideoFX החדש, חלופת הטקסט לווידאו של גוגל לסורה של OpenAI. הכלי החדש מבוסס על מודל Veo של Google DeepMind, ומאפשר למשתמש ליצור קטעי וידאו באיכות 1080p באורך 'מעבר לדקה'.

קטעי הווידאו בדף ההדגמה של Veo מרשימים, ומבטיחים כמה פיצ'רים מגניבים כמו הרחבת קליפים, וידאו מתמונת סטילס ועריכה במסכה.

לרוע המזל, הפלא החדש הזה עדיין לא זמין, תצטרך להירשם לרשימת ההמתנה של הפרויקט כדי לקבל גישה.

מודל הטקסט לתמונה של גוגל, Imagen 2, הושק לפני שלושה חודשים, והטכנולוגיה כבר זמינה לשימוש באתר ImageFX.

אולם נשמות הרפתקניות שרוצות לבחון את הדגם החדש והמעודכן של Imagen 3, יצטרכו שוב להצטרף לרשימת המתנה של בוחנים מהימנים.

תוצאות התמונה הנוכחיות טובות, אבל בהחלט אין מה לצעוק מחלוץ הבינה המלאכותית. אנו מקווים שהגרסה החדשה מציעה שיפור משמעותי.

יצירת מוזיקה עם AI

MusicFX

MusicFX הושק בדצמבר בשנה שעברה, ובאותה עת היה ניסיון מוצק למחולל טקסט למוזיקה בינה מלאכותית.

עם זאת, חמישה חודשים שווים לשני תקופות חיים של בינה מלאכותית, והכלי זוכה כעת ללא תקנה על ידי עולים חדשים כמו Udio ו-Suno. והדברים כנראה רק הולכים להחמיר עם השחרור הקרוב של ElevenLabs Music.

למרות זאת, גוגל נלחמת בגבורה כדי להישאר רלוונטית, עם שדרוג ל-MusicFX בתצוגת ה-I/O של השבוע. מצב DJ החדש מאפשר לך לערבב ז'אנרים שונים לצד הנחיית הטקסט שלך, באמצעות מחוונים כדי להתאים את העוצמה של כל אחד מהם.

עדיין אין פעולה קולית, אבל התוצאות טובות, אם כי שוב זוגות בהשוואה למורכבות השופעת של שירותים כמו אודיו. החדשות הטובות הן שמצב DJ וגם מצב Creator זמינים כעת במיקום AI Test Kitchen.

ניסיון אמיץ לרלוונטיות

בינה מלאכותית יצרה תמונה של פיל סרוגה בצבע קשת בענן הולך בסוואנה

בסך הכל עברו 12 חודשים קשים עבור גוגל, שנראית יותר ויותר כמו ענק שטוח רגל שנתפס מנמנם ליד שולחן המטבח בינה מלאכותית.

בעוד שהחברה מספקת אט אט יישומים חדשים, חלק ניכר מהם נראה כמו ניסיון נואש להדביק יריבים זריזים ויצירתיים יותר.

במהלך מצגת מרכזית אחת על הכוח של Gemini 1.5 לספק מהירות רב-מודאלית ל-NotebookLM, משפט זעיר בפינה השמאלית התחתונה של מסך המצגת הכריז "השמע נוצר מראש". לא מראה נהדר עבור היוצרים של DeepMind.

דילוג לתוכן