כל משתמשי Google Gemini יכולים ליצור תמונות באמצעות מצב התמונה העדכני ביותר של בינה מלאכותית של גוגל, Imagen 3. זה כולל את אלה המשתמשים בו באינטרנט, באפליקציה או משולבים באנדרואיד. זה היה זמין בעבר רק למנויי Gemini Advanced המשתמשים בגרסת האינטרנט של ה-AI.
Imagen 3 נחשפה על ידי גוגל במהלך אירוע ה-I/O מוקדם יותר השנה. נבנה על ידי מעבדת המחקר של החברה, DeepMind, הוא יכול ליצור תמונות בפורמט ריבועי עם רמת ריאליזם דומה לאלו של Midjourney או Flux.
יש כמה מגבלות, במיוחד עבור משתמשי Gemini בחינם. כרגע, לא תוכל להשתמש בו כדי ליצור תמונות של אנשים אלא אם תשלמו 19 דולר לחודש עבור Gemini Advanced, וגם אז, הוא לא ייצור תמונות של אנשים אמיתיים.
הכוח האמיתי של תאומים במונחים של יצירת תמונה נובע מהיכולת שלה להתאים בקלות או אפילו לשנות לחלוטין תמונה מתיאור טקסט פשוט. ייתכן שתצטרך לעדכן את האפליקציה כדי לקבל יכולות יצירת תמונות.
מה חדש עם Imagen 3?
Imagen 3 הוא שדרוג ויזואלי ל-Image 2 הקודם. התמונות עשירות ומפורטות יותר, והדגם טוב יותר בביצוע הוראות שניתנו לו על ידי Gemini.
גוגל הסירה את יכולות יצירת התמונות מג'מיני לזמן מה בגלל חששות שהיא נזהרת מדי בעת עיבוד תמונות של אנשים. הדגם הקודם גם נטה לגרום להכל להיראות כאילו הוא פלסטיק.
הדגם החדש מביא את יכולות יצירת התמונות של גוגל בקנה אחד עם DALL-E 3 מבית OpenAI, למרות שהוא עדיין יוצר רק תמונות מרובעות, בעוד ש-ChatGPT יכול להשתמש ב-DALL-E 3 כדי ליצור תמונות בכל כיוון וגודל. בניסויים שלי, גיליתי שזה עדיין מסרב לעתים קרובות יותר ממה שהייתי רוצה ליצור תמונה, במיוחד אם זה היה משהו מורכב יותר, כמו מראה של אדם יושב בבית קפה על בסיס ירח. אבל לתיאורים יומיומיים – זה נהדר.
הירשם כדי לקבל את המדריך הטוב ביותר של טום ישירות לתיבת הדואר הנכנס שלך.
כאן ב-Datilin העורכים המומחים שלנו מחויבים להביא לך את החדשות, הביקורות והמדריכים הטובים ביותר שיעזרו לך להישאר מעודכן ולהקדים את העקומה!
הוספת יצירת תמונה מגיעה מאחור של עדכון אחר, מה שמקל על שליחת תמונה ל-Gemini לניתוח. זה ידוע בשם AI Vision ומאפשר לדגם לתאר את תוכן התמונה. זה יכול להועיל לאיתור חפץ חסר בחדר או יצירת מתכון ממרכיבים.