Search
Midjourney logo on phone

Midjourney טיפות הפתעה עדכון v6.1 – כעת בני אדם נראים אמיתיים מתמיד

Midjourney, הפלטפורמה המובילה ליצירת תמונות בבינה מלאכותית, השיקה עדכון מפתיע לדגם הליבה שלה. בגרסה 6.1, עור על בני אדם נראה טבעי יותר והטקסט שעבר עיבוד הוא גם קריא יותר.

היו ספקולציות שהחברה תשחרר את גרסה 6.5 בשלב מסוים בקיץ הזה, אבל נראה שהם הלכו על גישה איטרטיבית יותר, עם גרסה 6.2 שתגיע בשבועות הקרובים.

השינויים הגדולים ביותר הם באנשים. באופן ספציפי איך הוא מטפל בתיאור של ידיים, רגליים, ידיים וגופים. גם מיפוי המרקמים שלו שודרג כדי להציע מרקמי עור חדשים.

לאחר ששיחקתי לזמן קצר עם הגרסה החדשה, הייתי אומר ש-6.1 מרגיש יותר כמו שדרוג גדול ממה שהמספור האיטרטיבי שלו מרמז. עיבוד הטקסט המשופר לבדו שווה את השינוי.

מה חדש ב-Midjourney v6.1?

פוסטר Midjourney של סרט חתולים

בסך הכל ישנם שינויים בכל היבט של המודל. שדרוגים עדינים לכל אזור משפרים את איכות התמונה על ידי הפחתת מספר חפצי הפיקסלים, שיפור המרקמים והאופן שבו הוא מתמודד עם סגנונות מסוימים כגון עיצובי 8bit ורטרו.

ב-Midjourney אומרים כי הדגם החדש מהיר יותר ב-25% בעת הפעלת עבודה סטנדרטית ושדרוגים למודל ההתאמה האישית מאפשרים ניואנסים, הפתעה ודיוק משופרים ביחס ל-v6.

החברה כתבה ב-X: "V6.1 משפרת מאוד את איכות התמונה, הקוהרנטיות, הטקסט, ומגיעה עם מודלים חדשים לשינוי קנה מידה והתאמה אישית", והוסיפה כי "זה חכם יותר, מהיר יותר, ברור יותר ויפה יותר. אנו מקווים שתיהנו מהדגם הטוב ביותר שלנו עד כה."

אחד השינויים החדשים הוא באופן שבו עובד היוקרתי, ומציע איכות תמונה ומרקם טובים יותר כדי לשפר את המראה והתחושה הכלליים. יש מצב –q 2 חדש שלוקח הרבה יותר זמן אבל מוסיף יותר מרקם כדי לשפר עוד יותר את הריאליזם של התמונה.

יש גם תכונות תמונה קטנות יותר מדויקות, מפורטות ונכונות המושלמות לעיניים, פנים קטנות וידיים רחוקות.

התכונה שאני הכי מתרגש ממנה היא דיוק טקסט משופר. זה משהו שכל דגמי הבינה המלאכותית נאבקים בו, אבל מידג'ורני אומר שאם תכניס מילים בתוך ציטוטים בבעיה, זה יציג את המילים האלה בצורה מדויקת בתמונה.

עד כמה Midjourney v6.1 עובד?

תמונת Midjourney של אישה מונפשת ב-Runway באמצעות תמונה לווידאו מהדור השלישי

כדי להשתמש ב-Midjourney v6.1 פשוט הוסף -v 6.1 לסוף ההנחיה שלך. זה עובד באינטרנט ובגרסאות Discord וישנה את הדגם שבו אתה משתמש. רצתי כמה בדיקות והשינויים הברורים ביותר הם בעיבוד העור והטקסט.

במבחן הראשון, נתתי לו את ההנחיה: "פוסטר לסרט בשם "חתולים בחלל" שבו כותרת המשנה היא "הם טובים בחתולים" המראה חתולים על הירח בחליפת חלל". זה היה מפורט מספיק כדי לכוון את המודל וכלל דרישות טקסט.

הפוסטר יצא יותר טוב ממה שיכולתי לצפות, למרות שרק שתי גרסאות היו עם הסגנון הנכון ובאחת מהן הייתה עיבוד מדויק של הכותרת וכותרת המשנה.

תמונת Midjourney של ילדה מנגנת בפסנתר

לאחר מכן ביקשתי ממנו להציג "צילום רחב של אישה מנגנת בפסנתר חופשי ציבורי בתחנת רכבת." זה היה מעורפל מספיק, שאם ההודעה הבאה הייתה כבויה זה ייתן משהו מוזר אבל זה לא קרה, קיבלתי בדיוק את מה שקיוויתי לו למרות שגרסה אחת כמעט העלתה אותה על המסלול.

לבסוף, גרמתי ל-Midjourney v6.1 ליצור תמונה של אישה והנפשתי אותה באמצעות הפונקציונליות החדשה המרשימה של Runway Gen-3 Alpha תמונה לווידאו וזה אחד התמונות והסרטונים האמיתיים ביותר של AI שיצרתי עד היום.

בסך הכל אני חושב שזהו שיפור בולט ל-Midjourney, שמציע שינויים עדינים אך משמעותיים לאזורים בהם המודל הבסיסי נאבק, והוא סימן מצוין למה שעתיד לבוא ב-v7.

דילוג לתוכן