Hailuo MiniMax הושק מוקדם יותר השנה והפך מהר מאוד לאחד מדגמי הבינה המלאכותית הטובים ביותר של טקסט לווידאו בשוק, ומציע תנועה מציאותית ועיבוד וידאו באיכות גבוהה – בחינם לחלוטין.
מצאתי שהאיכות טובה, אבל היעדר דגם תמונה לווידאו היה גורם מגביל בשימושיות שלו. הוא גם נאבק בזמני תגובה איטיים ובעוד שהתנועה הייתה טובה באופן עקבי, הריאליזם שלו לפעמים לא הצליח לעמוד בהייפ.
החברה בונה במהירות על המודל, כולל השקת אתר אינטרנט וקהילה ייעודיים חדשים בשפה האנגלית. השדרוג האחרון הוא סוף סוף להשיק מודל תמונה לווידאו המאפשר שליטה רבה יותר על איך הסרטון נראה.
העמדתי את זה למבחן עם סדרה של הנחיות והנה איך זה הלך.
העמדת Hailuo MiniMax במבחן
כדי להפיק את המקסימום מדגם תמונה לווידאו צריך להתחיל עם תמונה טובה ולכן פניתי ל-Flux 1.1 Pro מ-Black Forest Labs.
הגעתי לחמש הנחיות מהנות שדורשות דרגות שונות של תנועה, ואז חידדתי אותן בעזרת ChatGPT כדי להפוך אותן לתיאוריות ככל האפשר.
לאחר מכן נתתי את התמונות שהתקבלו ל-MiniMax יחד עם הנחיה מותאמת אישית או רק את התמונה בתור כל ההנחיה.
הירשם כדי לקבל את המדריך הטוב ביותר של טום ישירות לתיבת הדואר הנכנס שלך.
כאן ב-Datilin העורכים המומחים שלנו מחויבים להביא לך את החדשות, הביקורות והמדריכים הטובים ביותר שיעזרו לך להישאר מעודכן ולהקדים את העקומה!
1. האסטרונאוט על מאדים
הנחיה זו תבחן את יכולתו להתמודד עם תנועה שעלולה להיות מורכבת בסביבה פיזית פחות מהרגיל – כוח המשיכה הנמוך של מאדים בסופת אבק.
הנחיית תמונה: "אסטרונאוט בודד שהולך על מאדים במהלך סופת אבק, נלכד בסגנון קולנועי דרמטי. הקומפוזיציה מציגה את האסטרונאוט במרכז הפריים, בצללית על רקע ענני אבק אדום מתערבלים. התאורה עמומה ומפוזרת, עם אור השמש בקושי חודר דרך הסערה פלטת הצבעים נשלטת על ידי גוונים חמים וחלודים של אדום וכתום, מה שמעניק לסצנה אווירה עוינת אך מעוררת יראת כבוד. הצילום נלקח מזווית נמוכה, ומדגיש את הקטנות של האסטרונאוט על פני השטח האדיר של מאדים, עם פרטים עדינים כמו תצורות סלע מוכות רוח ברקע."
הנחיית תנועה: "אסטרונאוט רץ על מאדים בסופת אבק".
2. קיום שיחה
הנחיה נפוצה לבדיקה שאני מנסה עם Runway ו-Kling היא שמישהו ידבר. כאן יצרתי תמונה של אישה מדברת וביקשתי מה-AI לגרום לו לזוז.
הנחיה לתמונה: "אישה צעירה מנהלת שיחה מונפשת, מתוארת בסגנון צילום רחוב תוסס. הקומפוזיציה לוכדת אותה בזווית של שלושה רבעים, עם עומק שדה רדוד כדי להתמקד בהבעות הפנים שלה תוך טשטוש העיר הסואנת שמאחוריה תאורה של שעת הזהב הטבעית מטילה זוהר חם על פניה, מדגישה את הבעתה המשמחת היא שילוב של צהובים חמים וכחולים, משדרת תחושה של אנרגיה וחיים השימוש בעדשת 50 מ"מ מבטיח פרספקטיבה טבעית, מושך את הצופה לשיחתה, בעוד פרטים קטנים כמו הולכי רגל ואורות בוקה רכים מוסיפים לאווירה האורבנית".
הנחית תנועה: "מנהל שיחה."
3. כלבים על החוף
אחת מתמונות הבינה המלאכותית ה'טובות' הראשונות שראיתי אי פעם הייתה של כלבים נעים על חוף הים ואחד מסרטוני ההדגמה הטובים ביותר של סורה היה של כלבים משחקים. אז ביקשתי מ-Flux ליצור תמונה של כלב בתנועה, ואז השתמשתי ב-Hailuo כדי לגרום לו לזוז באמת.
הנחיה לתמונה: "כלב עליז משחק על החוף, נלכד בסגנון גחמני וציורי. הקומפוזיציה מציבה את הכלב באמצע הפעולה, מזנק למעלה לתפוס כדור נזרק, עם ניתזי מי ים קפואים באוויר. התאורה בהירה וזהוב, המצביע על אחר הצהריים המאוחרים עם השמש נמוכה באופק, מטיל צללים ארוכים בגוונים חומים חמים, כחולים תכולים של ים והדגשים זהובים, מה שמשפר את האווירה המשובבת והאנרגטית , מעורר אושר וחופש הסצנה מצולמת מנקודת מבט מעט נמוכה כדי להדגיש את ההתלהבות של הכלב, עם פרטים טכניים המתמקדים בטשטוש תנועה כדי להעביר תחושת תנועה, וגלים עדינים ברקע מוסיפים לתפאורה החופית."
הנחית תנועה: "מצלמת סמארטפון, כלב מקפץ על החוף".
4. תצוגת מזל"טים בלונדון
אמנם תצוגות רחפנים יכולות להיות קסומות, אך הן מוגבלות בהיקפן בשל העלות והמורכבות של תנועת נחיל, אך האם וידאו בינה מלאכותית יכול להשתפר? גם לא נתתי לו הנחיה טקסט כך שהכל תלוי בתמונה ובדגם.
הנחיה לתמונה: "תצוגת אור מזל"ט מדהימה מעל לונדון, מעובדת בסגנון עתידני בהשראת ניאון. הקומפוזיציה כוללת את המל"טים המוארים היוצרים דפוסים מורכבים בשמים מעל ציוני דרך איקוניים כמו גשר המגדל והשרד. התאורה מלאכותית לחלוטין , הכוללת אורות בהירים ורב-צבעים מהמל"טים על רקע שמי הלילה, בניגוד לאורות העיר החמים למטה. פלטת הצבעים כוללת כחולים, סגולים וירוקים, התורמים לאווירה עתידנית, קסומה ותדהמה, לוכדת את דמיונו של הצופה התמונה מצולמת מנקודת תצפית גבוהה, מביטה מעט מטה על הנוף העירוני, עם פרטים טכניים כמו חשיפה ארוכה המשמשת ליצירת שבילי אור, והשתקפויות מנצנצות על התמזה.
5. מכונית מירוץ על הר
כל דגם וידאו בינה מלאכותית שניסיתי מתמודד עם תנועת הרכב. אז בואו נראה עד כמה הוא מתמודד עם תמונה לא טובה במיוחד של מכונית ספורט שדוהרת.
הנחיה לתמונה: "מכונית מירוץ מלוטשת דוהרת בשביל הררי מפותל, מאוירת בסגנון היפר-ריאליסטי. הקומפוזיציה מציגה את המכונית באמצע הפנייה, עם טשטוש תנועה ברקע כדי להדגיש את מהירותה. התאורה טבעית, עם אור שמש. מסנן בין העצים ומטיל צללים מנומרים על הכביש. פלטת הצבעים מציגה את האדום הבוהק של המכונית בניגוד לירוק השופע של היער שמסביב, ואת האפור המושתק של האספלט של מירוץ במהירות גבוהה הצילום נלקח מזווית צד דינמית, כמעט בגובה המכונית, לוכד את תחושת התנועה והזריזות סצנה, כשהדרך המפותלת נעלמת אל ההרים כדי להוסיף עומק".
הנחית תנועה: "מצלמה קבועה, מירוץ מכוניות למרחקים."
מחשבות אחרונות
Hailuo MiniMax כבר היה מרשים. הסתכלתי אחורה על כמה מדורות הטקסט לווידאו הקודמים שלי, כמו גם דוגמאות מאחרים בזמן שחיכיתי להשלמה – וזה ברמה גבוהה מאוד. תמונה לווידאו לוקחת את זה עוד מדרגה.
דבר אחד שבאמת בלט הוא עד כמה הוא מתמודד עם תנועה עקבית לאורך שש שניות הווידאו שהוא יוצר בכל הנחיה. הופתעתי עד כמה הדוגמנית התמודדה עם תנועות הידיים במבחן 'אישה מדברת'.
זה לא לגמרי מושלם. הכדור נעלם ונראה היה שהכלב משנה גזע באמצע הדרך, והאסטרונאוט עושה ג'יג בהתחלה – אבל זה טוב יותר מרבים מדגמי הווידאו של AI שניסיתי.