Openai הודיעה היום על מחולל התמונות של GPT-4O, והציגה יכולות ייצור תמונות מתקדמות המשולבות במודל השפה CHATGPT-4O.
בחברה אומרים כי GPT-4O מייצג קפיצת מדרגה משמעותית בייצור תמונות שצריכות ליצור תמונות שלא רק מדהימות חזותית אלא שימושיות כמעט.
חזותיים מעשיים לשימוש בכל יום

מודל התמונה GPT-4O מתמקד ב'נוצר תמונה שימושית ', כלומר משתמשים יכולים כעת להשתמש במודל AI לצרכים יומיומיים כמו לוגואים, דיאגרמות ואינפוגרפיקה.
אולי תאהב
-
Chatgpt 4.5 – 5 שדרוגים גדולים שאתה צריך לדעת
-
Openai Chatgpt-4.5 כאן וזה הצ'אט הכי דמוי אנושי עד כה-הנה איך לנסות את זה
בניגוד למודלים גנאטיביים קודמים המייצרים לעתים קרובות חזותיים סוריאליסטיים אך לא מעשיים, GPT-4O תוכנן לספק תמונות רלוונטיות ומדויקות יותר בהקשר.
שילוב טקסט מעולה

מאפייני המפתח של GPT-4O כוללים עיבוד טקסט משודרג, המאפשר שילוב חלק של מידע טקסטואלי בתמונות. יכולת זו תומכת בתקשורת חזותית, ומעלה את התועלת של תמונות שנוצרו.
בנוסף, GPT-4O תומך בייצור רב-סיבוב, ומאפשר למשתמשים לעדן ולהתאים תמונות באמצעות אינטראקציות שיחה טבעיות, תוך שמירה על עקביות בתהליכי עיצוב איטרטיביים.
טיפול בהוראות מורכב

דור התמונות מ- GPT-4O מסוגל לנהל הנחיות מורכבות הכוללות עד 20 אובייקטים מובחנים, המהווה שיפור לעומת מערכות קיימות.
הירשם כדי לקבל את המיטב מהמדריך של טום ישירות לתיבת הדואר הנכנס שלך.
קבל גישה מיידית ל- Breaking News, הביקורות החמות ביותר, מבצעים מעולים וטיפים מועילים.
באמצעות למידה בהקשר, GPT-4O יכול לנתח תמונות שהועלו על ידי משתמשים, ולשלב בצורה חלקה את הפרטים הללו בדורות התמונה הבאים, ובכך ליצור פלט חזותי מותאם אישית ומושכל יותר.
הכשרה רב -מודאלית מקיפה

GPT-4O, שנבנה על אימונים רב-מודליים נרחבים במערכי נתונים מקוונים וטקסטים מקוונים, פיתח שטף ראייה מתוחכם, ומאפשר למודל לייצר תמונות המודעות בהקשר, מגוונות סגנוניות ומשכנעות פוטוריאליסטית.
מגבלות ודאגות בטיחותיות

למרות היכולות המתקדמות שלה, Openai מכיר מגבלות מסוימות, כמו סוגיות חיתוך מדי פעם, פרטים הזויים, קשיים המעניקים מידע צפוף בקנה מידה קטן, ואתגרי עריכה מדויקים. עיבוד טקסטים רב לשוני, במיוחד לתסריטים מורכבים שאינם לטינים, נותר אזור בפיתוח פעיל.
הבטיחות ממשיכה להיות מוקד בעל חשיבות עליונה, עם אמצעים קפדניים כדי לחסום תוכן מזיק, כולל חומרים או תמונות מפורשות המפרים את מדיניות התוכן. כלי פרובנס, כגון תיוג מטא נתונים C2PA וחיפוש הפוך פנימי, מבטיחים שקיפות ואחריות בוויזואליות שנוצרו.
זמינות ותפיסה עתידית
יצירת תמונות GPT-4O זמין כעת בכל פלטפורמות CHATGPT, כולל פלוס, מקצוען, צוות ושכבות בחינם, עם גישה ארגונית וחינוך צפויה בקרוב.
ללא קשר לשכבה, המשתמשים יכולים לציין דרישות תמונה מפורטות-מצבעים מדויקים ויחס גובה ועד רקע שקוף-מה שהופך את יצירת התמונות באיכות מקצועית לפשוטה כמו אינטראקציה פשוטה של צ'אט.
ה- GPT-4O של Openai מסמל התקדמות משמעותית בתקשורת חזותית מונעת AI, והופכת יצירת תמונות גנוציות לכלי נגיש, מעשי ועוצמתי למשתמשים יומיומיים ואנשי מקצוע כאחד.