ל-OpenAI היו הרבה עיניים על זה מוקדם יותר השבוע כאשר חשפה את ChatGPT-4o לעולם, ולמרות שחלק מהתכונות שלו עדיין מתפרסמות, בהחלט התרשמנו עד כה.
GPT-4o (ה'O' מייצג 'Omni') מביאה תפנית עצומה לצ'אטבוט, ומוסיפה קול שנשמע טבעי שיש מאחוריו רגש כמעט אמיתי. ועכשיו, חברת בינה מלאכותית אחרת הדגימה כיצד ניתן להשתמש במצב הקול של דגם ה-GPT-4o כדי לסנתז אדם דיגיטלי.
לוקחים ל-Xויקטור ריפרבלי, מייסד שותף של מנוע הווידאו בינה מלאכותית Synthesia, אמר "מצב הקול GPT-4o הוא באמת מרשים."
"נתנו לזה פנים עם @synthesiaIO EXPRESS-1, מודל האווטאר האחרון שלנו. כשאמפתיה היא חשובה – בריאות, אימון, חינוך – פנים ידידותיות באמת עושה את ההבדל", הוא הוסיף והצביע על החשיבות של פלטפורמות שיחות וידאו כמו התקרב לשיחות קוליות רגילות בלבד.
לשים פנים ל-LLM
סקרנו בעבר את Synthesia, שמייצר מעין אווטאר של משתמש שהוא יותר מקצת מטריד.
בדוגמה של Riparbelli, Synthesia מייצרת אישה בחולצה אדומה, עם סינכרון שפתיים די נקודתי למה שמצב הקול של ChatGPT-4o אומר.
הסרטון אכן נחתך בשלב מסוים כאשר ההדגמה מסתובבת בחדר, כך שקשה לומר אם אווטאר הבינה המלאכותית מתנגן על ידי התבוננות סביב החדר, אך כאשר מסבירים לדגם שההדגמה היא להציג את יכולותיו, הוא עושה סוג מסודר של "הטיית ראש" בהפתעה.
הירשם כדי לקבל את המדריך הטוב ביותר של טום ישירות לתיבת הדואר הנכנס שלך.
שדרג את חייך עם מנה יומית של החדשות הטכנולוגיות הגדולות ביותר, פריצות לסגנון חיים וניתוח שנקבע שלנו. היה הראשון לדעת על גאדג'טים חדישים ועל המבצעים החמים ביותר.
אם אתה רוצה לבדוק את GPT-4o, הוא יוצא עכשיו. הנה איך לקבל גישה – אם כי היה מוכן לחכות אם OpenAI עדיין לא הכניס אותך לרשימה.