מנכ"ל OpenAI, סם אלטמן, אומר שהמשתמשים הראשונים יתחילו לקבל גישה ל-GPT-4o Advanced Voice בשבועיים הקרובים, אך זו תהיה השקת "אלפא" מוגבלת.
החברה בוחנת את מלוא היכולות של GPT-4o, סוג חדש של דגם Omni ששוחרר במהלך עדכון האביב שלו במאי. שלא כמו GPT-4, מודל מולטי-מודאלי זה יכול להבין דיבור ישירות מבלי להמיר אותו לטקסט.
זה הופך את GPT-4o למהיר יותר ומדויק יותר באופן משמעותי כאשר הוא פועל בתפקיד העוזר הקולי, אפילו מאפשר לו לקלוט את הטון והאינטונציות הקוליות במהלך שיחה.
משתמשים חיכו בסבלנות לגישה, אבל OpenAI אומר שבדיקות הבטיחות חייבות להסתיים תחילה. חלקם קיבלו גישה לזמן קצר, והיו הדגמות מרובות של היכולות שלו, אבל רוב המשתמשים לא יקבלו אותה עד מאוחר יותר השנה.
מהו GPT4o Voice Advanced
אלפא מתחיל מאוחר יותר החודש, GA יגיע קצת אחרי18 ביולי 2024
צפה ב-On
GPT-4o Advanced Voice הוא סוג חדש לגמרי של עוזר קולי, דומה אך גדול יותר מהדגם הצרפתי מושי שנחשף לאחרונה, שהתווכח איתי על סיפור.
בהדגמות של הדגם, ראינו את GPT-4o Advanced Voice יוצר קולות דמויות מותאמים אישית, מייצרים אפקטים קוליים תוך כדי סיפור ואפילו פועל כמתרגם חי.
יכולת הדיבור המקורית הזו היא צעד משמעותי ביצירת עוזרי AI טבעיים יותר. בעתיד, הוא יגיע גם עם יכולות ראייה חיה, שיאפשרו ל-AI לראות את מה שאתה רואה.
קבל את המבצעים המובילים של Amazon Prime Day ישירות בתיבת הדואר הנכנס שלך: הירשם עכשיו!
קבל את המבצעים החמים ביותר והמלצות המוצרים לצד החדשות הטכנולוגיות הגדולות ביותר מצוות המדריך של Tom ישירות לתיבת הדואר הנכנס שלך!
מקרי שימוש נוספים עבור Advance Voice כוללים את העובדה שהוא יפעל כמורה לשפה סבלנית מאוד, מסוגל לתקן אותך ישירות בהגייה ולעזור לשפר את המבטא שלך.
"מצב הקול המתקדם של ChatGPT יכול להבין ולהגיב עם רגשות ורמזים לא מילוליים, ולקרב אותנו לשיחות טבעיות בזמן אמת עם AI. המשימה שלנו היא להביא לכם את החוויות החדשות האלה בצורה מהורהרת", אמר OpenAI בהצהרה בחודש שעבר.
מדוע העיכוב בהשקת GPT-4o Advanced Voice?
צפה ב-On
OpenAI היא אחת ממעבדות הבינה המלאכותית הזהירות ביותר, שלוקחת זמן רב לבדיקת אבטחה, אימות והצבת מעקות בטיחות עבור כל דגם גדול חדש.
אלטמן קראה גם לרגולציה של דגמים בסגנון גבול כמו ה-GPT-5 הקרוב או דגמי עולם כמו סורה בשל הסיכון שהם מהווים לחברה. זהירות זו אפשרה לחברות אחרות להתחיל להדביק את ה-OpenAI, ו-GPT-4 הוא כבר לא הדגם היחיד בדרג העליון.
החברה חששה ש-GPT-4o Advanced Voice, ללא מעקות בטיחות מתאימים, עלול להציע מידע שעלול להזיק או לשמש באופן בלתי צפוי. כדי להתמודד עם זה, הם משחררים אותו בהדרגה למשתמשים מהימנים תחילה ולאחר מכן באופן נרחב יותר עם הזמן.
"כחלק מאסטרטגיית הפריסה האיטרטיבית שלנו, נתחיל את האלפא עם קבוצה קטנה של משתמשים כדי לאסוף משוב ולהרחיב על סמך מה שלמדנו", הסביר דובר.
"אנחנו מתכננים שלכל משתמשי פלוס תהיה גישה בסתיו. לוחות זמנים מדויקים תלויים בעמידה בסרגל הבטיחות והאמינות הגבוהים שלנו. אנחנו גם עובדים על השקת יכולות שיתוף הווידאו והמסך החדשות שהצגנו בנפרד, ונעדכן אותך בציר הזמן הזה".