OpenAI מצטרפת לחברות כמו גוגל, אפל ומיקרוסופט באירוח אירוע לקידום מוצר חדש ויש לו הייפ דומה לכל מה שמחזיקה יצרנית האייפון.
אז מה אנחנו יכולים לצפות מאירוע ההכרזה הפומבית הראשון של OpenAI? כנראה לא מה שאתה מצפה לראות כשהחברה מתחילה להתמקד יותר במוצר מאשר בדגם.
השמועה הייתה שאנחנו הולכים לראות צורה כלשהי של מנוע חיפוש חדש ואולי GPT-5, אבל שום דבר מזה לא יקרה לפי המנכ"ל סם אלטמן.
הוא אמר ב-X כי ההכרזה היא "לא gpt-5, לא מנוע חיפוש, אבל עבדנו קשה על כמה דברים חדשים שאנחנו חושבים שאנשים יאהבו! מרגיש לי כמו קסם."
חרושת השמועות נשענת בכבדות על העובדה שאנחנו הולכים לקבל עוזרת קולית, וזו לא עוזרת קולית כמו סירי או אלכסה, זה יהיה קרוב יותר לסמנתה מהסרט "היא" – סוף אמיתי ל -סיים בינה מלאכותית לשיחה.
למה אנחנו יכולים לצפות מאירוע OpenAI?
אני מסכים עם חרושת השמועות שעוזרת קולית בתיאור מסוים היא ההכרזה הגדולה ביותר באירוע OpenAI.
עם זאת, יצירת עוזר קול אמיתי כרוכה בכמה דגמים משודרגים באופן משמעותי, כולל זיהוי דיבור וניתוח קול משופר. זה כנראה אומר גרסה חדשה של OpenAIs מודל התמלול החזק של Whispering.
הירשם כדי לקבל את המדריך הטוב ביותר של טום ישירות לתיבת הדואר הנכנס שלך.
שדרג את חייך עם מנה יומית של החדשות הטכנולוגיות הגדולות ביותר, פריצות לסגנון חיים וניתוח שנקבע שלנו. היה הראשון לדעת על גאדג'טים חדישים ועל המבצעים החמים ביותר.
אנו עשויים גם לקבל התנהגות כמו סוכן עבור העוזר החדש. זה המקום שבו הבינה המלאכותית יכולה לפעול ולבצע פעולות בעצמו בשמך ברחבי הרשת הפתוחה יותר.
הדגמים האלטרנטיביים והסוכנים הפוטנציאליים הללו יכולים למצוא את דרכם אל ChatGPT Plus, תוכנית הפרימיום למוצר הדגל של OpenAI.
אם נקבל שדרוג גדול ל-ChatGPT Plus, סביר להניח שפירוש הדבר יהיה שדרוג לגרסה החינמית, ולבסוף יביאו את GPT-4 ו-DALL-E.
איזו צורה תלבש העוזרת הקולית הקסומה הזו?
בסרט "היא", דמות הבינה המלאכותית סמנתה נועדה להסתגל ולצמוח באמצעות האינטראקציות שלה עם בני אדם. עם הזמן סמנתה מפתחת מודעות עצמית, עומק רגשי ויכולת ליצור קשרים משמעותיים.
ראינו רמזים של OpenAI נוטה לכיוון הזה. ChatGPT יכול כעת לזכור מה הקלדת ולהשתמש בזה בשיחות עתידיות, ואם אי פעם יצרת אינטראקציה עם הסוכן הקולי באפליקציית ChatGPT היא כוללת הפסקות והטיות כמו אנושיות מה שגורם לזה להישמע יותר רגשי.
אני לא חושב לרגע, אנחנו הולכים לראות משהו בסדר גודל של סמנתה. אבל, אם OpenAI יצרה AI קולי משופר מקצה לקצה, שיכול לפעול בשמך ולהשתלב במכשיר אחר – זה יהיה רגע "קסם".
השינוי הגדול ביותר יהיה מעבר לדיבור לדיבור. כרגע ChatGPT Voice ממיר את הדיבור שלך לטקסט ואז לוקח את הטקסט הזה, שולח אותו למודל AI, מחזיר טקסט וממיר אותו לדיבור. זה יוצר פיגור שלא עובד טוב לשיחה.
שלא כמו סירי או אפילו מזל תאומים שבהם אתה מקיים אינטראקציה על ידי שאילת שאלה ומחכה, בתקווה שזה הוכשר או תוכנת לקבל את התשובה, עם עוזר קול אמיתי חדש פשוט תהיה לך שיחה טבעית, כמו אנושית.
מה עם הסוכנים?
סוכנים הם הטרנד הגדול הבא בבינה מלאכותית. הם דגמי מיני AI הנשלטים על ידי הדגם הראשי כמו GPT-4, אך מסוגלים להתמודד עם משימות בעצמם.
לדוגמה, אתה יכול להגיד ל-ChatGPT "זה יום ההולדת של אשתי ושכחתי" וזה יכול להתבטל, למצוא מתנה ממה שאמרת עליה בעבר, להזמין את המתנה ולארגן משלוח יחד עם הודעות לאשתך.
דוגמה ל"נחילי" הסוכנים הללו ניתן לראות בפלטפורמת מפתחי הבינה המלאכותית Devin, שם אתה אומר לו מה לעשות והוא נכבה ומבצע את כל הפעולות הדרושות לו כדי להשיג את המטרה מגלישה באינטרנט ועד הורדת תמונות.
מה עוד נוכל לראות?
אולי נקבל עוד סרטוני Sora ואינדיקציה מתי זה יהיה זמין לציבור. אנו עשויים גם לקבל את הרעיון הראשון של כמה טוב החלופה Voice Engine ElevenLabs עובדת בפועל.
ההתמקדות תהיה במוצרים ולא בדגמים הבסיסיים. אנחנו נכנסים לעידן המסחרי של AI שבו הדגמים המרשימים האלה צריכים להרוויח את כוחם.
זה לא אומר שלא נראה דגמים חדשים. אלטמן כבר אמר ש-GPT-5 יהווה שיפור משמעותי ביחס ל-GPT-4 ושהוא ישבור את הבנק לפתח AI סופר-אינטליגנט.
האירוע הזה מרגיש יותר כמו מעבדת הבינה המלאכותית שנכנסת לתחום המסחרי ואומרת לעולם – אנחנו לוקחים את חטיבת המוצרים שלנו ברצינות לא פחות מהמחקר שלנו.