Search
ChatGPT Advanced Voice running on iPhone

ChatGPT Advanced Voice נמצא כעת ב-Mac וב-Windows – כיצד לקבל גישה

OpenAI מביאה סוף סוף את מצב הקול המתקדם לשולחן העבודה. זה יהיה זמין גם בגרסת Windows וגם ב-Mac של אפליקציית ChatGPT ופועל כמו הגרסא לנייד.

זה אומר שסוף סוף תוכל לנהל שיחה עם המחשב שלך. לא בצורה שבה אתה יכול לדבר עם סירי או אלכסה (וכן, שניהם הופעלו כפי שהכתבתי את העותק הזה), אלא שיחה מלאה כאילו אתה מדבר עם בן אדם אחר.

Advanced Voice הוא דיבור לדיבור מקורי. זה אומר שהבוט הקול של OpenAI יכול להבין כל מה שאתה אומר, איך אתה אומר את זה ואפילו את ההפוגות בין המילים שלך. הוא מגיב באופן טבעי באותה מידה, כולל הוספת טיקים קוליים כגון "אממ" וצלילי נשימה בין כל משפט.

עדיין אין לנו את ההבטחה המלאה שניתנה במהלך עדכון האביב של OpenAI של שיתוף מסך ווידאו חי עם ChatGPT, אבל זה מגיע בסופו של דבר וזה עדיין שדרוג משמעותי בדגמי קול אחרים.

כיצד עובד Voice Advanced על שולחן העבודה?

אתה ניגש לקול מתקדם באפליקציית שולחן העבודה באותו אופן שהיית עושה ב-iOS או אנדרואיד – לחץ על הסמל בסרגל הצ'אט. ברגע שתלחץ על הכפתור, הוא יפתח תצוגה חדשה עם אותו עיגול כחול מדורג שידוע לשמצה.

אתה יכול להמשיך לדבר עם ה-AI בזמן שאתה ממשיך במשימות אחרות. ולמרות שהוא לא יכול לראות מה אתה עושה, הוא יכול להגיב לתיאורים של המשימה או הביצועים שלך. אז לדוגמה, אם אתה משתמש בו בזמן שאתה משחק במיינקראפט, אתה יכול לתאר את הסצנה, וזה יכול להציע סוג בניין או בלוק לשימוש.

הבאת קול מתקדם לשולחן העבודה היא הצעד ההגיוני הבא עבור OpenAI ומגבש את ChatGPT כיותר מסתם גימיק, אלא פלטפורמת פרודוקטיביות מלאה. היכולת לנהל שיחה עם AI מאפשרת לך ליצור סיעור מוחות או לבצע משימות שאולי לא תוכל לעשות לבד.

בעתיד, תוכל גם לשתף את המסך שלך עם Advanced Voice כך שהוא יוכל לצפות במה שאתה עושה. ויום אחד, כשסוכני בינה מלאכותית ממריאים, אולי אפילו תוכל לגרום לזה להשתלט על המסך שלך ולדבר איתך על תהליך.

מה יבוא אחר כך?

קולות אופי עם קול GPT-4o – יוטיוב
קולות אופי עם קול GPT-4o - יוטיוב

צפה ב-On

בעוד Voice Advanced הוא כלי שימושי להפליא, מה שחזק יותר הוא ה-API הבסיסי בזמן אמת. זהו הקצה האחורי של Advanced Voice המשמש מפתחים לבניית גרסאות משלהם או לבנות אותן לתוך הכלים שלהם.

במהלך תדרוך אחרון שהיה לי עם צוות OpenAI, ראש הקישור של החברה למפתחים, Romain Huet, הראה את ההדגמה המרשימה הזו של מערכת השמש. אתה יכול להורות לקול לנוע בין כוכבי לכת, והוא היה מסוגל להציע תובנות על טבעו של כל אחד מהעולמות שבהם ביקרנו בזמן אמת ולענות על שאלות בסגנון שיחה.

בהדגמה אחרת, הוא השוויץ בשימוש בו כסוכן נסיעות וירטואלי כדי לעזור לך לא רק להזמין טיסה אלא למצוא את העסקה הטובה ביותר. אתה יכול לומר לו את הדרישות המפורשות שלך, והוא יכול לשאול שאלות או לעקוב אחר משוב על סמך מה שהיה זמין, במקום גישת העץ ההגיוני שאנו רואים משיחות אוטומטיות כרגע.

כל התכונות הללו יתחילו להופיע, לא רק באפליקציות של OpenAI אלא באפליקציות של מפתחים אחרים במהלך החודשים והשנים הקרובים. אני חושב שהקול יהפוך לדרך החדשה שבה כולנו מתקשרים עם המחשבים שלנו.

עכשיו אני רק צריך למצוא תוכנת הכתבה טובה יותר שלא דורשת ממני לבזבז שעות אחורה על כל מה שהקלדתי בקול שלי כדי לתקן את השגיאות המדהימות.

דילוג לתוכן