OpenAI אישרה כי היא לא תשיק תכונות קוליות מתקדמות ב-ChatGPT עד מאוחר יותר השנה, אך המשיכה לספק תובנות לגבי מה אנו יכולים לצפות. האחרון מציג את היכולות הלשוניות המרשימות של GPT-4o, מלמד את המשתמשים פורטוגזית.
GPT-4o נחשף בעדכון האביב של OpenAI מוקדם יותר השנה ואיתו יכולות הקול המתקדמות המרשימות. הם גם חשפו כמה תכונות חזון ושיתוף מסך שכעת אנו יודעים שיגיעו רק מאוחר יותר בשנה או אולי אפילו בתחילת השנה הבאה
אחת מנקודות המכירה הגדולות שנכללו בהדגמה המקורית הזו הייתה היכולת של GPT-4o לפעול כמכשיר תרגום חי, אבל מה שאנחנו מתחילים לראות מכמה מהדגמות החדשות הוא שהוא יכול להיות גם מורה מדהים לשפה. זה משהו שחוויתי בעצמי במידה פחותה עם דגם הקול הנוכחי.
בסרטון חדש של OpenAI, דובר אנגלית שפת אם מנסה ללמוד פורטוגזית ודובר ספרדית עם הבנה בסיסית של השפה השתמשו ב-ChatGPT כדי לעזור להם לשפר את כישוריהם. בנקודות שונות הם מבקשים ממנו להאט או להסביר מונחים – וזה עושה את זה בצורה מושלמת.
לימוד שפות עם GPT-4o
מה שהופך את הקול המתקדם החדש של ChatGPT-4o למרגש כל כך הוא העובדה שהוא דיבור לדיבור. בניגוד לדגמים קודמים שצריכים להמיר תחילה את הדיבור לטקסט ולעשות את אותו הדבר הפוך עבור התגובה, זה פשוט מבין את מה שאתה אומר באופן טבעי.
היכולת להבין דיבור ואודיו באופן מקורי מאפשרת כמה תכונות מרגשות, כולל עבודה על פני שפות מרובות, הוספת מבטאים שונים או שינוי מהירות הטון והחיוניות של הקול, מה שהופך אותו למעשה למורה המושלם
יכולות הדיבור המקוריות שלו מעניקות לו את היכולת להקשיב למה שאתה אומר לנתח את הדרך שבה אמרת מילים מסוימות ואפילו את המבטא שלך. לאחר מכן הוא יכול להציע משוב ישיר על סמך מה שהוא נשמע במקום להעריך תמליל.
הירשם כדי לקבל את המדריך הטוב ביותר של טום ישירות לתיבת הדואר הנכנס שלך.
שדרג את חייך עם מנה יומית של החדשות הטכנולוגיות הגדולות ביותר, פריצות לסגנון חיים וניתוח שנקבע שלנו. היה הראשון לדעת על גאדג'טים חדישים ועל המבצעים החמים ביותר.
בנוסף לכל זה, ל-GPT-4o יש גם יכולות חשיבה ופתרון בעיות מרשימות, כך שהוא יכול אפילו לזהות היכן אתה עושה טעות בדרכים פחות ברורות.
מה עוד ראינו מ-GPT-4o?
הם הקניטו אותי 🥲 מ-r/ChatGPT
היו מספר הדגמות של תכונות הקול המתקדמות החדשות כולל כמה שלא נועדו לצאת. אחד מאלה מראה שהוא מסוגל ליצור אפקטים קוליים תוך כדי שהוא מספר לך סיפור ואחר מגלה שהוא מסוגל להשתמש במספר קולות שונים.
בסרטונים הרשמיים ששיתף OpenAI ב-YouTube, ראינו אותו משמש כמורה למתמטיקה. בסרטון הוא עובד על אייפד שבו המסך משותף וה-AI מציג עצות ומידע על כל היבט של בעיה במתמטיקה.
מצב קול מתקדם ובמיוחד היכולת להבין דיבור באופן מקורי מרגיש כמו אחת הקפיצות המשמעותיות ביותר בבינה מלאכותית מאז ש-OpenAI הציבה ממשק צ'אט בדגם GPT-3 שלה עוד בנובמבר 2022.