Search
GPT-4o

OpenAI חולקת הדגמה קולית מתקדמת חדשה של GPT-4o – היא יכולה ללמד אותך שפה

OpenAI אישרה כי היא לא תשיק תכונות קוליות מתקדמות ב-ChatGPT עד מאוחר יותר השנה, אך המשיכה לספק תובנות לגבי מה אנו יכולים לצפות. האחרון מציג את היכולות הלשוניות המרשימות של GPT-4o, מלמד את המשתמשים פורטוגזית.

GPT-4o נחשף בעדכון האביב של OpenAI מוקדם יותר השנה ואיתו יכולות הקול המתקדמות המרשימות. הם גם חשפו כמה תכונות חזון ושיתוף מסך שכעת אנו יודעים שיגיעו רק מאוחר יותר בשנה או אולי אפילו בתחילת השנה הבאה

אחת מנקודות המכירה הגדולות שנכללו בהדגמה המקורית הזו הייתה היכולת של GPT-4o לפעול כמכשיר תרגום חי, אבל מה שאנחנו מתחילים לראות מכמה מהדגמות החדשות הוא שהוא יכול להיות גם מורה מדהים לשפה. זה משהו שחוויתי בעצמי במידה פחותה עם דגם הקול הנוכחי.

בסרטון חדש של OpenAI, דובר אנגלית שפת אם מנסה ללמוד פורטוגזית ודובר ספרדית עם הבנה בסיסית של השפה השתמשו ב-ChatGPT כדי לעזור להם לשפר את כישוריהם. בנקודות שונות הם מבקשים ממנו להאט או להסביר מונחים – וזה עושה את זה בצורה מושלמת.

לימוד שפות עם GPT-4o

מה שהופך את הקול המתקדם החדש של ChatGPT-4o למרגש כל כך הוא העובדה שהוא דיבור לדיבור. בניגוד לדגמים קודמים שצריכים להמיר תחילה את הדיבור לטקסט ולעשות את אותו הדבר הפוך עבור התגובה, זה פשוט מבין את מה שאתה אומר באופן טבעי.

היכולת להבין דיבור ואודיו באופן מקורי מאפשרת כמה תכונות מרגשות, כולל עבודה על פני שפות מרובות, הוספת מבטאים שונים או שינוי מהירות הטון והחיוניות של הקול, מה שהופך אותו למעשה למורה המושלם

יכולות הדיבור המקוריות שלו מעניקות לו את היכולת להקשיב למה שאתה אומר לנתח את הדרך שבה אמרת מילים מסוימות ואפילו את המבטא שלך. לאחר מכן הוא יכול להציע משוב ישיר על סמך מה שהוא נשמע במקום להעריך תמליל.

בנוסף לכל זה, ל-GPT-4o יש גם יכולות חשיבה ופתרון בעיות מרשימות, כך שהוא יכול אפילו לזהות היכן אתה עושה טעות בדרכים פחות ברורות.

מה עוד ראינו מ-GPT-4o?

הם הקניטו אותי 🥲 מ-r/ChatGPT

היו מספר הדגמות של תכונות הקול המתקדמות החדשות כולל כמה שלא נועדו לצאת. אחד מאלה מראה שהוא מסוגל ליצור אפקטים קוליים תוך כדי שהוא מספר לך סיפור ואחר מגלה שהוא מסוגל להשתמש במספר קולות שונים.

בסרטונים הרשמיים ששיתף OpenAI ב-YouTube, ראינו אותו משמש כמורה למתמטיקה. בסרטון הוא עובד על אייפד שבו המסך משותף וה-AI מציג עצות ומידע על כל היבט של בעיה במתמטיקה.

מצב קול מתקדם ובמיוחד היכולת להבין דיבור באופן מקורי מרגיש כמו אחת הקפיצות המשמעותיות ביותר בבינה מלאכותית מאז ש-OpenAI הציבה ממשק צ'אט בדגם GPT-3 שלה עוד בנובמבר 2022.

דילוג לתוכן