Search
Hume AI on an iPhone screen

בדיוק הייתה לי שיחה עם העוזרת הקולית הבינה המלאכותית החדשה של Hume – ושכחתי שזה לא אנושי

Hume EVI הוא עוזר קולי דיבור לדיבור בבינה מלאכותית, ועם העדכון האחרון של גרסה 2, הוא עשוי להיות טבעי ואינטואיטיבי יותר מהקול המתקדם GPT-4o של OpenAI.

פרי מוחו של מייסד-שותף של Hume, אלן קאון וצוותו, EVI 2 מתבסס על המודל של הדור הקודם עם קול טבעי יותר והבנה רגשית טובה יותר.

לדברי Hume: "EVI 2 יכול לשוחח במהירות עם משתמשים עם זמני תגובה מתחת לשנייה, להבין את גוון הקול של המשתמש, ליצור כל גוון קול ואפילו להגיב לכמה בקשות נישה נוספות כמו שינוי קצב הדיבור שלו או ראפ."

הבדיקה שלי מצאה את זה טבעי יותר מהקול המתקדם של OpenAI אבל מעט יותר איטי ועם פחות יכולות. לדוגמה, EVI יותר אמפתי בטון הקולי שלו, אבל ChatGPT טוב יותר בצחוק ובהעברת צלילים אחרים הקשורים לקול האנושי.

מהו Hume EVI 2?

EVI 2 הוא עוזר קול אמפתי, זמין כמו ChatGPT Voice או Gemini Live כאפליקציה ייעודית לסמארטפון, מקוונת או כמפתחי API שיכולים להשתמש בפרויקטים שלהם.

ה-EVI 2 של Hume בולט מהקהל בגלל הגמישות שלו. זהו דיבור לדיבור מקורי ויש לו מוח LLM משלו, אבל אתה יכול להחליף אותו עבור כל דגם אחר, כולל GPT-4o או Gemini. אתה יכול אפילו להשתמש ב-EVI כדי לתת קול לגרוק או ל-Llama 3.1 של Meta.

אנו בונים מערכות שיכולות להתאים את הקול למשתמש באופן אוטומטי כולל אימוץ המבטא הנכון, אישיות רגועה או רשמית יותר, כל מה שעובד כדי לעזור לך לעסוק ב-AI

דיברתי עם ד"ר Cowen לקראת שחרורו של EVI 2 והוא אמר שהמטרה היא "לתת למפתחים את הכלים לבנות את מה שהם רוצים", והסביר שהשחקנים האחרים בחלל בונים סביבם מערכות אקולוגיות. "אנחנו מתאמנים על גבי מודלים של קוד פתוח כדי לתת להם קול."

"המפתח יכול לקחת את המודל הזה, ולהשתמש באיזו מסגרת שהם רוצים, אנחנו גם מאפשרים אפנון קול וקולות אישיות", הוסיף. הוא גם אמר בעתיד, יכולה להיות גרסה קטנה של הדגם שיכולה לפעול על הקצה, על מחשב נייד או אפילו על רמקול חכם.

מחוץ ל-API ולכלי מפתחים, אפליקציית Hume AI היא חוויה מרשימה, המאפשרת לך לנהל שיחה, לעשות סיעור מוחות או אפילו להוציא משהו מהחזה שלך עם קול AI שנשמע טבעי שמזהה את הטון הקולי שלך ומגיב בהתאם.

בשביל הכיף היה לי גם EVI 2 לנהל שיחה עם ChatGPT Advanced Voice. זה משהו שניסיתי עם דגמי AI אחרים עם השפעה מוגבלת אבל כאן זה עבד טוב. הם התחילו לפטפט כמו חברים ותיקים שמדברים על מתכונים ותחביבים.

"אנחנו בונים מערכות שיכולות להתאים את הקול למשתמש באופן אוטומטי כולל אימוץ המבטא הנכון, אישיות רגועה יותר או רשמית יותר, כל מה שעובד כדי לעזור לך לעסוק ב-AI", אמר ד"ר Cowen ל-Datilin.

בנוסף לשימוש בקולות מוגדרים שפותחו על ידי Hume, EVI 2 יכול גם לשכפל קולות אך תכונה זו הוגבלה, כאשר משתמשים יכולים להגדיר מאפייני קול הקשורים לזהות כדי ליצור קול מותאם אישית עבור כל משתמש, מבלי לשכפל קול אמיתי ישירות.

"GPT-4o מתמקד ביכולות הנוצצות, אנו מתמקדים במה שהמפתח באמת צריך, כולל היכולת לווסת את הקול ללא שיבוט", אמר לי ד"ר Cowen במהלך ראיון לפני השקת הדגם החדש.

הגישה שלהם לפיתוח קול מבוססת הנחיות, שבה המשתמשים פשוט מקלידים איך שהם רוצים שהקול יישמע, וה-AI עושה את העולם. "המצאנו הנחיה קולית וזה יכול פשוט לעקוב אחר האישיות הזו", אמר. זה יכול גם ליצור שפות ומדגשים אחרים.

עד כמה עובד EVI 2?

ניסיתי את EVI ​​2 באתר Hume AI עם כמה קולות. מצאתי שהוא נשמע טבעי בצורה מרשימה ויכולתי להתאים את הקול שלו בהתאם לאופן שבו דיברתי.

הוא גם מספר סיפורים טוב, המסוגל להעביר את העומק הרגשי של דמות. הוא אמנם תואם או אפילו עולה על חיקוי הרגשות של ChatGPT Voice, אך חסרים לו תכונות אחרות כגון צלילי נשימה ורעשי אחיזה הנפוצים בקול אנושי. עם זאת, עדיין הוסחה דעתי במהלך שיחה, מספיק כדי לשכוח שזה לא היה אנושי.

בשביל הכיף, היה לי גם עם EVI 2 שיחה עם ChatGPT Advanced Voice. ניסיתי את זה עם דגמי AI אחרים עם השפעה מוגבלת, אבל זה עבד טוב כאן. הם התחילו לפטפט כמו חברים ותיקים, לדבר על מתכונים ותחביבים.

מה שהופך את EVI ​​2 לצעד חשוב הוא לא היכולות שלו; זוהי הגישה הרחבה יותר של החברה. בעוד שאתה עשוי להשתמש בקול מתקדם ב-ChatGPT או Gemini Live במכשיר אנדרואיד, EVI יכול להיות מובנה בכל תוכנה או מכשיר – כך שהוא יכול להיות בכל מקום.

היכולת שלו לעקוב אחר תגובות רגשיות באמצעות טון קולי עשויה להועיל גם בתחום הטיפול, ולתת לרובוטים רפואיים צורה ליד המיטה. או שהוא יכול לשמש כדי להחליף את הקול האוטומטי בשיחה ממתינה, שיכול להרגיע אותך ממצב כועס למרות שעדיין להיות מספר חמישה מיליון בתור. זה חייב להיות טוב יותר מהשקר: "השיחה שלך חשובה לנו."

דילוג לתוכן