קול הוא העתיד של אינטראקציה בין אדם למחשב. אמרתי את זה כמה פעמים לאחרונה ולחברת הקול בינה מלאכותית ElevenLabs יש מוצר חדש שמדגיש עוד יותר את הכוח של שיחה בביצוע דברים.
מערכת ElevenLabs Conversational AI היא בוט קולי, הגדרה כדי להרגיש כאילו אתה מבצע שיחת טלפון ומקיים איתה שיחה זה בדיוק כמו להתקשר לאדם.
זה ניתן להתאמה אישית מלאה, ומאפשר לך לבחור, לעצב או אפילו לשכפל את הקול שבו הוא משתמש. אתה יכול גם להוסיף בסיס ידע משלך. לדוגמה, אם אתה עושה מורה למתמטיקה אתה יכול לכלול גישה למדריכי הכנה ל-SAT.
ההיבט השימושי ביותר הוא היכולת להגדיר את המוח הבסיסי, או מודל השפה. אתה יכול לבחור בין כל מודל OpenAI, Google או Anthropic או אפילו לכלול מודל מותאם אישית משלך אם אתה מנהל חברה.
איך עובד בינה מלאכותית של שיחה
בינה מלאכותית לשיחה כבר כאן. בנה סוכני בינה מלאכותית שיכולים לדבר תוך דקות עם חביון נמוך, יכולת תצורה מלאה ומדרגיות חלקה. pic.twitter.com/JqBlwVczdX3 בדצמבר 2024
בניגוד ל-ChatGPT Advanced Voice זה לא דיבור לדיבור מקורי. זה עובד כמו Gemini Live או MetaAI voice – אתה מדבר, זה הופך אותו לטקסט ושולח את זה ל-AI. ה-AI מגיב בטקסט ו-ElevenLabs משמיע אותו באמצעות מודלים קוליים קיימים. זה קורה כל כך מהר שזה יכול להיות גם דיבור לדיבור.
כדי לגרום לזה לעבוד, מהנדסי ElevenLabs היו צריכים ליצור מודל דיבור-לטקסט מותאם אישית חדש שיוכל לתמלל את מילות המשתמש מהר מספיק כדי שזה לא היה מורגש, ואז הוא היה צריך להבטיח שהכל עובד בצורה חלקה ביחד.
עם Conversational AI, ElevenLabs מתחרה ישירות בהיצע Realtime API של OpenAI. אלו הן מערכות מודל שנועדו להקל על חברה או ארגון להציע אינטראקציה מבוססת קול עם מוצרים. זה יכול להיות במוקד טלפוני שמבצע שיחות טלפון או משהו פחות ברור כמו מוצרי למידה.
הירשם עכשיו כדי לקבל את מבצעי הבלאק פריידי הטובים ביותר!
גלה את המבצעים החמים ביותר, בחירות המוצרים הטובות ביותר והחדשות הטכניות האחרונות מהמומחים שלנו ב-Datilin.
מקרה שימוש לדוגמה יכול להיות בצעצוע לילדים, שבו הדגם מאומן להציע תמיכה ומשוב בצורה מתאימה לגיל.
יצירת עוזר קולי
כל אחד עם חשבון ElevenLabs יכול ליצור סוכן שיחה. זה מגיע עם ארבע תבניות ברירת מחדל הניתנות להתאמה אישית מלאה.
אחד הוא סוכן תמיכה בשם אריק שנועד לפתור בעיות, אחר הוא מטילדה המדריכה למתמטיקה והשלישי הוא מדריך טיולים בשם ג'ורג' עם מידע על רוב המקומות ברחבי העולם. הרביעי הוא אשף משחקי וידאו עם קול מסתורי.
אתה יכול גם ליצור אותם מאפס וניסיתי את זה עם מאמן חיים שקיבל גישה לכלי אימון נפוצים כמו מעקב אחר הרגלים והגדרת יעדים. הוא משתמש בפלאש Gemini 1.5 מטעמי מהירות ומחיר.
ביצוע שיחה לסוכן עולה 500 קרדיטים לדקה במהלך הפיתוח. תוכנית ההתחלה מעניקה לך 30,000 זיכויים עבור $4 לחודש.
בסך הכל זהו תהליך פשוט להגדרה. ישנה גמישות רבה באופן שבו אתה בונה אותו והסוכנים שלך יופיעו בסרגל הצד של חשבון ElevenLabs שלך. אתה יכול גם לייבא מספרי טלפון של Twilio ולחבר אותו לעוזרת הקולית שלך.
בשביל הכיף, יצרתי סוכן תמיכת לקוחות בשם ריאן שמשתמש בשכפול של הקול שלי. אני הולך לראות אם אבא שלי שם לב כשאני נותן לו מספר טלפון ואומר לו שזה מספר העבודה החדש שלי ולהתקשר אם הוא צריך עזרה טכנית.