OpenAI עומדת להשיק 'סוכנים' בשנה הבאה. אלו הם מודלים עצמאיים של בינה מלאכותית המסוגלים לבצע מגוון משימות ללא קלט אנושי ויכולים להיות זמינים ב-ChatGPT בקרוב.
במהלך אירוע ה-Dev Day הראשון שלה בסן פרנסיסקו, המנכ"ל סם אלטמן אמר ש"2025 היא כאשר הסוכנים יעבדו", והחברה הדגימה דוגמה מוקדמת ליכולות הפוטנציאליות של סוכנים בכך שהעוזרת הקולית תתקשר והזמינה תותים בעצמה. .
החברה אומרת שיש חמישה שלבים לבינה כללית מלאכותית (AGI) וכרגע אנחנו בשלב השני, שבו בינה מלאכותית יכולה לחשוב דרך רעיון לפני שמגיבים. סוכנים הוא שלב שלישי ופירושו שה-AI חכם מספיק כדי לחשוב דרך רעיון וכחלק מהתכנון התגובה שלו יכולה לצאת ולבצע פעולות באופן עצמאי.
אלטמן הכריז בעבר כי הכוח של משפחת הדוגמניות o1 אומר שהם יכולים להתחיל לעזור בבניית הדגמים בדרגת סוכן ואנו אמורים לראות את הראשון מהם מופיע בקרוב. האתגר הגדול יותר, והפוטנציאל לעיכוב, יהיה להבטיח שהם יהיו מתאימים לערכים האנושיים ולא יכולים "להיות נוכלים", בביצוע פעולות שאינן מועילות לאנושות.
מה הטעם של סוכני AI?
OpenAI Realtime API מבצע קריאה להזמין תותים ב-Dev Day, וזה מדהים… אבל זמן האחזור של התגובה הוא ~2 שניות (הקדמה היא <400ms) והקול לא מרגיש טוב כמו "מצב קול מתקדם", זה עדיין נטול רגשות. (מאת @swyx) pic.twitter.com/4S3MOMiMZ61 באוקטובר 2024
בניית סוכנים שימושיים ופונקציונליים היא משהו שכל מעבדת בינה מלאכותית פועלת לקראתו. לדוגמה, זה יאפשר ל-AI לא רק לכתוב ספר אלא גם להתחיל ולחשוב איך לפרסם בעצמו, כולל הרשמה לחשבון עם אמזון כדי לשתף אותו ב-Kindle Direct.
סוכנים הם צעד הכרחי בדרך ל-AGI מכיוון שהיא תצטרך להיות מסוגלת לבצע משימות שהיא מרגישה נחוצות כדי להשיג את מטרתה. אלטמן אמר במהלך Dev Day כי "אם נוכל ליצור מערכת AI טובה יותר במחקר בינה מלאכותית מאשר OpenAI, אז זה מרגיש כמו אבן דרך אמיתית".
הגעה לשלב זה כרוכה בבנייה מתמדת על דורות קודמים של AI. אלטמן אמר שהמודלים של o1 יהיו מה שיגרום לסוכנים לקרות בפועל וכשאנשים יתחילו להשתמש בסוכנים זה "יהיה עניין גדול", והוסיף כי "אנשים יבקשו מסוכן לעשות משהו שהיה לוקח להם חודש, ו זה ייקח שעה."
הירשם כדי לקבל את המדריך הטוב ביותר של טום ישירות לתיבת הדואר הנכנס שלך.
כאן ב-Datilin העורכים המומחים שלנו מחויבים להביא לך את החדשות, הביקורות והמדריכים הטובים ביותר שיעזרו לך להישאר מעודכן ולהקדים את העקומה!
הוא צופה שלאנשים עשוי להיות סוכן אחד שיבצע משימות ספציפיות, וסוכן אחר בתפקידים שונים עד שהם יגדלו ל-10 או 100 סוכנים שיכולים להשתלט על היבטים שונים של מטלות יומיומיות. כבר ראינו אלמנט מסוים של איך זה עשוי להתבטא בצפייה בהיגיון של o1 באמצעות רעיונות והצעות.
יישור הוא החוסם הגדול ביותר לסוכנים
היום ב-DevDay SF, אנו משיקים חבורה של יכולות חדשות לפלטפורמת OpenAI: pic.twitter.com/y4cqDGugju1 באוקטובר 2024
עם כל דגם חדש ששוחרר על ידי OpenAI הם מעבירים אותו לתהליך בדיקת בטיחות קפדני, ומדרגים אותו על פי סדרת קריטריונים שקובעים אם הוא בטוח לשחררו. זה גרם לעיכובים בעבר והצריך הצבת מעקות בטיחות על דגמים כדי למנוע פעולות מסוימות.
אחת הדוגמאות המובהקות לכך היא בדגם GPT-4o, שמסוגל לייצר תמונות באופן מקורי, להפיק מוזיקה ואפילו לחקות קולות, אבל כל התכונות הללו חסומות על ידי מעקות בטיחות. אתה יודע שזה יכול לעשות את זה כי לפעמים מעקות הבטיחות נשברים.
פריצת מעקה בטיחות תהיה בעיה גדולה יותר במקרה של סוכנים שכן ייתכן שתהיה להם גישה לחשבון הבנק שלך, היכולת להיכנס לאינטרנט ולבצע משימות או אפילו לשכור מישהו ב-Fiver שיבצע את המשימה עבורם, תוך שימוש במצב קולי כדי לתת הוראות .
בדוגמה של Dev Day ראינו בוט קולי מתקשר למוכר (בגילומו של חוקר), מזמין 400 תותים מצופים בשוקולד, נותן כתובת ספציפית ואומר שהוא ישלם במזומן. הוא הכריז על מעמדו כעוזרת בינה מלאכותית, אבל לפעמים היית מתקשה לומר שזה בינה מלאכותית.
בשיחה עם ה-FT, קצין המוצר הראשי של OpenAI, קווין וייל, אמר: "אנחנו רוצים לאפשר אינטראקציה עם AI בכל הדרכים שבהן אתה מקיים אינטראקציה עם בן אדם אחר", והוסיף כי המערכות האגניות יגיעו למיינסטרים בשנה הבאה. להפוך את המטרה הזו לאפשרית.
וייל אומר שמעקה בטיחות אחד במערכות סוכנים יהיה לדרוש ממנו להכריז תמיד על עצמו כ-AI, אם כי אם אי פעם שמעתם את Advanced Voice beatbox או ראיתם את GPT-4o מייצר גרפיקה וקטורית מושלמת, תדע שההגבלות האלה לא תמיד מוּשׁלָם.
אני אישית מצפה לבואם של סוכנים. אני אוהב לקוד וסוכנים יאפשרו לי ליישם את זה מהר יותר, תוך השתלטות על כמה משלבי הבדיקה המשעממים. זה גם יאפשר לי סוף סוף לעבור על חלק מרבע מיליון האימיילים שלא נקראו. אם Skynet הוא המחיר שאני צריך לשלם כדי להגיע לאפס תיבת הדואר הנכנס – הכנס את ה-Terminators.