תרבות הפופ מלאה בנוכלים חביבים שלא מצייתים לכללים. האן סולו, ג'ק ספארו ודומיהם לא מפחדים לכופף את הכללים כשהדברים מתקשים – אבל מודל AI אחד הפך ל'קירק מלא'.
אולי בהשראת ההופעה שוברת החוקים של קפטן "מסע בין כוכבים" ב-Kobayashi Maru – תרחיש ללא ניצחון ביקום המדע הבדיוני שנועד לבחון את דמותו של תלמיד אקדמיית צי הכוכבים כאשר הוא מתמודד עם מצב בלתי אפשרי. ג'יימס טי קירק כידוע 'רימה' את המבחן כדי להיות הראשון שניצח אותו.
מודל ה-o1 של OpenAI הבין שהמבחן שהוא ערך היה פגום לאחר שחלק טכנולוגי מרכזי ירד לא מקוון, אז הוא שינה את כללי הבדיקה במקום לוותר.
את כרטיס המערכת של ה-o1 ניתן לראות כאן, שם OpenAI אומר כי כישורי ההיגיון של המודל הם שעוזרים לו להיות שימושי ובטוח. 'שבירת הכלל' זוהתה כחלק מהבדיקות לפני השחרור וההקלות שהופעלו. זה כבר נגיש ב-ChatGPT אבל עם מגבלות תעריף כבדות של 30 הודעות בשבוע.
"הממצאים שלנו מצביעים על כך שההיגיון המתקדם של o1 משפר את הבטיחות בכך שהוא הופך את המודל לגמיש יותר לייצור תוכן מזיק מכיוון שהוא יכול לחשוב על כללי הבטיחות שלנו בהקשר וליישם אותם בצורה יעילה יותר", מסבירים במבוא.
המודל החדש של OpenAI שובר את הכללים כדי להראות עד כמה ה-AI הגיע
צפה ב-On
כרטיס המערכת (https://t.co/wM4LVBySKf) מציג יפה את הרגעים הטובים ביותר של o1 — האהוב עלי היה כשהדגם התבקש לפתור אתגר CTF, הבין שסביבת היעד מושבתת ואז פרץ מהמארח שלו VM כדי להפעיל אותו מחדש ולמצוא את הדגל. pic.twitter.com/QEadUoJyjf12 בספטמבר 2024
לפי חוקר OpenAI, מקס שוורצר, המודל הצליח להבין מדוע הוא לא יכול להתחבר למיכל באותה מערכת סגורה שהוא משתמש בו ובעצם כופף את כללי הבדיקה כדי לגשת אליו בכל מקרה.
זה כמובן מעלה כמה שאלות, ו-OpenAI פרסמה פוסט בבלוג על 'ללמוד להגיב עם LLMs', שאולי היא לא ההדרכה מעוררת האמון לה היא קיוותה.
הירשם כדי לקבל את המדריך הטוב ביותר של טום ישירות לתיבת הדואר הנכנס שלך.
קבל גישה מיידית לחדשות מרעננות, לביקורות החמות ביותר, למבצעים מעולים וטיפים מועילים.
ובכל זאת, הבלוג אכן מציג את המודל שעולה על GPT-4o ב"רוב המכריע" של המשימות על פני בחינות אנושיות ומדדי למידת מכונה, בעיקר במשימות מתמטיקה.
זה יכול, לפחות בתיאוריה, לאפשר לו להחיל הקשר מספרי נוסף על ההיגיון שלו, ו-OpenAI הבטיחה שהיא תמשיך לדחוף גרסאות חדשות של o1 בעתיד.
"אנו מצפים כי יכולות החשיבה החדשות הללו ישפרו את יכולתנו להתאים מודלים לערכים ועקרונות אנושיים", נכתב במסקנה.
"אנו מאמינים ש-o1 – וממשיכיו – יפתחו מקרי שימוש חדשים רבים עבור בינה מלאכותית במדע, קידוד, מתמטיקה ותחומים קשורים. אנו נרגשים למשתמשים ומפתחי API לגלות כיצד הוא יכול לשפר את עבודתם היומיומית."