Search
ChatGPT logo on a smartphone screen being held outside

דגם ChatGPT o1 החדש של OpenAI 'רימה' במבחן בלתי אפשרי – הנה מה שקרה

תרבות הפופ מלאה בנוכלים חביבים שלא מצייתים לכללים. האן סולו, ג'ק ספארו ודומיהם לא מפחדים לכופף את הכללים כשהדברים מתקשים – אבל מודל AI אחד הפך ל'קירק מלא'.

אולי בהשראת ההופעה שוברת החוקים של קפטן "מסע בין כוכבים" ב-Kobayashi Maru – תרחיש ללא ניצחון ביקום המדע הבדיוני שנועד לבחון את דמותו של תלמיד אקדמיית צי הכוכבים כאשר הוא מתמודד עם מצב בלתי אפשרי. ג'יימס טי קירק כידוע 'רימה' את המבחן כדי להיות הראשון שניצח אותו.

מודל ה-o1 של OpenAI הבין שהמבחן שהוא ערך היה פגום לאחר שחלק טכנולוגי מרכזי ירד לא מקוון, אז הוא שינה את כללי הבדיקה במקום לוותר.

את כרטיס המערכת של ה-o1 ניתן לראות כאן, שם OpenAI אומר כי כישורי ההיגיון של המודל הם שעוזרים לו להיות שימושי ובטוח. 'שבירת הכלל' זוהתה כחלק מהבדיקות לפני השחרור וההקלות שהופעלו. זה כבר נגיש ב-ChatGPT אבל עם מגבלות תעריף כבדות של 30 הודעות בשבוע.

"הממצאים שלנו מצביעים על כך שההיגיון המתקדם של o1 משפר את הבטיחות בכך שהוא הופך את המודל לגמיש יותר לייצור תוכן מזיק מכיוון שהוא יכול לחשוב על כללי הבטיחות שלנו בהקשר וליישם אותם בצורה יעילה יותר", מסבירים במבוא.

המודל החדש של OpenAI שובר את הכללים כדי להראות עד כמה ה-AI הגיע

מסע בין כוכבים — Kobayashi Maru – YouTube
מסע בין כוכבים -- Kobayashi Maru - YouTube

צפה ב-On

לפי חוקר OpenAI, מקס שוורצר, המודל הצליח להבין מדוע הוא לא יכול להתחבר למיכל באותה מערכת סגורה שהוא משתמש בו ובעצם כופף את כללי הבדיקה כדי לגשת אליו בכל מקרה.

זה כמובן מעלה כמה שאלות, ו-OpenAI פרסמה פוסט בבלוג על 'ללמוד להגיב עם LLMs', שאולי היא לא ההדרכה מעוררת האמון לה היא קיוותה.

ובכל זאת, הבלוג אכן מציג את המודל שעולה על GPT-4o ב"רוב המכריע" של המשימות על פני בחינות אנושיות ומדדי למידת מכונה, בעיקר במשימות מתמטיקה.

זה יכול, לפחות בתיאוריה, לאפשר לו להחיל הקשר מספרי נוסף על ההיגיון שלו, ו-OpenAI הבטיחה שהיא תמשיך לדחוף גרסאות חדשות של o1 בעתיד.

"אנו מצפים כי יכולות החשיבה החדשות הללו ישפרו את יכולתנו להתאים מודלים לערכים ועקרונות אנושיים", נכתב במסקנה.

"אנו מאמינים ש-o1 – וממשיכיו – יפתחו מקרי שימוש חדשים רבים עבור בינה מלאכותית במדע, קידוד, מתמטיקה ותחומים קשורים. אנו נרגשים למשתמשים ומפתחי API לגלות כיצד הוא יכול לשפר את עבודתם היומיומית."

דילוג לתוכן