Search
ChatGPT Image

GPT-5.4 כבר כאן – ו-OpenAI פשוט גרם לכל דגם AI אחר להיראות איטי


TL;DR

  • OpenAI השיקה רשמית את GPT-5.4, מודל גבול חדש המאחד את מיטב יכולות ההיגיון, הקידוד והסוכנים שלו בחבילה אחת
  • מהיר יותר מ-GPT-5.2, טוב באופן דרמטי במשימות מקצועיות בעולם האמיתי
  • מסוגל לשלוט במחשבים באופן מקורי

ל-OpenAI אין שבוע שקט. מתיקון עסקאות הפנטגון ועד לניהול נשורת יחסי הציבור מתמליל פנימי שדלף, נראה שהחברה מתמודדת עם הרבה מאחורי דלתיים סגורות.

עם זאת, למרות המהומה, OpenAI השיקה זה עתה את GPT-5.4, מודל החזית המסוגל והיעיל ביותר שלה עד כה, והוציאה אותו בו זמנית על פני ChatGPT, פלטפורמת Codex ו-API למפתחים שלה.

למשתמשים בתוכניות Plus, Team ו-Pro, הדגם החדש – הנקרא GPT-5.4 Thinking בתוך ChatGPT – מתחיל להופיע היום.

זה בקושי רענון מינורי. GPT-5.4 משלב את יכולות הקידוד המובחרות של GPT-5.3 Codex עם שיפור משמעותי בהיגיון, שימוש במחשב ויכולות עבודת ידע.

התוצאה היא מודל שנועד לעשות עבודה אמיתית, למעשה להפעיל תוכנה, לנתח גיליונות אלקטרוניים ולהפעיל זרימות עבודה של סוכנים ארוכי אופק עם אחיזת יד מינימלית.

מה מייחד את GPT-5.4?


צילום מסך של GPT-5.4

השינוי הגדול ביותר כאן הוא העלייה של השימוש במחשב מקומי. GPT-5.4 הוא הדגם הראשון לשימוש כללי של OpenAI שיכול להשתלט על מחשב – תוכנות לחיצה, הקלדה וניווט באמצעות צילומי מסך ופקודות עכבר/מקלדת, מבלי להסתמך על דגם מיוחד נפרד.

מפתחים יכולים כעת לבנות סוכנים שפועלים בפועל אתרים ואפליקציות, ולא רק ליצור עליהם טקסט.

ב-OSWorld-Verified – אמת המידה שמודד את יכולתו של מודל לנווט בסביבת שולחן עבודה אמיתית – GPT-5.4 מקבל ציונים של 75.0%, מה שלא רק הורס את הציון של GPT-5.2 של 47.3% אלא גם מתקדם מעבר לקו הבסיס האנושי הנמדד של 72.4%. במילים אחרות, המודל הזה כבר טוב יותר מהאדם הממוצע בניווט במחשב באמצעות צילומי מסך בלבד.

עבודה מקצועית: איפה זה באמת זורח


סופר מקליד על מקלדת

OpenAI אומר ש-GPT-5.4 תוכנן במיוחד כדי להיות טוב יותר בסוג העבודה שאנשי מקצוע אמיתיים עושים מדי יום: בניית מודלים פיננסיים, עריכת מצגות, ניסוח מסמכים משפטיים וניהול גיליונות אלקטרוניים מורכבים.

במדד פנימי של משימות מודלים של גיליונות אלקטרוניים המיועדים לאנליסטים זוטרים של בנקאות השקעות, GPT-5.4 קיבל ציון של 87.5% – עלייה מ-68.4% עבור GPT-5.2. זה שיפור עצום עבור כל מי שעושה אוטומציה של זרימות עבודה פיננסיות. באופן דומה, מעריכים אנושיים העדיפו את המצגות של GPT-5.4 על פני 68% מהזמן של GPT-5.2, תוך ציון מגוון ויזואלי חזק יותר ושימוש טוב יותר ביצירת תמונות.

ההזיות יורדות באופן משמעותי. לפי OpenAI, הסבירות שהטענות העובדתיות הפרטניות של GPT-5.4 יהיו שגויות ב-33% מאלו של GPT-5.2, והסבירות שהתגובות המלאות שלה יכילו שגיאות כלשהן ב-18% – שדרוג משמעותי עבור אנשי מקצוע המסתמכים על תפוקות מדויקות.

קידוד: מהיר יותר, חכם יותר, ויזואלי יותר


צילום מסך קידוד ב-ChatGPT

GPT-5.4 משמש כעת גם כמודל הקידוד הראשי של OpenAI – ומחליף את הצורך לבחור בין ChatGPT ו-Codex עבור רוב המשימות. הוא תואם או מתעלה על GPT-5.3-Codex ב-SWE-Bench Pro ובמקביל גם מהיר יותר, במיוחד בהגדרות נמוכות יותר של מאמץ חשיבה. בתוך הצ'אט, אתה יכול להתחיל בקידוד מבלי שתצטרך לבחור.

מצב מהיר חדש ב-Codex מספק שיפור מהירות של עד פי 1.5 בכל הדגמים הנתמכים. OpenAI גם מדגישה ש-GPT-5.4 טוב יותר במיוחד במשימות קידוד חזיתיות מורכבות, ומפיק תוצאות מלוטשות יותר מבחינה אסתטית ונכונות יותר מבחינה פונקציונלית.

תכונה ניסיונית חדשה – "מחזאית (אינטראקטיבית)" – מאפשרת ל-Codex לנפות באגים ויזואלית של אפליקציות אינטרנט ו-Electron בזמן אמת, ואפילו לבחון אפליקציות תוך כדי בנייתן תוך שימוש ביכולות השימוש המקוריות שלה במחשב.

למה שמשתמשים יומיומיים יכולים לצפות עם ChatGPT-5.4


אדם מקליד על מקלדת מחשב נייד

עבור משתמשי ChatGPT יומיומיים, השינוי הבולט ביותר הוא ש-GPT-5.4 Thinking מציג כעת תוכנית מראש לפני שהוא מתחיל לעבוד על משימות מורכבות. אתה יכול להתערב, להפנות מחדש או להתאים את התגובה באמצע מבלי להתחיל מחדש – תכונה שמבטיחה לחסוך זמן משמעותי במחקר מרובה שלבים או בפרויקטים יצירתיים.

המודל יכול גם לשמור על הקשר קוהרנטי על פני זרימות עבודה ארוכות הרבה יותר, טיפול בשיחות ממושכות והנחיות מורכבות מבלי לאבד את המעקב אחר צעדים קודמים. זה זמין כעת ב-chatgpt.com וב-Android, עם iOS בקרוב.

זמינות, שימוש בכלים וסוכנים


לוגו ChatGPT באייפון ביד אישית

משתמשי ChatGPT Plus, Team ו-Pro מקבלים GPT-5.4 Thinking החל מהיום. משתמשי תוכנית Enterprise ו-Edu יכולים לאפשר גישה מוקדמת דרך הגדרות הניהול. GPT-5.4 Pro בלעדי לתוכניות Pro ו-Enterprise. מפתחים יכולים לגשת גם ל-gpt-5.4 וגם ל-gpt-5.4-pro דרך ה-API באופן מיידי.

אולי הסיבה לכך שרמה זו מקבלת את התכונות תחילה היא ש-GPT-5.4 מציע שדרוג משמעותי עם חיפוש כלים: במקום לטעון את ההגדרה המלאה של כל כלי זמין להקשר מראש (שיכול לצרוב עשרות אלפי אסימונים לכל בקשה), הדגם מקבל רשימה קלה ומחפש כלים ספציפיים רק בעת הצורך.

בבדיקה של 250 משימות ממבחן MCP Atlas של Scale עם 36 שרתי MCP מופעלים, תצורת חיפוש הכלים הפחיתה את השימוש הכולל באסימונים ב-47% תוך שמירה על דיוק. עבור מפתחים הבונים מערכות סוכניות גדולות, זה מתורגם ישירות לעלויות נמוכות יותר וזמני תגובה מהירים יותר.

ברור ש-OpenAI נותנת מענה למפתחים ולמשתמשי כוח עם השקה זו.

מחשבות אחרונות

GPT-5.4 הוא מהדורה משמעותית לגיטימית. השימוש במחשב מקורי לבדו יעשה את זה ראוי לציון – אבל בשילוב עם ביצועי ידע מקצועי מהטובים בכיתה, חלון הקשר אסימון של 1M ושיפור דרמטי ביעילות הכלים, זה מייצג שינוי צעד משמעותי עבור כל מי שבונה או עובד לצד AI.

שורה תחתונה: זה הדגם לצפייה ב-2026.



חדשות גוגל


דילוג לתוכן