Search
קלוד הייקו 4.5 בדיוק הושק - וקידוד Vibe לעולם לא יהיה זהה

העמדתי את כישורי החשיבה החדשים של קלוד למבחן – והתוצאות הפתיעו אותי

קלוד של אנתרופיק הוא כבר לא הילד החדש והנוצץ בבלוק הבינה המלאכותית; עכשיו זה אחד מה-MVPs, ממש למעלה עם ChatGPT ו-Perplexity.

כל בוט מביא משהו אחר לשולחן העבודה: ChatGPT הוא היצירתי, נהדר לכתיבה ולסיעור מוחות; התמיהה פועלת כמו עוזר המחקר שלך, מחלצת מידע מגובה מקור בזמן אמת; וקלוד הוכתר בתור המתחשב, כמעט סוקרטי.

זה המודל שהכי טוב בפירוק רעיונות מורכבים והיגיון דרך בעיות מרובות שלבים. זה ידוע גם בתגובות הרגועות והבנויות שלו שמרגישות קצת יותר כמו לדבר עם אנליסט זהיר מאשר צ'אטבוט.

אז החלטתי להעמיד את הטענה במבחן. האם הסונט 4.5 של קלוד באמת יכול לחשוב על דרכו דרך ההנחיות שלי, או שזה פשוט נשמע משכנע תוך כדי?

קבלת החלטות טכנית


קלוד

הנחיה אחת: "אתה מייעץ לעסק קטן לבחור בין הגדרת שרתים מקומיים או שימוש בשירות ענן לאחסון נתונים.

נתח את שתי האפשרויות שלב אחר שלב – כולל עלויות, אבטחה, מדרגיות ותחזוקה – והמליץ ​​על הגישה הטובה ביותר עם הנמקה."

הנה מה שחשבתי שקלוד עשה טוב:

הוא סיפק מבנה שיטתי, לאחר שפירק את הבעיה לסעיפים ברורים: 'עלויות, אבטחה, מדרגיות, תחזוקה'. לאחר מכן הוא סיפק כותרות משנה, יתרונות/חסרונות ואפילו אומדן עלות ל-3 שנים.

ההנמקה שלב אחר שלב שלה הסבירה פשרות בין שרתים מקומיים לענן; ושקללו גורמים פיננסיים, תפעוליים וביטחוניים.


קלוד על מסך מחשב

גם קלוד המליץ ​​בנימוק, בכך שזה לא רק נתן תשובה; זה הסביר מדוע ענן בדרך כלל טוב יותר עבור רוב העסקים הקטנים.

הצעדים הבאים הניתנים לפעולה הציעו תוכנית פעולה עם שלבים קונקרטיים (חישוב צורכי אחסון, תוכניות פיילוט, הדרכת צוות).

מההנחיה הזו בלבד, ברור שקלוד יכול לאזן בין עומק לקריאה, ולמרות מתן פרטים רבים, עדיין היה קל לעקוב אחריו.

הוא לא רק נותן דעה, הוא מנתח, שוקל יתרונות וחסרונות ומסביר החלטות בצורה הגיונית.

פתרון תקלות רב-שלבי


קלוד

הנחיה שניים: "המחשב הנייד של המשתמש פועל באיטיות לאחר עדכון אחרון. עברו על תהליך אבחון מפורט – צעד אחר צעד – והסבר מה תבדקו תחילה, מדוע וכיצד תאשר את הסיבה לפני שתציע תיקונים."

במבט ראשון, התגובה הזו הייתה ארוכה מאוד. כשגללתי למטה לתחתית התוצאה, זה עדיין 'חשב'. וחלק מההמלצות מניחות אוריינות טכנית, שעבור המשתמש הממוצע עשויה לדרוש תרגום ו/או בקשה למעקב.

למרות שהוא לא מתנצל לגבי אורך המילה שלה, הוא הבטיח שכל מופע ינותח ביסודיות עבור משתמשי Windows ו-Mac. במסגרת גישת 9 השלבים (המאוד משוכללת) שלו, קלוד גם יצר עץ החלטות של תרחישים הכולל אבחון, רמת ביטחון ופתרון מומלץ, המדגים נימוקים ולא רק עצות כלליות.

למרות הפופולריות שלו, הוא העלה השערה לוגית של כל בעיה פוטנציאלית, קישר בין סיבות להשפעות וסיפקה פתרונות מעשיים, והדגים אפילו נימוק פרוצדורלי במלוא עוצמתו.

תכנון אירוע אסטרטגי


קלוד בטלפון עם לוגו אנתרופי ברקע

הנחיה שלוש: "ארגן כנס טכנולוגי בן שלושה ימים ל-500 משתתפים. תכנן מפגשים, מערך דוברים, לוגיסטיקה, תקציב ואמצעי מגירה. הסבר את הנימוקים שלך לתזמון, הקצאת משאבים ותעדוף פעילויות."

תגובתו של קלוד לתכנון אירועים מציגה שוב את החוזקות שלו בהיגיון מורכב ורב-שלבי. היא יצרה תוכנית ועידה טכנולוגית מובנית במלואה לשלושה ימים המכסה תזמון, בחירת דוברים, לוגיסטיקה, תקצוב ואפילו מקרים.

על הדרך, זה מצדיק החלטות. לדוגמה, תזמון תווים מרכזיים ב-AM כדי למשוך תשומת לב, הגבלת סדנאות ל-50 משתתפים לצורך מעורבות גבוהה יותר ותקצוב עבור דוברי גיבוי וכישלונות (דבר שרוב האנשים לא מצליחים לקחת בחשבון). התוכנית אפילו כוללת שכבות תעדוף ואסטרטגיות לניהול סיכונים, תוך הפגנת ראיית הנולד.

אבל בעוד שכל האמור לעיל מראה היכן הוא זורח, רמת הפירוט, החל ממפגשים מדקה אחר דקה ועד לאחוזי תקציב מדויקים עלולה להיות שוב מעוררת יתר. זה מדגיש את ההחלפה בין יסודיות וקריאות.

עם זאת, בסך הכל, קלוד העביר תוכנית מקיפה, ניתנת לביצוע, העומדת בכישורי החשיבה המורכבים שלה.

קבלת החלטות סביבתית


קלוד

הנחיה ארבע: "עיר שוקלת ליישם איסור על פלסטיק חד-פעמי. לייעץ למועצת העיר על תוכנית מדיניות שלב אחר שלב, הכוללת מעורבות בעלי עניין, ניתוח השפעה כלכלית, אסטרטגיית תקשורת ציבורית, מנגנוני אכיפה והשלכות לא רצויות אפשריות. הסבירו את הנימוקים שלכם לכל המלצה".

תגובתו של קלוד להנחיית איסור הפלסטיק נראית פחות כמו פלט של צ'טבוט, ויותר כמו נייר מדיניות מלא.

הוא ניגש לבעיה כמו יועץ, ממפה באופן שיטתי את מחזיקי העניין, מתקצב השפעות אקולוגיות, ואפילו צופה מקרים כמו בעיות נגישות ופרצות.

במונחים של מבנה, זה מקיף מאוד, עם דוגמאות מנומקות בבירור מהעולם האמיתי, תוך ציון סן פרנסיסקו, סיאטל, טורונטו וכמה ערים אירופיות כדי לבסס את ההיגיון שלו בפועל מוכח (לפי התמונה למעלה).

עם זאת, הוא מתנודד לפעמים בהנדסה יתרה, בהתחשב ברמת הפירוט הפרוצדורלי והפיננסי. זה מספיק כדי להציף משתמש מזדמן שרק מחפש סיכום.

ובכל זאת, בשיקולי מדיניות מורכבים, זהו קלוד במיטבו: מובנה, מצפה ומודע להקשר, מספק ניתוח שמרגיש מוכן לתדרוך מועצת העיר.

שורה תחתונה

בסך הכל, קלוד הראה עומק מרשים והיגיון מובנה בכל ההנחיות; למרות שהנטייה שלו להסבר יתר האטה לפעמים את העברת התובנות המרכזיות.

זה כמעט מרגיש כאילו קלוד לובש מונוקל בכל פעם שהוא נותן תשובה, ואתה לא רוצה להפריע לו.



חדשות גוגל


דילוג לתוכן