סקירת קלוד AI מאת נייג'ל פאוול שפורסמה ב-24 באוגוסט 24. קלוד 3.5 Sonnet הוא אחד מדגמי שפת הבינה המלאכותית המרשימים ביותר וקלוד הוא פלטפורמת צ'טבוט רבת עוצמה.

09:31
, 24 אוגוסט 2024
, טכנולוגיה

כמעט בוודאות נסתכל אחורה על שנת 2024 כתחילתו של עשור שמגדיר תקופה. הבינה המלאכותית מימשה סוף סוף הבטחות מוקדמות והגיעה ברצינות. בשום מקום זה לא היה ברור יותר מאשר בקרב ה-LLMs, דגמי השפה הגדולים שנמצאים בלב המהפכה.

LLMs אלה הם הכלים שבהם אנו משתמשים במחשבים, בטלפונים ובאינטרנט שלנו כדי לגשת לכוחה של AI. הם משמשים בדרך כלל לכל דבר, החל מקידוד אתרים חדשים ועד לכתיבת מיילים, מצגות ועוד הרבה הרבה יותר. הקלד או דבר שאלה והם עונים עם מה שאתה צריך. זה כמו חיפוש באינטרנט על סטרואידים.

בין אם אתה מאמין בינה מלאכותית או סקפטי, אי אפשר להכחיש את השינויים העצומים שמתרחשים ברחבי העולם כאשר אנשים ועסקים פורסים את הכלים הללו כדי לעזור להתמודד עם משימות אישיות ועסקיות ברצינות.

שניים מהגיבורים הראשיים בחזית הם OpenAI עם דגם ה-ChatGPT שלה, ואנתרופיק עם קלוד. מבין השניים, ההפתעה הגדולה ביותר הייתה כמה מהר קלוד השתפר בחייו הקצרים. Anthropic נוסדה בשנת 2021 על ידי בכירים לשעבר של OpenAI והאחים דריו ודניאלה אמודיי, כדי לספק אלטרנטיבה של 'חברה לתועלת הציבור' לחברות ה-AI המבוססות באותה תקופה.

החברה השיקה את קלוד LLM בשנת 2023, שנחשב כמודל 'בטוח ואמין' שיתמקד בהימנעות מסכנות בינה מלאכותית. למרות קבלת הבטחות השקעה של למעלה מ-6 מיליארד דולר מגוגל ואמזון, הדגם הראשון של החברה, קלוד, שוחרר לקבלת פנים פושרת של הציבור. הרגישו שהוא מגביל מכדי שיהיה שימוש כללי מעשי.

עם זאת, השחרור של קלוד 3.5 Sonnet ביוני 2024 באמת הצית את עולם הבינה המלאכותית, עם השימושיות והרבגוניות המדהימות שלו במגוון רחב של שימושים. פתאום OpenAI נתקלת ביריב רציני, שאנשים רבים מרגישים שהוא עדיפה על ChatGP, במיוחד מבחינת תכנות ומשימות מחשבתיות כלליות.

כל זה הופך אותו לראוי לביקורת כאחד מדגמי השפה הגדולים המובילים בעולם.

סקירת קלוד: רושם ראשוני

ההרשמה לחשבון אנתרופי היא פשוטה ב- Claude.ai. לאחר שנכנסת באמצעות דואר אלקטרוני או חשבון Google תוכל להתחיל להשתמש בתיבת ההנחיות באופן מיידי. חשבון ברירת המחדל החינמי מגיע עם מגבלה קפדנית של 5 בקשות לדקה ו-300K אסימונים ליום. זה נשמע כמו הרבה, אבל קל מאוד לנצל את המגבלות האלה אם אתה באמת מתחיל לחזור על פרויקט.

בעיקרון אם אתה רוצה לעשות משהו יותר מאשר עבודת טקסט פשוטה, כמו סיכומים או תרגום, אז עדיף לך לשדרג לתוכנית המקצוענית ב-$20 לחודש. ברמה זו אתה זכאי ל-4000 בקשות לדקה על בסיס תשלום לפי שיטת העבודה.

אפשרות טובה נוספת היא להשתמש באפליקציית צד שלישי וב-Cloud API, שנראה שלא סובלים ממגבלות תעריפים ברורות. אני משתמש באופן קבוע ב-API עם TypingMind.com, על בסיס אסימון PAYG וזה נהדר. הבעיה היחידה היא שכרגע למשתמשי API אין גישה לתכונת Artifacts של קלוד, אבל אני מקווה שזה יגיע בקרוב.

סקירת קלוד: בשימוש

דבר אחד שחשוב לציין הוא שהיקום של קלוד מחולק לשני חלקים. Claude chat (Claude.ai) הוא הצ'אט-בוט הפונה לציבור שרוב האנשים ישתמשו בו. עם זאת מפתחים יכולים להירשם גם לגרסת ה-Console, המציעה ניהול מהיר והנדסה מעמיקים יותר, אך ללא תכונת Artifacts המגניבה מאוד. אתה יכול להירשם לשניהם עם אותו דוא"ל, אבל הם נשארים נפרדים למטרות שימוש וחיוב, וזה קצת מבלבל.

ניסיתי מספר בדיקות באמצעות צ'אט סטנדרטי ו-Artifacts עבור סקירה זו. Artifacts היא תכונה חדשה לגמרי שמוסיפה חלון WYSIWYG לצד חלון ההנחיה, כך שתוכל לראות מה הקוד שנוצר יוצר. זו דרך נפלאה לראות את היצירה שלך מתעוררת לחיים מול העיניים שלך. הקוד שמאחורי התוצאות נמצא גם במרחק לחיצה או הורדה בלבד, מה שמאפשר לחזור על הרעיונות שלך ולבדוק אותם עד שהם בסופו של דבר נוצרים בצורה מושלמת ומוכנים לשימוש.

טיפ מהיר: התכונה Artifacts אינה מופעלת כברירת מחדל. תצטרך ללחוץ על שם החשבון שלך, בצד שמאל למטה במסך הבית של קלוד, ולהפעיל אותו ידנית באמצעות אפשרות התפריט תצוגה מקדימה של תכונה.

מצב הצ'אט עבד טוב מאוד, מהיר ומדויק למשימות פשוטות, אבל כן נטה להיאבק בדרישות מורכבות יותר. תכונה נהדרת אחת שעלי להזכיר היא שאם צצה שגיאה בזמן חזרת הרעיון שלך, פשוט העתק הדבק אותה בתיבת הצ'אט של קלוד וה-AI בדרך כלל יתקן את הבעיה באופן מיידי. וזה מאוד מגניב.

לדוגמה, לקח רק כמה שניות ליצור אפליקציית אינטרנט לניתוח הערות של YouTube באמצעות ה-API של YouTube. למעשה לקח יותר זמן ליצור את ה-API של YouTube מאשר ליצור את האפליקציה, ושתי האיטרציות שהשתמשתי בהן כדי ללטש את התוצאות היו גם ללא מאמץ.

אולם כאשר ניסיתי ליצור אפליקציית מתכונים אינטראקטיבית מורכבת יותר, לקחת נתונים מקובץ PDF שהועלה, הדברים התחילו להסתבך. אבל ידעתי בדיוק מה הבעיה. נגמר לי חלון ההקשר בגלל הדרישות המיידיות המורחבות שהעליתי.

יכולתי להפעיל גרסה פשוטה של האפליקציה תוך דקות, אבל ברגע שניסיתי לעשות קצת חידוד על ידי הוספת עוד אינטראקטיביות, נגמר לנו שטח ההקשר וקלוד התחיל לעשות שטויות. זה חבל כי זה היה ממש טוב עד לאותה נקודה. אני מניח שעם קצת יותר זמן, ואופטימיזציה מהירה יותר טובה, יכולתי להימנע מהבעיה לחלוטין.

אם הייתי קודן של עבודה בעולם האמיתי, הייתי יכול להמשיך ולסיים ידנית, אבל בתור חובב חובב נלהב לא היה לי סיכוי. אבל ברור לחלוטין שלא יעבור זמן רב עד שה-LLMs הללו יוציאו משחקים ואפליקציות לפי דרישה לכולם עם דופק וקצת חשק.

רציתי גם לבחון את אפליקציית ה-Console, מכיוון שהיא אחד ממאפייני המוצרים שהושקו לאחרונה שקלוד גאה בהם. תכונה שימושית מאוד של Console היא Workbench, שבו אתה יכול לבדוק, להעריך ולשפר את ההנחיות שלך לפני השימוש בהן בפעולה. בפועל, ה-Workbench מתגלה כחוסך עצום בזמן וכסף. על ידי בדיקת שילובים שונים של ההנחיות המוצעות שלך לפני שאתה מתחייב לבזבז עליהן זיכויים, אתה זוכה לראות תוצאות בפועל והאם המודל מגיב היטב לבקשתך.

שתי התכונות הבולטות של ה-Workbench הן היכולת לבצע בדיקה מעמיקה זו, מרובת רמות, וספריית ההנחיות המוכנות שיכולות לקצר את כל תהליך הייצור. עם זאת, המטרה האמיתית של Console היא בבירור לעזור לחברות להפעיל צוותים כדי לשלוט בפיתוח ה-AI שלהן. ישנן תכונות שמקלות להזמין ולשתף עם שותפי עריכה, כמו גם להקצות מפתחות API וגישה לתיעוד עזר.

OpenAI מציעה חוויה דומה עם Playground שלה, הכוללת יותר פונקציונליות כמו כוונון עדין ועוזר יוצר. עם זאת, אני לא בטוח שזה הרבה יותר שימושי עבור הצרכים של רוב האנשים. כוונון עדין, למשל, הוא לעתים קרובות מוצא אחרון מכיוון שהנדסה מיידית טובה יותר ושיחות פונקציה יכולות בדרך כלל לפתור הרבה בעיות השלמה מראש. זה גם לא כל כך קל להרכיב, לנקות ולארגן מערכי נתונים רלוונטיים, אשר בתורו עלולים לפגוע ביעילות של כוונון עדין מההתחלה.

בכל מקרה, הפונקציונליות של Anthropic Workbench ומרכז החשבון היא עדות למחויבות החברה לשוק הארגוני. זה עושה את ההבדל בין ספקי LLM שפשוט מספקים מוצר בסיסי, לבין אלה שמתמקדים באספקת אקולוגית בינה מלאכותית בעלת ערך עבור הלקוחות שלהם. העובדה שאתה יכול לתפוס קוד הנחיה, לעקוב אחר גרסאות ולשנות כל דבר מהגדרות מודל למשתנים והנחיית המערכת, הופכת את זה למקום בוגר ראוי לבצע עבודה אמיתית. Anthropic עשתה טוב לבנות את הצד הזה של היצע המוצרים שלה.

סקירת קלוד: שורה תחתונה

זה ימים מוקדמים ביותר עבור AI, צ'אטבוטים ו-LLMs, אז כל סקירה צריכה להיקרא עם אזהרה זו. אנו רואים את הצילומים הראשונים של מהפכה טכנולוגית אמיתית, ואסור לנו לצפות לניסים מהיום הראשון. עם זאת, העבודה שעשתה אנתרופיק במהלך החודשים האחרונים כדי להפוך את המוצרים שלהם – במיוחד קלוד 3.5 Sonnet – לתחרותיים בשוק היא מדהימה. הדגם האחרון הזה הזניק את החברה להוביל בתחומים רבים, לא פחות מזה של תכנות טייסי משנה.

זה לא אומר שדגמים אחרים אינם שווים או עדיפים בחללי יישומים שונים, אבל כשזה מגיע לזה, נראה שאנשים פשוט מעדיפים את האיכות המאופקת של חווית קלוד. מנקודת מבט אישית, 3.5 Sonnet הוא כעת הדגם היומי המועדף עליי, מה שמשקף עד כמה ההצעות האחרונות של OpenAI היו חסרות ברק. אין לי ספק בכלל שהמירוץ רק התחיל, ובקרוב מאוד נראה תוצאות יוצאות דופן שיגיעו מחברות בינה מלאכותית ברחבי העולם. אבל עד אז, אני שמח ליהנות מקטע הפרוזה האמריקאי המרשים הזה.

idan