עליבאבא משיקה דגמי נימוק AI משלה כדי להתמודד עם DeepSeek

14:03
, 29 אפריל 2025
, טכנולוגיה

שחקן אחר טוען למקום הראשון עבור AI. עליבאבא, אחת מחברות המסחר האלקטרוני הגדולות בעולם, הודיעה על השקת מודל ההנמקה האחרון שלה ב- AI, המכונה Qwen 3.

עליבאבא טוען כי דגמים אלה תואמים (ואפילו ביצועים טובים יותר) של דגמים מגוגל וגם מפתיחה במשימות נימוק.

קוואן עצמה אינה חדשה (כפי שמרמז השלושה בשם), אבל זו הפעם הראשונה שאליבאבא באמת ניסתה לאתגר את הכלבים המובילים, כמו גם לנקוט בצעדים הראשונים למשימות הנמקה מורכבות יותר.

מרבית הדגמים יהיו זמינים בקרוב להורדה תחת רישיון פתוח של חברות AI Dev מחבקות פנים או GitHub. יהיו כמה דגמים שנעים בפרמטרים שלהם, שעוברים בין 0.6 מיליארד ל 235 מיליארד.

מציג את Qwen3! אנו משחררים ומשקל פתוח QWEN3, דגמי השפה הגדולה האחרונה שלנו, כולל 2 דגמי MOE ו 6 דגמים צפופים, החל מ- 0.6B ל- 235B. מודל הדגל שלנו, QWEN3-235B-A22B, משיג תוצאות תחרותיות בהערכות מידה של קידוד, מתמטיקה, כללי … pic.twitter.com/jwzkjehwhc28 באפריל 2025

פרמטרים מתורגמים בערך ליכולתו של המודל לפתור בעיות במקרה זה. ככל שיותר פרמטרים, יכול יכולתו טובה יותר, אך גם היא נוקטת יותר וככל שהוא עולה יותר.

אמנם הם לא הודיעו על פרטים נוספים, אך סביר להניח שדגמים אלה יעשו בסופו של דבר לצ'אט בוט של קוואן.

הדגמים מציעים שני מצבים. במצב חשיבה, הדגם ייקח זמן, ויעבור צעד אחר צעד כדי להגיב עם התשובה הטובה ביותר. במצב שאינו חשיבה, המודל מספק תגובות מהירות לשאלות פשוטות יותר בהן המהירות חשובה יותר מעומק.

"גמישות זו מאפשרת למשתמשים לשלוט בכמה 'חשיבה' המודל מבצע על סמך המשימה העומדת בפניך. לדוגמה, ניתן לטפל בבעיות קשות יותר עם נימוקים מורחבים, בעוד שניתן לענות על אלה קלים יותר ישירות ללא דיחוי", אמר צוות קוואן בפוסט בבלוג.

"באופן חיוני, שילובם של שני מצבים אלה משפר מאוד את יכולתו של המודל ליישם בקרת תקציב יציבה ויעילה."

לצד Deepseek, עליבאבא הוא סימן לכך שסין מדביקה חברות AI אמריקאיות. DeepSeek כבר הופיעה באותה רמה, אם לא טובה יותר, כמו כמו צ'טגפט וגוגל במשימות הנמקה.

אם הטענות של עליבאבא נכונות, זו עוד קבוצה של דגמי הנמקה שיכולים להתאים לביצועים של צ'טגפט. מעניין, זה יהיה גם דגם חזק יותר וחכם יותר ממה ש- Deepseek יצר.

בדומה ל- Deepseek, נראה כי עליבאבא מנתק את השוק האמריקני, ומציע טכנולוגיית AI שהיא חזקה באותה מידה אך זולה יותר. עם זאת, זה מעלה שאלות של אתיקה וביטחון שכן כמה חברות AI הואשמו בחיתוך פינות.

מה חשוב בדגמים האלה?

חברות AI עוברות למערכת מעט חדשה עבור דגמי AI. במקור, הייתה רק גרסה אחת של מערכת AI, עכשיו יש מרובים. מערכות שונות אלה בנויות כדי לטפל במשימות שונות, ומאמצים מאמץ רב יותר למשימות מורכבות ושימוש בפחות אנרגיה לאתגרים קלים.

ל- CHATGPT, למשל, יש צ'טגפט 4O, שהוא המודל הכללי שלה עבור מרבית המשימות, אך גם 4O מיני, לבקשות פשוטות יומיומיות. נוסף על כך, יש לו מגוון של דגמי הנמקה.

דגמי הנמקה נועדו לקחת משימות מורכבות. זה הכל מקידוד לבקשות מרובות שלבים (מבקש ממנו לעשות כמה דברים ברציפות) והתמודדות עם פרויקטים של מחקר עמוק.

עם העדכון האחרון הזה של קוואן, עליבאבא שואפת לעשות את אותו הדבר, ומציעה מודל שיכול לבצע את המשימות היומיומיות הפשוטות, אך גם להשיג את החשיבה המסובכת שהופכת להיות צפויה מ- AI כיום.

idan

עליבאבא משיקה דגמי נימוק AI משלה כדי להתמודד עם DeepSeek

הירשם כדי לקבל את המיטב מהמדריך של טום ישירות לתיבת הדואר הנכנס שלך.

מה חשוב בדגמים האלה?