Search
alibaba image on mobile

עליבאבא מכריזה על Qwen 2.5-Max כדי להילחם ב- DeepSeek-מה לדעת

ימים לאחר ש- Deepseek לקחה את האינטרנט בסערה, חברת הטכנולוגיה הסינית אליבאבא הודיעה על קוון 2.5-מקס, האחרונה בסדרת LLM שלה. חשיפתו של סוכן קוד פתוח זה יכולה בקלות להיתפס כאתגר ישיר ליריבים דיפוק ומקומי. השחרור הוא ביום הראשון של השנה החדשה הירח, כאשר רוב הסינים פסקו פסק זמן כדי לחגוג ולבלות עם משפחותיהם. נראה כי עליבאבא שולח את ההודעה שהם קשה בעבודה בזמן שהתחרות שלהם לוקחת את יום החופש.

כפי שראינו, הופעתו של Deepseek לא הייתה פחות מפריעה והשחרור החדש של עליבאבא בטוח גם לגרום לערבוב. Deepseek הציגה את דגם ה- R1, המספק ביצועים הדומים לדגמים מובילים כמו ChatGPT של Openai אך בשבריר מעלות הפיתוח. ההשפעה של החידוש של Deepseek הייתה עמוקה, מה שהוביל לירידה משמעותית בשווי השוק של חברות טק גדולות, כולל ירידה של 593 מיליארד דולר עבור NVIDIA – הגדולה ביותר בהיסטוריה של שוק המניות בארה"ב.

האחרון מאליבאבא מגיע כאשר ענף ה- AI עדים לעלייה בתרומות קוד פתוח, ומאפשר לחוקרים ומפתחים ברחבי העולם לגשת ולבנות על הטכנולוגיה שלה. מהלך זה זכה לשבחים על קידום שקיפות ושיתוף פעולה בפיתוח AI. עם זאת, זה גם מכניס את כוחו של AI בחופשיות לידיו של כל אחד, מה שעלול להוביל לסוגיות בטיחות ופרטיות רבות.

מדרגיות וקוד פתוח

עם דגש על יכולת המדרגיות של המודל, Qwen 2.5 הוכשר מראש על למעלה מ 20 טריליון אסימונים ושופץ עוד יותר באמצעות למידת כוונון עדין ופיקוח על משוב אנושי. החברה הודיעה על זמינות ה- API של קוואן 2.5 באמצעות ענן עליבאבא, והזמינה מפתחים ועסקים לשלב את היכולות המתקדמות שלה ביישומים שלהם.

בדומה לגישתו של Deepseek, Qwen 2.5 של עליבאבא בנוי על ארכיטקטורת "תערובת המומחים" ומטרתה לא רק להתאים אלא לעלות על היכולות של ההצעות של Deepseek. תכנון זה מאפשר למודל לעסוק באופן סלקטיבי קבוצות משנה שונות של הפרמטרים שלו, לשפר את היעילות החישובית ולאפשר טיפול במשימות מורכבות יותר ללא עלייה פרופורציונאלית בצריכת המשאבים.

מה הלאה

קל לחשוב שעם עלייתם של ישויות אלה שמטרתן לפתח דגמים יעילים וחזקים יותר, אנו נמשיך לראות דגמי קוד פתוח יותר שנחשפים בקרוב. המוטבים האולטימטיביים יהיו ככל הנראה משתמשים שיחוו יישומי AI מתוחכמים יותר ויותר ללא מחסומי צ'אט בוטים אחרים בקטגוריה. עליבאבא ממקמת את עצמה בזהירות כשחקנית מפתח בדמוקרטיזציה של AI.

על ידי חיבוק ארכיטקטורות חדשניות ועקרונות קוד פתוח, עליבאבא מגיבה לאתגרים שמציבים סטארט-אפים זריזים כמו Deepseek ותרומה לקידום הרחב יותר של טכנולוגיית AI.

דילוג לתוכן