Search
Artificial intelligence "AI" and brain glowing next to a smartphone screen

5 סיפורי AI הגדולים ביותר שאתה (כנראה) החמצת השבוע – תאומים עוקפים

השבוע התמלא בהפתעות של AI Anderdogs. מזל תאומים של גוגל הופך להיות המועדף על הציבור בזמן שגרוק הציג את Leaderboard Performance Performance. מודל AI רפואי חדש מסייע לרופאים לגלות למעלה מאלף מחלות, כולל סרטן.

בינתיים, CHATGPT סוף סוף עושה צעדים כדי להגביר את הבטיחות בקרב המשתמשים הצעירים ביותר שלה על ידי הפעלת מעקות למשתמשים מתחת לגיל 18. הנה החדשות הגדולות ביותר של AI שעליך לדעת השבוע.

מזל תאומים הוא החביב על הציבור בקרב 27 דגמי AI שונים


לוגו תאומים בסמארטפון עם הלוגו של גוגל מאחור

באחד הסקרים הציבוריים הגדולים מסוגו, יותר מ 21,000 משתתפים ברחבי ארה"ב ובריטניה דירגו 27 דגמי AI שונים – ו- Gemini 2.5 Pro של גוגל יצאו למעלה. המחקר, שנערך באמצעות מערכת דירוג הומאנה של Prolific, העריך מודלים בקטגוריות כמו סגנון תקשורת, הנמקה, אמון וחווית משתמש כוללת.

תאומים גברו על מתחרים כולל צ'טגט וקלוד ברוב קטגוריות המשנה, ומדגישות את המוניטין שלה כמודל ההנמקה המלוטש ביותר של גוגל עד כה. ChatGpt דירג את השמיני בסך הכל.

נקודות מפתח:

  • Gemini 2.5 Pro מדורגת מספר 1 בסקר ציבורי בן 27 מודלים ברחבי ארה"ב ובריטניה
  • 21,352 משתתפים מדמוגרפיה מרובה תרמה לתוצאות
  • קריטריוני הערכה: תקשורת, נזילות, נימוק, אמון וחווית משתמש כוללת
  • צ'טגפט במקום ה -8 בסך הכל; הגרסאות של קלוד מדורגות במקום ה -11 וה -12

Chatgpt יוצר תכונות ChatGpt לבני נוער


Openai

OpenAI סוף סוף מפעילה כללי בטיחות חדשים למשתמשי נוער. העדכונים כוללים מערכת חיזוי גיל לגילוי המשתמשים מתחת לגיל 18 ושגיאה בצד הזהירות על ידי יישום מעקות השמירה אם הגיל אינו ידוע. מסננים מחמירים יותר מובטחים בנושאים רגישים (תוכן מיני ופגיעה עצמית וכו ') בנוסף לבקרות הורים כמו שעות ההאפלה והיכולת לקשר חשבונות.

שינויים אלה הם התחלה, אך העלו שאלות קשות לגבי אופן הקביעה של הגיל, באיזו תדירות טעויות ישפיעו על האמון והאם בני נוער מרגישים בטוחים להיפתח אם הם חוששים שנמצאים במעקב או לשפוט אותם.

מה לדעת

  • כלל גילוי חדש: Openai ינתב את המשתמשים שהוא קובע שהם מתחת לגיל 18 לגרסה של ChatGpt עם כללי הבטיחות המחמירים.
  • מצב ברירת מחדל מתחת לגיל: אם לא ניתן לאשר את הגיל, המערכת טועה בצד הזהירות על ידי החלת מגבלות מתחת לגיל בכל מקרה.
  • בקרות הורים שהוצגו: הורים יכולים לקשר לחשבון העשרה שלהם, להשבית או להגביל את התכונות (כמו זיכרון או היסטוריה), להגדיר שעות בטוחות (שעות האפלה) ולהתריע אם ה- AI מגלה סימני מצוקה.
  • מגבלות שיחה לבני נוער: תוכן מיני גרפי, צ'אט פלרטטני, דיונים על פגיעה עצמית מוגבלים. במקרים קיצוניים, פגיעה קרובה, קשר אכיפת החוק הוא אפשרות אם ההורים אינם ניתנים להשגה.

אבני חן של Gemini בהתאמה אישית ניתנות לשיתוף כעת


מבוא אבני חן של Gemini

גוגל מרחיבה את טווח ההגעה של מזל תאומים, בכך שהיא נותנת למשתמשים את היכולת לשתף כעת את עוזריהם המותאמים אישית, אבני חן. למי שמכיר יותר את ChatGpt, אלה הם למעשה GPTs מותאמים אישית. לפני עכשיו, אבני חן של תאומים נכלאו בשימוש פרטי, אישי, אך כעת ניתן לשתף אותן בקלות כמו דוק של גוגל, נותנים לעמיתים לעבודה, לחברי כיתה וכל אחד אחר לשתף פעולה עם AI מותאם, מבלי לבנות אותו מאפס.

מהלך זה מדגיש את הדחיפה של גוגל להפוך את תאומים לפלטפורמה גמישה וידידותית למשתמש בהרבה.

מה לדעת:

  • אבני חן ניתנות להתאמה אישית עוזרי AI שאתה יכול לתכנן למשימות ספציפיות כמו קידוד, עריכה או סיעור מוחות.
  • שיתוף אבני חן עובד באותה מידה היה כמו כל השאר ב- Google Drive. בשיתוף פעולה, אחרים יכולים להציג או לערוך פנינה.
  • זמין כעת למת'מיני מתקדםמנויים לעסקים וארגון ביותר מ -150 מדינות.

גרוק מוביל את לוח המוביל של Arc-Agi


גרוק

Grok 4 של אלון מאסק זינק לקדמת החפיסה במירוץ AI Arms, ועמד על לוח ה- Arc-Agi-מדד המודד כמה בעיות AI יכול לפתור כמו גם את היעילות של הדגם. בבדיקות האחרונות, גרוק 4 ביצעו את יריבים כמו צ'טגט ומזל תאומים על מדד קשוח זה, והדגיש את פיתרון ובעלי המהירות העליונים בעולם האמיתי.

למרות המהירות שלו, שימוש בחיפוש ברשת חי וטיפול מרשים בהנחיות הנדסיות מורכבות, למשתמשים עדיין יש חששות סביב הדיוק של גרוק, מתינות התוכן וההטיה.

מה לדעת:

  • מנהיג Leaderboard של ARC-AGI: Grok 4 טוען שהנקודה הראשונה, כלומר היא פותרת יותר אתגרים של AI Benchmark לכל יחידת משאבים בהשוואה למתחרים.
  • חוזקות: חיפוש אינטרנט כמעט אינטרנט, שיפור הטיפול במשימות הנמקה והנמקה מורכבות ורווחי ביצועים בהשוואה לגרסאות GROK קודמות.
  • חולשות ודאגות: סוגיות עם דיוק תוכן (כמה טענות כוזבות), שאלות של הטיה ואתגר שמירה על מתינות ואמינות בשימוש כבד יותר.
  • מַשְׁמָעוּת: מדגים כי היעילות והאיכות מתוגמלים יותר ויותר במדדי AI.

מודל AI חדש יכול לחזות את הסיכון שלך ל -1,000+ מחלות, כולל סרטן


תמונה עתידית של AI שנוצרה של רופא בודק וירוסים

מודל AI חדש בשם Delphi-2M מייצג קפיצה קדימה ב- AI רפואי. מיומנים על נתוני בריאות אנונימיים של כמעט 2.3 מיליון אנשים בבריטניה ובדנמרק, זה יכול לחזות את הסיכון שלך ליותר מ -1,000 מחלות ולהעריך מתי הם עלולים להתרחש.

בניגוד למודלים אחרים של AI, Delphi-2M מעניק לך ציון סיכון עבור 1,0000 מצבים, באמצעות היסטוריות מחלות, גורמי אורח חיים, גיל ומין כדי לדמות מסלולי בריאות במשך עשרות שנים. המודל יכול לחזות לא רק איזו מחלה עשויה לבוא, אלא מתי.

בניסויים היא השיגה AUC ממוצע של 0.76 על פני מאות מחלות במערכי הנתונים בבריטניה, אם כי הדיוק צנח באוכלוסיות הדניות. המודל אינו כלי אבחון ולא תחליף לרופאים אנושיים.

אולם הכלי מבטיח ככלי חיזוי, שימושי לאיתור מגמות סיכון כלליות, תכנון מניעה והארת הפוטנציאל של AI בבריאות בהתאמה אישית.

נקודות מפתח:

  • מערך נתונים מסיבי: מאומנים על ~ 2.3 מיליון אנשים מהרישומים הביובנקים + דנים בבריטניה.
  • דוגמנות הוליסטית + זמנית: משתמש בתשומות מפורטות (גיל, מין, אורח חיים, אבחנות עבר) ומנבא את המחלה הבאה וכן כאשר זה יתרחש.
  • חיזוי, לא אבחון: נועד ליידע מניעה, ולא להחליף ייעוץ רפואי.

הנסיגה

תוך שבוע בלבד, עדכונים אלה מדגישים שינוי ברור בנוף AI לעבר שילוב בעולם האמיתי ופריצות דרך גדולות יותר.

דילוג לתוכן