אם ניפוי גיליונות אלקטרוניים של Excel זה לא הקטע שלך ואתה מעדיף שצ'אט בוט בינה מלאכותית יבין את כל השורות והעמודות עבורך, ייתכן ש-Microsoft תחזיק במפתח לעזור ל-LLMs להבין את הגיליונות האלקטרוניים טוב יותר.
זה לא רק אתה, AI ידוע גם כמתקשה בעיבוד גיליונות אלקטרוניים. הרשתות הרחבות שלהם ופורמטים שונים של תאים פועלים כמכשולים ש-LLMs חייבים להתגבר עליהם.
כעת, קבוצה של חוקרים של מיקרוסופט חושבת שאולי מצאו פתרון שמייעל את הגישה של LLMs לפענוח גיליונות אלקטרוניים.
במאמר טרום-דפוס שהוגש ב-12 ביולי, חשפו החוקרים את SpreadsheetLLM, שיטה חדשה המשלבת קידוד ודחיסה עם צ'אטבוטים מובילים של AI כדי לעזור להם לטפל בגיליונות אלקטרוניים בצורה יעילה יותר.
הנתונים שלהם מצביעים על כך שבשימוש בשיטה שלהם, מודל ה-GPT4 AI השתפר ב-27% במונחים של זיהוי טבלאות גיליונות אלקטרוניים ובכמעט 26% בביצועים בלמידה בהקשר. השיטה שלהם גם הובילה להוזלת עלויות של עד 96% על בסיס מחירי GPT4 ו-GPT3.5-טורבו.
גרסה של זה תוכל להשתלב ב-Microsoft Copilot עבור 365 בעתיד, מה שיקל מתמיד על הבנת הנתונים.
מה הופך את SpreadsheetLLM לשימושי?

המפתח להצלחת SpreadsheetLLM הוא SheetCompressor של מיקרוסופט, מסגרת קידוד שדוחסת גיליונות אלקטרוניים ביעילות עבור LLMs.
קבל את המבצעים המובילים של Amazon Prime Day ישירות בתיבת הדואר הנכנס שלך: הירשם עכשיו!
קבל את המבצעים החמים ביותר והמלצות המוצרים לצד החדשות הטכנולוגיות הגדולות ביותר מצוות המדריך של Tom ישירות לתיבת הדואר הנכנס שלך!
זה מגיע עם שלושה מודולים שונים: אחד שהופך את הגיליונות האלקטרוניים לקריאה יותר עבור LLMs, אחר שעוקף תאים ריקים ומספרים חוזרים, ומודול נוסף שעוזר ל-LLMs להבין טוב יותר מה המשמעות של מספר (כמו אם זה שנה או מספר טלפון).
שיטת דחיסה זו הפחיתה את השימוש באסימונים עבור קידוד גיליון אלקטרוני ב-96%. שיטת הדחיסה שלהם העלתה משמעותית את הביצועים בגיליונות אלקטרוניים גדולים יותר, שם האתגרים של שימוש גבוה באסימונים מורגשים ביותר.
ייתכן שבקרוב נוכל להעלות גיליונות אלקטרוניים שלמים ולשאול את הצ'אטבוטים שאלות בשפה פשוטה כדי לקבל סיכומי נתונים או ניתוח על סמך הקובץ שהעלינו.
במאמרם, המחברים גם אמרו שהם יצרו את "שרשרת גיליון אלקטרוני", מרחיב מסגרת שעוזר לזהות את הטבלה הרלוונטית לשאלה וקובע את גבולות התוכן הרלוונטי. לאחר מכן, השאלה והנתונים מוצגים שוב ל-LLM אשר לאחר מכן מעבד את המידע הגזום כדי ליצור תגובה.
הזנה ישירה של גיליון אלקטרוני טיפוסי פירושה לעתים קרובות שהמגבלות הסמליות של דגמים קונבנציונליים פשוט נחרגו. שיטת Chain of Spreadsheet סייעה ל-LLM להתמקד רק באזורים הרלוונטיים לשאלות שהוצגו, והפחיתה נתונים מיותרים, ובכך שמרה על ה-LLM יעיל.
מגבלה אחת שציינו החוקרים של מיקרוסופט לגבי השיטה הנוכחית שלהם הייתה שהיא עדיין לא יכולה להתמודד עם פרטי עיצוב גיליונות אלקטרוניים כמו צבע רקע וגבולות מכיוון שמידע זה עולה יותר מדי אסימונים.
למרות שזה לא אומר הרבה עבור המשתמש הממוצע, אם גרסאות חדשות יותר של צ'אטבוטים כמו ChatGPT וקלוד משלבות את SpreadsheetLLM של מיקרוסופט, ייתכן שבקרוב נוכל להעלות גיליונות אלקטרוניים שלמים ולשאול את הצ'אטבוטים שאלות בשפה פשוטה כדי לקבל סיכומי נתונים או ניתוח על סמך הקובץ שהעלינו.