תכונות רגשיות משפרות את דיוק זיהוי החדשות המזויפות במדיה החברתית

05:45
, 21 מאי 2024
, בריאות ורפואה

במחקר שפורסם לאחרונה בכתב העת תקשורת במדעי הרוח והחברה, חוקרים חקרו את התפקיד של סנטימנט ומאפיינים רגשיים בזיהוי חדשות מזויפות על ידי השוואה בין רגשות הקשורים לחדשות מזויפות ואמיתיות.

הממצאים שלהם מצביעים על כך ששילוב תכונות רגשיות, במיוחד רגשות שליליים, במודלים של למידת מכונה משפר באופן משמעותי את הדיוק והאמינות של זיהוי חדשות מזויפות בפלטפורמות מדיה חברתית.

מחקר: נחשפו רגשות: זיהוי חדשות מזויפות של COVID-19 במדיה החברתית. קרדיט תמונה: voyata / Shutterstock

רקע כללי

ידוע היטב כי המדיה החברתית משפיעה באופן משמעותי על היבטים שונים של חיי אדם, ומציעה יתרונות כמו קישוריות ושיתוף מידע ומציגות סכנות כמו הפצת חדשות מזויפות.

המחקר הדגיש כי חדשות מזויפות מערערות את אמון הציבור, הדמוקרטיה והיציבות הכלכלית. אירועים בולטים במהלך הבחירות לנשיאות ארצות הברית 2016 ומגיפת מחלת הקורונה 2019 (COVID-19) ממחישות את ההשלכות החמורות שלה.

למרות שמחקרים קודמים בחנו הטיות קוגניטיביות ואת ההיבטים המבניים של מדיה חברתית המאפשרים הפצת חדשות מזויפות, כמו גם טכניקות שונות של למידת מכונה לאיתורן, היה פער בולט בהבנת תפקידם של רגשות בזיהוי חדשות מזויפות.

לגבי המחקר

מחקר זה נועד לחקור כיצד תכונות רגשיות, במיוחד רגשות שליליים, יכולים לשפר את הדיוק של מודלים של למידת מכונה בזיהוי חדשות מזויפות. חוקרים התמקדו באיתור חדשות מזויפות על ידי ניתוח התחושות והרגשות המובעים בציוצים במהלך מגיפת COVID-19.

הם השתמשו במערך נתונים של 10,700 ציוצים באנגלית, מסווגים כאמיתיים או מזויפים, שנאספו במחקר קודם. הציוצים נבעו מאתרים ציבוריים של בדיקת עובדות ומדיה חברתית, מה שמבטיח מערך נתונים מאוזן עם 5,600 ידיעות אמיתיות ו-5,100 ידיעות מזויפות.

שלבי העיבוד המקדים כללו ניקוי הטקסט על-ידי הסרת תווים שאינם אלפביתיים, המרה לאותיות קטנות, הסרת מילות עצירה ו-lematizing. ניתוח הסנטימנטים השתמש בשלושה לקסיקונים שזיהו סנטימנטים (חיוביים, שליליים, ניטרליים) בתוך הציוצים.

לקסיקון הרגשות שימש כדי לחלץ שמונה רגשות בסיסיים (ציפייה, כעס, שמחה, עצב, הפתעה, פחד, אמון וסלידה) מהציוצים. מאפיינים רגשיים אלה שולבו לאחר מכן במודלים שונים של למידת מכונה – יער אקראי, מכונה וקטורית (SVM) ו-Bayes נאיבי – וכן מודל למידה עמוקה שנקרא ייצוגי מקודד דו-כיווני משנאים (BERT) כדי לסווג את הציוצים כאמיתיים או מזויפים. .

מערך הנתונים פוצל לקבוצות אימון (80%) ובדיקות (20%). ביצועי המודלים הוערכו עם ובלי לכלול מאפיינים רגשיים.

האיור מציג הסבר סכמטי של המודל.

ממצאים

המחקר חשף תובנות קריטיות לגבי תפקידם של סנטימנט ורגש בגילוי חדשות מזויפות במהלך מגיפת COVID-19.

ניתוח סנטימנטים הראה שלציוצים של חדשות מזויפות היו יותר סנטימנטים שליליים (39.31%) בהשוואה לסנטימנטים חיוביים (31.15%), בעוד שציוצי חדשות אמיתיים הפגינו מגמה הפוכה, עם יותר סנטימנטים חיוביים (46.45%) מאשר סנטימנטים שליליים (35.20%).

ניתוח רגשות באמצעות לקסיקון הרגשות הצביע על כך שחדשות מזויפות עוררו בעיקר רגשות שליליים כמו כעס, גועל ופחד. לעומת זאת, חדשות אמיתיות היו קשורות לרגשות חיוביים יותר כמו הפתעה, שמחה וציפייה.

הבדלים משמעותיים נצפו ברגשות כמו אמון, פחד וציפייה, כאשר אמון נפוץ יותר בחדשות אמיתיות והפחד חזק יותר בחדשות מזויפות.

כאשר שולבו תכונות רגש במודלים של למידת מכונה, כולל יער אקראי, SVM ו-BERT, הם הפגינו ביצועים משופרים בזיהוי חדשות מזויפות.

מודל היער האקראי, למשל, הדגיש פחד, ציפייה ואמון כמאפיינים המשמעותיים ביותר להבחנה בין חדשות אמיתיות לחדשות מזויפות.

מודל BERT, שעבר אופטימיזציה באמצעות אימות צולב פי חמישה ואומן במשך שלוש תקופות, הראה גם דיוק משופר עם הוספת תכונות רגש.

בסך הכל, המחקר אישר שרגשות, במיוחד שליליים, ממלאים תפקיד מכריע בהפצת חדשות מזויפות, ושילוב התכונות הרגשיות הללו במודלים של זיהוי מגביר באופן משמעותי את יעילותם.

מסקנות

מחקר זה מדגיש את התפקיד המכריע של רגשות בגילוי חדשות מזויפות, במיוחד במהלך מגיפת COVID-19.

בסך הכל, התוצאות הראו ששילוב נתונים רגשיים שיפר משמעותית את הדיוק והאמינות של זיהוי חדשות מזויפות.

הלקסיקון שזיהה סנטימנטים שליליים היה יעיל במיוחד, והצביע על כך שציוצים של חדשות מזויפות כללו בדרך כלל יותר סנטימנטים ורגשות שליליים בהשוואה לציוצים של חדשות אמיתיות.

ממצא בולט נוסף היה שחדשות מזויפות מעוררות בעיקר רגשות שליליים כמו פחד, כעס וגועל, בעוד חדשות אמיתיות מעוררות רגשות חיוביים כמו ציפייה, שמחה ואמון.

ממצאים אלו מתיישבים עם מחקרים קודמים שציינו גם את השכיחות של רגשות שליליים בחדשות מזויפות.

כוחו של המחקר טמון בניתוח המפורט שלו של עוצמות רגשיות ושילוב תכונות אלו במודלים של למידת מכונה, תוך שיפור הדיוק שלהם.

עם זאת, המגבלות כוללות את מסגרת הזמן המוגבלת של מערך הנתונים ואת הפוטנציאל להכללה רחבה יותר עם נתונים נרחבים יותר.

מחקר עתידי צריך לחקור דינמיקה רגשית במשברים שונים ולשפר מודלים לזיהוי באמצעות תכונות רגש מאומנות מראש. גישה בינתחומית זו יכולה לתרום באופן משמעותי להבנה והפחתה של חדשות מזויפות על פני תחומים שונים.

ניקולס וינשטיין

ניקולס וינשטיין הוא העורך הראשי של אתר Datilin.