מחקר פורץ דרך מראה ששגרת הגלישה היומיומית שלך, אילו אתרים אתה מבקר הכי הרבה, יכולה לזהות אותך באופן ייחודי, מה שמוכיח שאנונימיות באינטרנט עשויה להיות יותר אשליה מהמציאות.
מחקר: התנהגות גלישה חושפת זהויות ברשת. קרדיט תמונה: 13_Phunkod/Shutterstock.com
במחקר שפורסם לאחרונה ב דוחות מדעייםחוקרים בדקו האם ניתן לזהות אנשים באופן ייחודי רק על סמך התנהגות הגלישה שלהם באינטרנט, במיוחד אתרי האינטרנט הנפוצים ביותר שלהם.
לעניין, ב-95% מהמקרים, ידיעת ארבעת הדומיינים המבוקרים ביותר של המשתמש אפשרה לחוקרים לזהות אותם; בממוצע, נדרשו רק 2.45 שלבים (בערך שניים או שלושה אתרים מובילים) כדי לבודד משתמש, וב-80% מהמקרים, ניתן היה לזהות את המשתמש מחדש לאורך זמן. עם זאת, שיעורי הזיהוי מחדש היו תלויים באורך טביעת האצבע, ועלו מכ-60% עבור חמישה דומיינים ל-80% עבור 10 ו-90% עבור 15. לפיכך, דפוסי הרגלי גלישה יוצרים 'טביעות אצבע התנהגותיות' ייחודיות ויציבות המאיימות על הפרטיות המקוונת.
רֶקַע
בעולם הדיגיטלי של היום, התנהגויות מקוונות של אנשים הפכו לנכסים יקרי ערך עבור חברות שאוספות נתונים ומייצרות רווחים באמצעות פרסום מותאם אישית. על ידי ניתוח דפוסי גלישה, עסקים יכולים לחזות ולהשפיע על פעולות בודדות, אך היסודות ההתנהגותיים של רווחיות זו עדיין לא מובנים.
מחקרים מראים שהתנהגות מקוונת צפויה מאוד (כ-85% ניתנת לחיזוי בממוצע) מכיוון שאנשים נוטים לעקוב אחר שגרות גלישה עקביות, כמו התנהגות רגילה הנצפית בקניות או בניידות. אמנם יכולת חיזוי זו משפרת את חווית המשתמש באמצעות שירותים מותאמים, אך היא מעלה חששות בנושא פרטיות ואתיים.
היכולת לצפות ולתמרן התנהגות מהווה את הבסיס של "קפיטליזם מעקב", שבו פעולות המשתמשים מנוטרות ומעוצבות בפוטנציה לשרת מטרות מסחריות או פוליטיות.
ייחודיות בהתנהגות, בין אם בתנועה, רכישות או שימוש באינטרנט, יכולה להיות טביעת אצבע דיגיטלית, המאפשרת לזהות אנשים ללא מזהים אישיים מסורתיים. מחקרים קודמים הוכיחו שרק מספר נקודות נתונים מרשומות טלפון או עסקאות בכרטיסי אשראי יכולות לזהות מחדש את רוב המשתמשים.
באופן דומה, מחקר מקוון קודם הראה שגורמים כמו הגדרות דפדפן או היסטוריית גלישה יכולים לחשוף את זהות המשתמש. עם זאת, מחקרים מעטים בדקו כיצד האופי החוזר והרגיל של שימוש יומיומי באינטרנט עשוי לייצר דפוסי התנהגות יציבים וניתנים לזיהוי במסגרות של העולם האמיתי.
לגבי המחקר
המחקר ניתח את פעילות הגלישה באינטרנט של 2,148 משתמשים גרמנים במשך חודש אחד. המשתתפים גויסו באמצעות פאנל מקוון תואם תקנת מידע כללי (GDPR), נתנו הסכמה מדעת וקיבלו פיצוי. מערך הנתונים האנונימי הכיל למעלה מ-9 מיליון ביקורים באתר בכמעט 50,000 דומיינים ייחודיים.
כל רשומה כללה את שם הדומיין של האתר, זמן הביקור ומשך הפעילות, כאשר כל המידע המאפשר זיהוי אישי הוסר לפני הניתוח. המשתתפים סיפקו גם נתונים דמוגרפיים כמו גיל, מגדר, השכלה, מצב משפחתי והכנסה, מה שהופך את המדגם למייצג של משתמשי אינטרנט גרמנים מתחת לגיל 65.
כדי לזהות "טביעות אצבע" ייחודיות של גלישה, חוקרים ייצגו כל משתמש על ידי נ-טופל שלהם נ הדומיינים המבוקרים ביותר וחישבו לכמה משתמשים היו שילובים ייחודיים. השונות הסטטיסטית הוערכה בשיטת Jackknife.
כדי לקבוע באיזו קלות ניתן לזהות משתמשים, הם דימו התאמה שלבית על ידי השוואה הדרגתית של חפיפות דומיינים עד שנשאר משתמש בודד, וחזרו על התהליך הזה 300 פעמים לכל משתמש.
ניתוח זיהוי מחדש בדק את היציבות של טביעות האצבע הללו על ידי חלוקת נתוני הגלישה של כל משתמש לשתי תקופות רצופות, שנעו בין כמה שעות למספר שעות, ובדיקה האם טביעות האצבע מהתקופה הראשונה תואמות לאלה מהשנייה. שיעורי ההצלחה חושבו כשיעור המשתמשים שזוהו מחדש באופן עקבי על פני פרוסות זמן.
ממצאים מרכזיים
חוקרים ניתחו נתוני מעקב באינטרנט מ-2,148 משתמשים גרמנים, המכסים למעלה מ-9 מיליון ביקורים באתר על פני כמעט 50,000 דומיינים, כדי לקבוע כיצד הרגלי גלישה יוצרים "טביעות אצבע" התנהגותיות ייחודיות.
החוקרים מצאו כי ארבעת האתרים המבוקרים ביותר של אנשים הספיקו כדי לזהות באופן ייחודי 95% מהמשתמשים, ללא קשר למין, גיל, השכלה או הכנסה. בממוצע, נדרשו רק 2.45 שלבים (שווים לזיהוי שניים או שלושה אתרים מובילים) כדי לאתר משתמש, מה שמראה כי מעט נקודות נתונים יכולות לחשוף זהות.
הממצאים גם הוכיחו כי זיהוי המשתמש נשאר גבוה גם עם נתונים מוגבלים: מידע רק מ-100 הדומיינים המובילים ביותר שנכנסו אליהם (0.2% מכלל הדומיינים) עדיין זיהה 82% מהמשתמשים.
הייחודיות ההתנהגותית נבעה בעיקר מהבדלי גלישה אישית, כאשר תחומים פופולריים מפחיתים את הייחודיות בעוד שדומיינים פחות נפוצים הגדילו אותה.
יתרה מכך, טביעות האצבע הללו היו יציבות לאורך זמן, כאשר 80% מהמשתמשים הצליחו להזדהות מחדש על פני פרוסות זמן סמוכות של נתונים, והראו עקביות גבוהה לטווח קצר. שיעורי הזיהוי מחדש עלו עם טביעות אצבע ארוכות יותר של גלישה ומשכי מעקב ארוכים יותר, אם כי הרווחים פחתו לאחר כשש שעות של איסוף נתונים.
מסקנות
חוקרים הוכיחו בהצלחה שהרגלי הגלישה באינטרנט של אנשים פועלים כטביעות אצבע התנהגותיות ייחודיות ויציבות, ומאפשרות לזהות אותם באופן ייחודי וחוזר באינטרנט.
בניגוד למחקר קודם על מזהים טכניים, עבודה זו מדגישה ששגרות גלישה רגילות מהוות סיכוני פרטיות משמעותיים. הממצאים מראים זיהוי גבוה וזיהוי מחדש על פני טווחי זמן קצרים, תוך שימת דגש שההרגלים העקביים של המשתמשים יכולים לסכן את האנונימיות הדיגיטלית.
למרות אמצעי זהירות נרחבים בפרטיות, כגון חסימת עוגיות או שימוש ברשת פרטית וירטואלית (VPN), הסיכונים הללו נמשכים מכיוון שהם נובעים מהתנהגות, לא מטכנולוגיה. נקודות החוזק של המחקר כוללות ראיות חזקות שנלקחו מהעולם האמיתי, נתונים תואמי GDPR ושכפול על פני מערכי נתונים מרובים.
עם זאת, הוא מוגבל על ידי היקפו האזורי, ניתוח קצר טווח והתמקדות בטביעות אצבע פשוטות מבוססות תחום. המחקר אינו טוען לגבי היציבות ארוכת הטווח של טביעות אצבע התנהגותיות אלו, שנותרה שאלה פתוחה למחקר עתידי. מחקרים עתידיים צריכים לבחון יציבות ארוכת טווח ותרבותית של דפוסי התנהגות אלה, לשלב גורמים זמניים או הקשריים ולפתח אסטרטגיות מעשיות לשמירה על הפרטיות כדי להפחית את הזיהוי המקוון.
הורד את עותק ה-PDF שלך עכשיו!