כיצד מחקר חדש לבריאות בארה"ב מתקן הטיה במחקר נתונים לביש

14:00
, 9 אוקטובר 2025
, בריאות ורפואה

על ידי מתן למשתתפים לבישים וגישה לאינטרנט, המחקר האמריקני Life in Altime Time סוגר את הפער בנתוני הבריאות הדיגיטליים באמת מייצג, ומוכיח כי הכלול ועיצוב קפדני יכולים להפוך את שירותי הבריאות המונעים AI לכולם.

לימוד: החיים האמריקאים בזמן אמת: מדד, נתוני בריאות שנוצרו על ידי אדם זמינים באופן ציבורי לצורך הון עצמי בתחום הבריאות המדויקת. קרדיט תמונה: Lomb/Shutterstock.com

במאמר שפורסם לאחרונה ב- PNAS Nexus– החוקרים פיתחו מחקר בריאות אורכי ומייצג ארצית שנקרא החיים האמריקאים בזמן אמת (ALIR) לאיסוף נתוני בריאות שנוצרו על ידי אדם (PGHD) באמצעות מכשירים לבישים ואינטרנט המחוברים למחקר.

גישתם מתייחסת למגבלות של מחקרי PGHD קיימים התלויים במכשירים אישיים ולעתים קרובות שוללים אוכלוסיות מוחלשות. ALIR יכול אפוא לשמש אמת מידה למחקר בריאות דיגיטלי הוגן והכלל.

התייחסות לייצוג תת היסטורי

בריאות הדיוק נועדה לשפר את מניעת וטיפול המחלות על ידי התאמת אסטרטגיות להקשרים הביולוגיים, החברתיים והסביבתיים הייחודיים של אנשים. מרכיב מרכזי בגישה זו הוא PGHD, שנאסף באמצעות כלים דיגיטליים יומיומיים כמו סמארטפונים ומכשירים לבישים.

נתונים אלה מספקים תובנות מתמשכות לגבי התנהגויות וחשיפות האחראיות על סיכוני הבריאות הניתנים לשינוי ביותר, מה שהופך אותם לחיוניים לזיהוי אי -שוויון בריאותי ושיפור התוצאות בקרב קבוצות שוליות.

עם זאת, לתחום חסר משאבי נתונים של PGHD Benchmark, IE, סטנדרטיים, מייצגים ותוקפים משאבי נתונים המאפשרים פיתוח הוגן וניתן לשחזור של מודלים של בינה מלאכותית (AI). הכותבים מציינים כי אמת מידה אידיאלית של PGHD צריכה לייצג את מגוון האוכלוסייה, לכלול אמצעים מאומתים שוב ושוב, להיות אורכיים, מכילים איכות נתונים וכמות מספיקים ולהיות נגישים באופן נרחב, שהם קריטריונים שמגיבים ALIR.

מערכי נתונים נוכחיים, כמו המוסדות הלאומיים לבריאות כולנו וה- בנק ביולוגי בבריטניהמייצג תת-ייצוג של אוכלוסיות שחורות, ילידיות, מבוגרות ונמוכות, לעתים קרובות מסתמכים על נתונים לא סדירים או לא מובנים. זה מגביל את ההכללות והסיכונים של המודל המחמיר את הפערים באמצעות תחזיות מוטות.

מגיפת מחלת Coronavirus 2019 (COVID-19) הדגישה אתגרים אלה, וחשפה כיצד אי-השוויון החברתי מגביר את נטל המחלות. מחקרי גילוי קוביידים מבוססי PGHD הסתמכו על דגימות נוחות שהדירו אנשים מוחלשים, בין היתר בגלל מחסומי גיוס כמו גישה מוגבלת של טכנולוגיה או חוסר אמון.

כדי להתגבר על הטיות אלה, הוקם מחקר ALIR. היא משתמשת בדגימה מבוססת הסתברות וחומרה המסופקת על ידי מחקר כדי לקדם הכללה וליצור אמת מידה למחקר שוויוני לבריאות.

תכנון המחקר

מחקר ALIR תוכנן כקבוצה לבריאות דיגיטלית אורכית ומייצגת ארצית תוך שימוש בשיטות עבודה מומלצות בדגימת הסתברות, מידוד והוגן (הוגן (ניתן למצוא, נגיש, ניתן להפעלה, ניתן לשימוש חוזר).

המשתתפים נבחרו באופן אקראי ממחקר ההבנה של אמריקה (UAS), פאנל גדול מבוסס כתובות של מבוגרים בארה"ב. אנשים המסכימים להשתתף קיבלו מכשיר לביש וגישה לאפליקציה סלולרית בהתאמה אישית למעקב ביומטרי רציף וסקרים קצרים ותכופים.

סקרים אלה, ערכו כל אחד עד שלושה ימים, אסף מידע על בריאות גופנית ונפשית, התנהגויות, דמוגרפיה, חשיפות סביבתיות וחברתיות, וקובעים מבניים כמו הכנסה, דיור ואפליה.

הנתונים נקשרו למערכי נתונים קונטקסטואליים, כולל רשומות בריאות, מזג אוויר, איכות אוויר ופשע, כדי להעשיר מידע על הסביבה והבריאות. המחקר סיפק גם טבליות אלקטרוניות למשתתפים חסרי גישה לאינטרנט כדי למזער את הטיית הבחירה ולהבטיח הכללת קבוצות המייצגות תחת.

בין אוגוסט 2021 למרץ 2022 הוזמנו 2,468 חברי UAS, עם דגימת יתר של מיעוטים גזעיים/אתניים וקבוצות חינוך נמוך יותר. מתוכם, 1,386 הסכימו (64%) ו -1,038 נרשמו (75%).

ניתוחי יער לוגיסטיים ואקראיים זיהו כי לא קשור ביותר לגיל מבוגר, בעוד שאינו רגיל היה קשור לחינוך נמוך יותר.

הביצועים של ALIR

ALIR השיג ייצוגיות רחבה בין מאפייני האוכלוסייה בארה"ב, כולל תכונות אישיות, בריאות, דמוגרפיה ומצב סוציו -אקונומי.

מיעוטים גזעיים ואתניים היו מיוצגים יתר על המידה (54% לעומת 38% באוכלוסייה), ואילו אנשים לבנים היו מיוצגים תחת ייצוג (46% לעומת 62%), והתיישרו עם דגימת יתר מכוונת כדי לשפר את הכלל.

המשתתפים עם הכנסה נמוכה או גישה דיגיטלית מוגבלת היו מיוצגים היטב, כאשר 77% אינם בעלי מכשיר לביש קודם, ו -2% ללא גישה לאינטרנט לפני חומרה שסופקו על ידי המחקר. התאמות משוקללות תיקנו את מרבית חוסר האיזון הדמוגרפי הקלים, אם כי גמלאים ואלו עם יתר לחץ דם נותרו מעט מיוצגים.

בהשוואה למחקרים לבישים מבוססי נוחות, כמו כולנו מערך הנתונים של Fitbit "Bring Your-Own-Device" (BYOD), ALIR הפגין יישור ומגוון אוכלוסייה מעולה בהרבה. כאשר משמשים לאימון מודל סיווג זיהום COVID-19, מודלים מבוססי ALIR השיגו ביצועים חזקים הן במדגם והן מחוץ לדגימה, מה שמצביע על הכללות חזקה בכל תת-הקבוצות הדמוגרפיות.

באופן ספציפי, המודל של ALIR השיג אזור מתחת לעיקול (AUC) של 0.84 כאשר הוא נבדק גם במדגם וגם מחוץ לדגימה, תוך שמירה על ביצועים עקביים בכל תת-קבוצות.

לעומת זאת, מודל מאומן זהה המבוסס על כולנו הנתונים השיגו AUC של 0.93 במדגם אך צנחו ל 0.68 מחוץ לדגימה, אובדן של 35% ברמת הדיוק, כאשר הירידות החדות ביותר (22 עד 40%) בקרב נשים ישנות יותר ומשתתפים שאינם לבנים.

מסקנות

ALIR הוא המחקר הראשון מבוסס האוכלוסייה האורך שמשלב נתוני מכשירים לבישים עם אמצעי בריאות והתנהגות מאומתים שוב ושוב, ומציע מדד למחקר שוויוני לבריאות.

הדגימה המבוססת על הסתברות, אסטרטגיות חומרה ואסטרטגיות דגימות יתר שלה, צמצמו ביעילות את ההטיה, והשיגה ייצוג דמוגרפי וסוציו-אקונומי רחב של ארה"ב, שיפורו במחקרים של נוחות ומחקרים "להביא משלך-מכשיר" כמו כולנוו

מודל ה- Covid-19 של Alir ביצע בחוזקה בין קבוצות מגוונות, והראה כי דגימות ייצוגיות קטנות יותר ואיכותיות, יכולות להניב תוצאות הכללות יותר מאשר מערכי נתונים גדולים יותר ומוטים.

עם זאת, חלק מהטיות נמשכו, במיוחד ייצוג תת -ייצוג של מבוגרים למרות מתן מכשירים, מה שמרמז כי חסמים מעבר לגישה טכנולוגית, כמו חוסר אמון או חוסר עניין, משפיעים על ההשתתפות. המחקר התמקד גם בהסכמה והרשמה, כאשר עבודה שוטפת עוסקת במעורבות לטווח הארוך. המחברים מדגישים כי מערך הנתונים של ALIR וקוד אפליקציית המחקר הנלווה יהיו זמינים לציבור בסוף 2025, ויספקו משאב פתוח לפיתוח ואימות מודלים של AI שוויוני.

לסיכום, ALIR לא רק קובע אמת מידה ציבורית למחקר כולל של בריאות דיגיטלית, אלא גם מדגימה כי תכנון מחקר מהורהר יכול להתגבר על חסמים ארוכי שנים לייצוג. על ידי מתן מסגרת צלילית מתודולוגית, ALIR תומך בפיתוח מודלים של AI יותר הניתנים להכללה ותורם לשיפור ההון העצמי במחקר בריאות דיגיטלי ודיוק.

הורד את עותק ה- PDF שלך עכשיו!

ניקולס וינשטיין

ניקולס וינשטיין הוא העורך הראשי של אתר Datilin.