חוקרים חושפים מערכת למידה מאוחדת ניתנת להרחבה וממוקדת פרטיות המשתמשת במיקרו-מחשוב במחיר סביר לבדיקת COVID-19 בבתי חולים

12:25
, 31 ינואר 2024
, בריאות ורפואה

במחקר שפורסם לאחרונה ב ה-Lancet Digital Healthקבוצת חוקרים פיתחה והעריכה פתרון למידה פדרציה ניתן להרחבה ומשמר פרטיות תוך שימוש במיקרו-מחשוב בעלות נמוכה לבדיקת מחלת נגיף הקורונה 2019 (COVID-19) בבתי חולים בבריטניה (בריטניה).

מחקר: פתרון למידה מאוחדת שניתן להרחבה לטיפול משני באמצעות מיקרו-מחשוב בעלות נמוכה: פיתוח והערכה לשמירה על הפרטיות של בדיקת סקר COVID-19 בבתי חולים בבריטניה. קרדיט תמונה: PopTika/Shutterstock.com

רקע כללי

השימוש בנתוני חולים במחקר בינה מלאכותית רפואית (AI) עומד בפני אתגרים אתיים, משפטיים וטכניים, כולל סיכונים של שימוש לרעה והפרות פרטיות. למידה מאוחדת מציעה גישה להגנה על פרטיות על ידי מתן אפשרות לפיתוח מודל AI מבלי לשתף נתונים מחוץ לארגונים. זה מאפשר אימון נתונים מקומי, בניגוד לאימון מרוכז מסורתי.

שיטה זו, במיוחד למידה מאוחדת של שרת-לקוח, כוללת שיתוף משקלי מודל, לא נתוני מטופל, לפיתוח מודל גלובלי. יישומים של בתי חולים בעולם האמיתי הם נדירים, לעתים קרובות דורשים מומחיות טכנית והפרדת נתונים ממערכות קליניות.

דרוש מחקר נוסף כדי לחדד ולאמת את גישת הלמידה הפדרציה במסגרות בריאות מגוונות וכדי להתמודד עם אתגרי יישום לאימוץ רחב יותר בסביבות קליניות בעולם האמיתי.

לגבי המחקר

המחקר הנוכחי כלל תהליך מפורט לפיתוח ובדיקה של פתרון למידה מאוחד לבדיקת COVID-19 בבתי חולים בבריטניה. חוקרים בחרו ארבע קבוצות בתי חולים של שירותי הבריאות הלאומיים (NHS) – בתי חולים של אוניברסיטת אוקספורד (OUH), בתי חולים אוניברסיטאיים בברמינגהם (UHB), בתי חולים בדפורדשייר (BH), ואוניברסיטת בתי חולים בפורטסמות' (PUH) והשתמשו במכשירי Raspberry Pi 4 דגם B עבור מלא- מחסנית למידה מאוחדת. הגדרה זו אפשרה לכל בית חולים לאמן, לכייל ולהעריך מודלים של בינה מלאכותית באופן מקומי תוך שימוש בנתוני מטופלים שאינם מזוהים, תוך הבטחת פרטיות.

קריטריוני הכללה והדרה סופקו לנאמנויות של NHS לצורך חילוץ נתונים מרשומות בריאות אלקטרוניות. ביטול זיהוי הנתונים בוצע בקפדנות על ידי צוותים קליניים או מידענים של NHS. המחקר השתמש בקבוצת בקרה טרום-מגיפה ובקבוצה חיובית ל-COVID-19 לאימון, עם נתונים הכוללים סימנים חיוניים, דמוגרפיה ותוצאות בדיקות דם. תמציות נתונים הועמסו על מכשירי לקוח לצורך אימון, כיול והערכה מאוחדים.

ההכשרה המאוחדת השתמשה ברגרסיה לוגיסטית ומסווגים עמוקים של רשתות עצביות. תכונות עובדו מראש לפורמט נפוץ, ונתונים חסרים נזקפו באמצעות ערכי חציון מקומיים. אלגוריתם FedAvg איפשר את ההדרכה בין קבוצות בתי חולים, כאשר לקוחות שידרו פרמטרים של מודל לשרת המרכזי לצורך צבירה. כיול של מודלים מקומיים המכוונים לסף רגישות מוגדר, עם תוצאות הערכה מצטברות על ידי השרת.

ההערכה הפדרציה כללה שימוש בקבוצות פוטנציאליות מבתי חולים שונים. אסטרטגיות כיול וזקיפה השתנו בהתאם לשאלה אם האתרים השתתפו הן בהדרכה והן בהערכה או בהערכה בלבד. כוונון מודל ספציפי לאתר בדק את יכולת ההסתגלות של המודל הגלובלי, והערכה מרכזית בצד השרת אימתה את נאמנות ההערכה המאוחדת. המחקר בדק גם את ההשפעה של תכונות בודדות על תחזיות המודל.

ניתוח סטטיסטי התמקד בהשוואת ביצועי המודל על פני תצורות ושיטות אימון שונות, תוך שימוש במדדים כמו AUROC, רגישות וסגוליות.

תוצאות המחקר

במחקר, ההשוואה חשפה עלייה בולטת ב-AUROC של מודל הרגרסיה הלוגיסטית. לדוגמה, ה-OUH ראה עלייה ב-AUROC מ-0.685 ל-0.829, ו-PUH חוותה עלייה מ-0.731 ל-0.865. באופן דומה, מודלים של רשתות עצביות עמוקות הראו שיפורים משמעותיים עוד יותר, כאשר ערכי AUROC עלו מ-0.574 ל-0.872 ב-OUH ומ-0.622 ל-0.876 ב-PUH.

שלושה נאמנויות של NHS- OUH, UHB ו-PUH- השתתפו בהכשרה מאוחדת זו, ותרמו נתונים מקבוצה גדולה של חולים. ההערכה המאוחדת כללה נתונים של חולים שאושפזו במהלך הגל השני של המגיפה, עם שיעורי שכיחות COVID-19 משתנים וגילאים חציוניים באתרים המשתתפים.

כאשר המודלים הגלובאליים הסופיים הוערכו חיצונית, הן רגרסיה לוגיסטית והן מודלים של רשתות עצביות עמוקות הראו ביצועי סיווג גבוהים. הכיול המאוחד השיג רגישויות מרשימות, עם מודל הרגרסיה הלוגיסטית על 83.4% ומודל הרשת העצבית העמוקה על 89.7%.

הביצועים של מודלים אלה נותרו יציבים באתרי ההערכה השונים. מודל הרשת העצבית העמוק, במיוחד, הראה שיפור ניכר יותר באמצעות פדרציה בהשוואה למודל הרגרסיה הלוגיסטית, והגיע לרמה של ביצועים לאחר כ-75-100 סיבובים.

כוונון ספציפי לאתר של המודלים הגלובליים הביא לשיפור קל במודל הרשת העצבית העמוקה ב-PUH. ובכל זאת, לא נצפה שיפור משמעותי במודל הרגרסיה הלוגיסטית. זה הצביע על רמה גבוהה של הכללה של המודלים הגלובליים ושינויים מינימליים בהתפלגות מנבאים בין אתרים.

הניתוח של מודל הרגרסיה הגלובלית הדגישה מספר מנבאים מרכזיים, כגון ספירת גרנולוציטים וריכוזי אלבומין, תוך התאמה למחקרים קודמים שהדגישו את תפקידם בתגובה הדלקתית. הניתוח של מודל הרשת העצבית העמוק באמצעות הסברים תוספים של Shapley חשף את ספירת האאוזינופילים כמנבא בעל השפעה רבה.

ניקולס וינשטיין

ניקולס וינשטיין הוא העורך הראשי של אתר Datilin.