חוקרים פיתחו את פלטפורמת הבדיקות הראש בראש הראשונה בעולם האמיתית כדי לקבוע אם אלגוריתמי בינה מלאכותית מסחרית (AI) מתאימים לשימוש NHS כדי לזהות מחלות בצורה הוגנת, שוויונית, שקופה ומהימנה, תוך שימוש במחלת עיניים סוכרתית כדוגמה הראשונה.
הם אומרים שזה מסיר כל הטיות שיכולות לבוא מחברות שרוצות לפרוס את תוכנת הבינה המלאכותית שלהן במסגרות קליניות, מה שמציב את כל החברות במגרש שווה.
נכון לעכשיו, בחירת אלגוריתם AI של NHS מתמקדת בעלות-תועלת והתאמת ביצועים אנושיים. עם זאת, נותרו אתגרים רחבים יותר, במיוחד הצורך בתשתית דיגיטלית איתנה ובדיקות קפדניות יותר של אלגוריתמים מסחריים. באופן מכריע, תוכנה המשמשת כמכשירים רפואיים הוערכה רק לעתים רחוקות עבור הוגנות אלגוריתמית בקנה מידה גדול, במיוחד על פני אוכלוסיות שונות ואתניות. פיקוח זה הוביל לפערים לא מכוונים בבריאות, כגון מדדי דופק המשמשים למדידת רמות ריווי החמצן פחות מדויקים באנשים עם עור כהה יותר, מה שגרם לסקירה ממשלתית של ההון העצמי של מכשירים רפואיים, כולל AI.
במחקר שפורסם היום ב ה-Lancet Digital Healthחוקרים ניסו את הפלטפורמה העצמאית בראשות פרופסור אלישיה רודניצקה ב-City St George's, University of London ו-Adnan Tufail ב-Moorfields Eye Hospital NHS Foundation Trust, בשיתוף עם אוניברסיטת קינגסטון ו-Homerton Healthcare NHS Trust. הפלטפורמה שימשה להשוואת אלגוריתמי AI מסחריים שנועדו לזהות מחלת עיניים סוכרתית. אלגוריתמים אלה פועלים על ידי זיהוי סימנים של נזק לכלי דם בחלק האחורי של העין.
מתוך ארבעת מיליון האנשים באנגליה ובוויילס הרשומים בתוכנית לבדיקת עיניים סוכרתית של NHS, למעלה משלושה מיליון אנשים נבדקים למחלת עיניים סוכרתית כל שנה עד שנתיים. שירות ההקרנה האנגלי של NHS לבדו מייצר כ-18 מיליון תמונות בשנה של החלק האחורי של העין, כולן מנותחות על ידי עד שלושה אנשים שונים. זה יוצר עומס עבודה עצום ובלתי בר קיימא יותר ויותר, גוזל זמן יקר, כסף ומשאב יקר, שלטענת החוקרים ניתן להפנות למתן טיפול טוב יותר.
בעבודה עם Homerton Healthcare NHS Trust הצופה פני עתיד ומחלקת ה-IT המתקדמת שלה, נבנתה 'סביבת מחקר מהימנה' של חוקרים עצמאיים. סך של 25 חברות עם אלגוריתמים מסומנים CE הוזמנו לקחת חלק במחקר ושמונה התקבלו.
שמונת אלגוריתמי הבינה המלאכותית 'חוברו' לפלטפורמה והפעילו 1.2 מיליון תמונות של החלק האחורי של העין מתוכנית הסקר לעיניים סוכרת בצפון מזרח לונדון – אחת מתוכניות ההקרנה הסוכרתיות הגדולות והמגוונות ביותר למוצא אתני, גיל, רמת חסך וספקטרום של מחלות עיניים סוכרתיות.
הביצועים של שמונת האלגוריתמים הושוו לתמונות שנותחו על ידי עד שלושה בני אדם שפעלו לפי הפרוטוקול הסטנדרטי המשמש כיום ב-NHS. לאלגוריתמים של ספקים לא הייתה גישה לנתוני דירוג אנושיים וחברות לא נכללו ב"מקלט בטוח" של הנתונים שבו התמונות נותחו על ידי האלגוריתמים שלהם.
פרופסור אליסה רודניצקה מבית הספר למדעי הבריאות והרפואה בסיטי סנט ג'ורג', אוניברסיטת לונדון, שהובילה את המחקר, אמרה:
"הפלטפורמה המהפכנית שלנו מספקת את ההערכה ההוגנת, השוויונית והשקופה הראשונה בעולם של מערכות בינה מלאכותית לאיתור מחלת עיניים סוכרתית מסכנת ראייה. עומק זה של בדיקת בינה מלאכותית הוא גבוה בהרבה מזה שניתן אי פעם לביצועים אנושיים. הראינו שמערכות בינה מלאכותיות אלו בטוחות לשימוש ב-NHS על ידי שימוש בקבוצות נתונים עצומות על פני הגילאים והן החשובים ביותר."
חוקר ראשי שותף עדנאן טופאייל מבית החולים מורפילדס לעיניים אמר:
"יש יותר מ-4 מיליון חולי סוכרת בבריטניה שזקוקים לבדיקות עיניים סדירות. מחקר פורץ דרך זה מציב רף חדש על ידי בדיקה קפדנית של מערכות בינה מלאכותית כדי לזהות מחלת עיניים סוכרתית מאיימת בראייה לפני פוטנציאל התפתחות המונית. הגישה שפיתחנו סוללת את הדרך לאימוץ בטוח יותר וחכם יותר של בינה מלאכותית על פני יישומי בריאות רבים".
בסך הכל, 202,886 ביקורי מיון הוערכו, המייצגים 1.2 מיליון תמונות מקבוצות אתניות של 32% לבנים, 17% שחורים ו-39% מדרום אסיה. למערכות הבינה המלאכותית נדרשו רק 240 מילישניות עד 45 שניות לנתח את כל התמונות למטופל, לעומת עד 20 דקות לאדם מאומן.
הדיוק בכל האלגוריתמים של AI לזיהוי מחלת עיניים סוכרתית שעלולה להזדקק להתערבות קלינית היה 83.7-98.7%. חשוב לציין, הדיוק היה 96.7-99.8% עבור מחלת עיניים סוכרתית בינונית עד חמורה ו-95.8-99.5% עבור מחלת העיניים הסוכרתית המתקדמת ביותר (השגשוגית) מאיימת הראייה. זאת בהשוואה למחקר שפורסם בעבר (2) כאשר הדיוק של בני אדם לדרג תמונות באופן ידני עבור רמות אלו של מחלת עיניים סוכרתית נע בין 75% ל-98%, מה שמראה שאלגוריתמי הבינה המלאכותית פעלו כמו, או אפילו טוב יותר, מאשר אדם בחלק מהזמן.
הפלטפורמה גם זיהתה את שיעור המקרים הבריאים שסומנו באופן שגוי כסובלים ממחלת עיניים סוכרתית על ידי כל אלגוריתם, מדד קריטי נוסף לדיוק. זה הראה שהאלגוריתמים ביצעו ביצועים טובים באופן עקבי בקבוצות אתניות שונות, בפעם הראשונה שזה הוערך.
פרופסור אלישיה רודניצקה הוסיפה: "עבודה זו סוללת את הדרך להרחבת השימוש בפלטפורמה שלנו מרמה מקומית לאומית.
"החזון שלנו הוא לספק תשתית AI מרכזית המארחת אלגוריתמים מאושרים, מה שמאפשר לכל מרכזי המיון להעלות תמונות רשתית בצורה מאובטחת לצורך ניתוח. התוצאות שנוצרו על ידי בינה מלאכותית יוחזרו למרכז וישולבו ישירות בתיעוד הבריאות האלקטרוני של המטופל. גישה זו מבטלת את הצורך בשכפול תשתית על פני מספר אתרים, מפחיתה עלויות הגדרה, אספקה ארצית ניתנות להגדרה".
החוקרים מצהירים שהפלטפורמה שלהם מועילה לכולם – נותנת לחברות הזדמנות לקבל משוב עצמאי לשיפור הטכנולוגיה שלהן ולנאמונות NHS לבחור את כלי הבינה המלאכותית שעובדים הכי טוב עבורם, מה שהופך משימות שחוזרות על עצמן ליעילות יותר, כך שאנשים שעושים את הסקר יוכלו להתמקד במחלות בסיכון גבוה יותר ולהשתמש בסוגים חדשים יותר של סריקות רשתית. המטופלים גם ייהנו בסופו של דבר מאבחון מהיר הרבה יותר וטיפול מיטבי.
הגישה הייחודית והשקופה יכולה להפוך לתוכנית להערכת כלי בינה מלאכותית על פני מחלות כרוניות אחרות כמו סרטן ומחלות לב, לעזור לבנות אמון הציבור ולהאיץ אימוץ בטוח ושוויוני של בינה מלאכותית בתחום הבריאות.
פרופסור שרה ברמן, שהייתה מעורבת במחקר מאוניברסיטת קינגסטון, אמרה: "הערכה רחבת היקף זו של היעילות של אלגוריתמי בינה מלאכותית אפשרה לנו להדגים כיצד אלגוריתמים שונים מתפקדים בתתי קבוצות של האוכלוסייה. היא גם מספקת גישה ברורה שניתן ליישם בתחומים רפואיים אחרים כדי להבטיח שה-AI הוגן ועובד היטב עבור כולם".
מחקר זה מומן על ידי מנהלת הטרנספורמציה של NHS, קרן הבריאות ו-Wellcome Trust.