כמעט מחצית ממכשירי AI רפואיים שאושרו על ידי ה-FDA חסרים נתוני אימות קליני

05:21
, 27 אוגוסט 2024
, בריאות ורפואה

לבינה מלאכותית (AI) יש יישומים כמעט בלתי מוגבלים בתחום הבריאות, החל משרטוט אוטומטי של הודעות מטופלים ב-MyChart ועד לאופטימיזציה של השתלת איברים ושיפור דיוק הסרת הגידול. למרות התועלת הפוטנציאלית שלהם לרופאים ולמטופלים כאחד, כלים אלה נתקלו בספקנות בגלל חששות לפרטיות המטופלים, האפשרות של הטיה ודיוק המכשיר.

בתגובה לשימוש ואישור המתפתחים במהירות של מכשירים רפואיים בינה מלאכותית בתחום הבריאות, צוות רב-מוסדי של חוקרים בבית הספר לרפואה של UNC, אוניברסיטת דיוק, בנק אלי, אוניברסיטת אוקספורד, אוניברסיטת קולומביה ואוניברסיטת מיאמי. המשימה לבנות אמון הציבור ולהעריך כיצד בדיוק AI וטכנולוגיות אלגוריתמיות מאושרות לשימוש בטיפול בחולים.

יחד, סמי צ'ופאני אל פאסי, מועמדת ל-MD בבית הספר לרפואה של UNC וחוקר מחקר במרכז Duke Heart, וגייל א. הנדרסון, PhD, פרופסור במחלקה לרפואה חברתית של UNC, הובילו ניתוח יסודי של נתוני אימות קליני עבור 500+ מכשירי בינה מלאכותית רפואית, חושפים שכמחצית מהכלים שאושרו על ידי מינהל המזון והתרופות האמריקאי (FDA) חסרו נתוני אימות קליני מדווחים. הממצאים שלהם פורסמו ב רפואת טבע.

למרות שיצרני מכשירי בינה מלאכותית מתהדרים באמינות הטכנולוגיה שלהם עם אישור ה-FDA, אישור לא אומר שהמכשירים הוערכו כראוי לגבי יעילות קלינית תוך שימוש בנתוני מטופל אמיתיים. עם הממצאים הללו, אנו מקווים לעודד את ה-FDA והתעשייה להגביר את האמינות של אישור מכשיר על ידי ביצוע מחקרי אימות קליני על טכנולוגיות אלו והפיכת תוצאות מחקרים כאלה לזמינות לציבור."

Chouffani El Fassi, המחבר הראשון על הנייר

מאז 2016, המספר הממוצע של הרשאות מכשירי בינה מלאכותית רפואית על ידי ה-FDA בשנה גדל מ-2 ל-69, מה שמעיד על צמיחה אדירה במסחור של טכנולוגיות רפואיות בינה מלאכותית. רוב הטכנולוגיות הרפואיות המאושרות של AI משמשות כדי לסייע לרופאים באבחון חריגות בדמיון רדיולוגי, ניתוח שקופיות פתולוגיות, מינון רפואה וחיזוי התקדמות המחלה.

בינה מלאכותית מסוגלת ללמוד ולבצע פונקציות דומות לאדם על ידי שימוש בשילובים של אלגוריתמים. לאחר מכן ניתנת לטכנולוגיה שפע של נתונים ומערכות כללים שיש לפעול לפיהן, כדי שהיא תוכל "ללמוד" כיצד לזהות דפוסים ומערכות יחסים בקלות. משם, יצרני המכשירים צריכים להבטיח שהטכנולוגיה לא רק תשנן את הנתונים ששימשו בעבר לאימון ה-AI, ושהיא יכולה להפיק תוצאות במדויק באמצעות פתרונות שטרם נראו.

רגולציה במהלך התפשטות מהירה של מכשירים רפואיים בינה מלאכותית

בעקבות התפשטותם המהירה של מכשירים ויישומים אלה ל-FDA, Chouffani El Fassi והנדרסון וחב'. היו סקרנים לגבי מידת היעילות והבטיחות הקלינית של המכשירים המורשים. הצוות שלהם ניתח את כל ההגשות הזמינות במסד הנתונים הרשמי של ה-FDA, שכותרתו "התקנים רפואיים התומכים בבינה מלאכותית ולמידת מכונה (AI/ML).

"הרבה מהמכשירים שיצאו אחרי 2016 נוצרו חדשים, או אולי הם היו דומים למוצר שכבר היה בשוק", אמר הנדרסון. "באמצעות מאות המכשירים האלה במסד הנתונים הזה, רצינו לקבוע מה זה באמת אומר שמכשיר רפואי בינה מלאכותית מקבל אישור FDA."

מתוך 521 הרשאות המכשירים, 144 תויגו כ"אומתו בדיעבד", 148 "אומתו באופן פרוספקטיבי" ו-22 אושרו באמצעות ניסויים מבוקרים אקראיים. בעיקר, ל-226 מתוך 521 מכשירים רפואיים שאושרו על ידי ה-FDA, או כ-43%, חסרו נתוני אימות קליני שפורסמו. חלק מהמכשירים השתמשו ב"תמונות פנטום" או תמונות שנוצרו על ידי מחשב שלא היו ממטופל אמיתי, שלא עמדו מבחינה טכנית בדרישות לאימות קליני.

יתר על כן, החוקרים מצאו כי טיוטת ההנחיה האחרונה, שפורסמה על ידי ה-FDA בספטמבר 2023, אינה מבחינה בבירור בין סוגים שונים של מחקרי אימות קליני בהמלצותיה ליצרנים.

סוגי תיקוף קליני ותקן חדש

בתחום האימות הקליני, קיימות שלוש שיטות שונות שבאמצעותן חוקרים ויצרני מכשירים מאמתים את הדיוק של הטכנולוגיות שלהם: אימות רטרוספקטיבי, אימות פרוספקטיבי ותת-קבוצה של אימות פרוספקטיבי הנקרא ניסויים מבוקרים אקראיים.

אימות רטרוספקטיבי כולל הזנת נתוני תמונה של מודל AI מהעבר, כגון צילומי חזה של חולה לפני מגיפת COVID-19. עם זאת, אימות פרוספקטיבי מייצר בדרך כלל ראיות מדעיות חזקות יותר מכיוון שמכשיר הבינה המלאכותית עובר אימות על סמך נתונים בזמן אמת של מטופלים. זה מציאותי יותר, לדברי החוקרים, מכיוון שהוא מאפשר ל-AI לקחת בחשבון משתני נתונים שלא היו קיימים כאשר הוא אומן, כגון צילומי חזה של חולים שהושפעו מווירוסים במהלך מגיפת ה-COVID.

ניסויים מבוקרים אקראיים נחשבים לתקן הזהב לאימות קליני. סוג זה של מחקר פרוספקטיבי משתמש בבקרות הקצאה אקראיות למשתנים מבלבלים שיבדו בין קבוצות הניסוי והביקורת, ובכך מבודדים את ההשפעה הטיפולית של המכשיר. לדוגמה, חוקרים יכולים להעריך את ביצועי המכשיר על ידי הקצאה אקראית של חולים לקריאת סריקות ה-CT שלהם על ידי רדיולוג (קבוצת ביקורת) לעומת AI (קבוצת ניסוי).

מכיוון שמחקרים רטרוספקטיביים, מחקרים פרוספקטיביים וניסויים מבוקרים אקראיים מייצרים רמות שונות של ראיות מדעיות, החוקרים המעורבים במחקר ממליצים שה-FDA ויצרני המכשירים יבחינו בבירור בין סוגים שונים של מחקרי אימות קליני בהמלצותיו ליצרנים.

אצלם רפואת טבע פרסום, Chouffani El Fassi and Henderson et al. הגדר הגדרות לשיטות האימות הקליני שיכולות לשמש כסטנדרט בתחום הבינה המלאכותית הרפואית.

"שיתפנו את הממצאים שלנו עם מנהלים ב-FDA שמפקחים על רגולציה של מכשור רפואי, ואנו מצפים שהעבודה שלנו תודיע על קבלת ההחלטות הרגולטוריות שלהם", אמר צ'ופאני אל פאסי. "אנו גם מקווים שהפרסום שלנו יהווה השראה לחוקרים ואוניברסיטאות ברחבי העולם לבצע מחקרי אימות קליני על בינה מלאכותית רפואית כדי לשפר את הבטיחות והיעילות של הטכנולוגיות הללו. אנו מצפים להשפעה החיובית שתהיה לפרויקט הזה על הטיפול בחולים בכללותו סוּלָם."

אלגוריתמים יכולים להציל חיים

Chouffani El Fassi עובד כעת עם מנתחי לב-חזה של UNC, אורלי מרלו ובנג'מין האית'קוק, כמו גם עם צוות ההנהגה המנהלת של UNC Health כדי ליישם אלגוריתם במערכת רישום הבריאות האלקטרונית שלהם, הממכן את תהליך ההערכה וההפניה של תורמי האיברים.

בניגוד לייצור המהיר בתחום של מכשירי בינה מלאכותית, לרפואה חסרים אלגוריתמים בסיסיים, כמו תוכנות מחשב המאבחנות מטופלים באמצעות ערכי מעבדה פשוטים בתיעוד רפואי אלקטרוני. Chouffani El Fassi אומר שזה בגלל שהיישום הוא לעתים קרובות יקר ודורש צוותים בינתחומיים שיש להם מומחיות הן ברפואה והן במדעי המחשב.

למרות האתגר, UNC Health נמצאת במשימה לשפר את מרחב השתלות האיברים.

"למצוא תורם איברים פוטנציאלי, להעריך את האיברים שלו, ואז לקבל את ארגון רכש האיברים להיכנס ולרכז השתלת איברים זה תהליך ארוך ומסובך", אמר צ'ופאני אל פאסי. "אם אלגוריתם המחשב הבסיסי הזה יעבוד, נוכל לייעל את תהליך תרומת האיברים. תורם אחד נוסף פירושו ניצלו מספר חיים. עם סף כה נמוך להצלחה, אנו מצפים לתת ליותר אנשים הזדמנות שנייה בחיים".

ניקולס וינשטיין

ניקולס וינשטיין הוא העורך הראשי של אתר Datilin.