Search
Study: Elevated body temperature is associated with depressive symptoms: results from the TemPredict Study. Image Credit: RossHelen / Shutterstock

מחקר טלדרמטולוגיה חושף פערים באבחון גוון העור, AI מציע שיפור

במחקר שפורסם לאחרונה בכתב העת Nature Medicine, חוקרים בדקו את יכולתם של רופאים מומחים וכלליים לאבחן מחלות עור על פני גוון העור במצב מדומה של טלדרמטולוגיה.

גישות מבוססות למידה עמוקה לאבחון מבוסס תמונה יכולות לשפר החלטות קליניות, אך יעילותן אינה ידועה עקב טעויות שיטתיות, במיוחד בהערכת קבוצות מיוצגות חסרות. העתיד של למידת מכונה ברפואה עשוי לכלול שיתופי פעולה בין רופא למכונה, עם ממשקים ספציפיים לתחום המבוססים על מודלים של למידת מכונה המסייעים לידע קליני ביצירת אבחנות מדויקות יותר. הכרה של מומחים היא קריטית לעקוף המלצות אוטומטיות. מחקר ראשוני על טלדרמטולוגיה של אחסנה והלאה מגלה שמערכות למידה עמוקה יכולות לשפר את דיוק האבחון הכללי, אך עדיין קיימות אי ודאות לגבי ביצועים על פני מומחיות רופאים וקבוצות שאינן מיוצגות.

מחקר: טמפרטורת גוף מוגברת קשורה לתסמיני דיכאון: תוצאות ממחקר TemPredict. קרדיט תמונה: RossHelen / Shutterstock

לגבי המחקר

במחקר הנוכחי, חוקרים ביצעו אנליזה דיגיטלית עם 389 רופאי עור מוסמכים (BCDs) ו-459 רופאים ראשוניים (PCPs) מ-39 מדינות כדי להעריך את הדיוק האבחוני של האבחנה שסופקו על ידי רופאים כלליים ומומחים בסימולציות טלדרמטולוגיה.

המחקר כלל 364 תמונות של 46 הפרעות דרמטולוגיות וביקש מהמשתתפים להגיש לכל היותר ארבע אבחנות מבדלת. רוב התמונות ייצגו שמונה מחלות עור נפוצות יחסית. הצוות גייס מספר משתתפים רופאים ותכנן את המחקר כדי להסתמך על תובנות חשובות מאסטרטגיות gamification כגון משוב, תגמולים, תחרות וחוקים ברורים. הם גילו מרחב עיצובי שניתן לשכפל הכולל גווני עור שונים, הפרעות עור, ידע של רופא, שיתופי פעולה בין רופא למכונה, דיוק סיוע להחלטה קלינית ועיצובי ממשק משתמש.

החוקרים מדדו דיוק אבחון ללא ובעזרת בינה מלאכותית על פני גווני עור כהים ובהירים ועקבו אחר טכניקות אודיטציה אלגוריתמיות. הצוות התמקד במחלות עור בהתבסס על שלושה קריטריונים: (i) שלושה רופאי עור מוסמכים רופאים זיהו את המחלות הללו כמחלות הסבירות ביותר שבהן הצוות עשוי למצוא פערי דיוק בין גווני העור של המטופלים; (ii) מחלות אלו שכיחות יחסית; ו-(iii) מחלות אלו מופיעות בתדירות מספקת בספרי לימוד לרפואת עור ובאטלס תמונות לרפואת עור, כך שהצוות יוכל לבחור לפחות חמש תמונות של שני סוגי העור הכהים ביותר לאחר הגשת בקשה לבדיקת בקרת איכות על ידי רופאי עור מוסמכים.

כדי להציע תחזיות מבוססות ראייה ממוחשבת של אבחנות, הצוות אימן רשת עצבית קונבולוציונית לסווג תשע תוויות: שמונה מחלות העור המעניינות וקטגוריה נוספת. החוקרים כיוונו את המודל על 31,219 תמונות מגוונות של דרמטולוגיה קלינית מתוך מערך הנתונים של Fitzpatrick 17k ותמונות נוספות שהתקבלו מספרי לימוד, אטלסים לרפואת עור וממנועי חיפוש מקוונים. הצוות השווה את מערכת ה-DLS לביצועי רופא באבחון מחלות עור באמצעות ארכיטקטורת VGG-16 המכווננת היטב על 31,219 תמונות דרמטולוגיות קליניות.

תוצאות

רופאים כלליים ומומחים השיגו דיוק אבחוני של 19% ו-38%, בהתאמה, והראו דיוק נמוך בארבעה אחוזים לאבחונים בקרב כהי עור מאשר בהיר עור. תמיכת החלטות מבוססת למידה עמוקה שיפרה את דיוק האבחון של רופאים במעל 33%, אך הרחיבה את הפערים בדיוק האבחוני של רופאים כלליים על פני גווני עור שונים.

הדיוקים הגבוהים ביותר של רופאים כלליים, רופאים ראשוניים, רופאי עור ורופאי עור מוסמכים היו 18%, 19%, 36% ו-38%, בהתאמה, בתמונות (לא כולל תמונות בדיקת קשב) ו-16%, 17%, 35% ו-37%, בהתאמה, עבור צילומים המציינים את שמונה מחלות העור העיקריות שנחקרו. האבחנה הקלינית המובילה שזוהתה לרוב עבור התמונות על ידי PCPs ו-BCDs הייתה נכונה ב-33% ו-48% מהתצפיות, בהתאמה.

ב-77.0% מהתמונות, BCD אחד או יותר זיהה תוויות ייחוס באבחנות מבדלת, בעוד ש-PCP אחד או יותר עשו זאת ב-58%. לאחר שראינו אומדן DLS מדויק, BCD אחד או יותר כללו תוויות התייחסות באבחנות מבדלת ב-98.0% מהתמונות. בכל התמונות, המשתתפים זיהו הפרעות בעור כהה יותר (חזוי FST 5.0 ו-6.0) עם דיוק נמוך יותר מאלה בעור בהיר יותר.

בבחינת קטגוריות רופאים באופן עצמאי, הדיוקים המובילים של רופאי עור מוסמכים, רופאי עור, רופאים ראשוניים ורופאים אחרים היו נמוכים בחמישה אחוזים, חמישה אחוזים, שלושה אחוזים וחמישה אחוזים עבור תמונות עור כהות יותר מאלו של עור בהיר יותר, בהתאמה. כמו כן, דיוק האבחון הגבוה ביותר של רופאי עור מוסמכים, רופאי עור, רופאים ראשוניים ורופאים אחרים הופחת בשלושה נקודות, חמישה אחוזים, ארבעה אחוזים וארבעה אחוזים עבור תמונות של עור כהה לעומת עור בהיר יותר. , בהתאמה. BCDs היו בסיכון גבוה ב-4.4 נקודות אחוז להמליץ ​​על חולים עם עור כהה לרופא עור לקבלת חוות דעת שנייה.

ממצאי המחקר הראו כי תמיכת החלטות המבוססת על למידה עמוקה יכולה להגביר את דיוק האבחון של הרופאים במצבי טלדרמטולוגיה. ל-BCDs היה דיוק אבחון מוביל של 38%, ואילו ל-PCP היה 19%. הממצאים עולים בקנה אחד עם מחקרים קודמים המצביעים על כך שמומחים עולים על ביצועים כלליים באבחון מחלות עור, אך הדיוק נמוך יותר מאשר במחקרים קודמים. דיוק האבחון של מומחים וכלליסטים היה גרוע יותר בתמונות כהות עור בהשוואה לבעלי עור בהיר. BCDs ו-PCPs הפגינו 4 נקודות אחוז טוב יותר בתמונות עור בהיר מאשר בעור כהה. תמיכה מבוססת-DLS בהחלטה מוגברת של דיוק האבחון העליון ב-33% עבור BCDs ו-69% עבור PCPs, וכתוצאה מכך רגישות רבה יותר בעת זיהוי הפרעות עור מסוימות.

דילוג לתוכן