Search
Study: A deep learning-based model to estimate pulmonary function from chest x-rays: multi-institutional model development and validation study in Japan. Image Credit: sopa phetcharat/Shutterstock.com

מודל AI מעריך במדויק את תפקוד הריאתי מצילומי רנטגן של החזה

במחקר שפורסם לאחרונה ב ה-Lancet Digital Healthקבוצת חוקרים העריכה את היכולת החיונית המאולצת (FVC) (סך האוויר הננשף לאחר הנשימה העמוקה ביותר) ונפח הנשיפה המאולץ תוך שנייה אחת (FEV1) (אוויר נשוף בשנייה הראשונה של נשימה מאולצת) מצילומי חזה באמצעות מודל מבוסס למידה עמוקה.

לימוד: מודל מבוסס למידה עמוקה להערכת תפקוד ריאתי מצילומי חזה: פיתוח ומחקר אימות מודל רב-מוסדי ביפן. קרדיט תמונה: sopa phetcharat/Shutterstock.com

רקע כללי

בדיקת תפקוד ריאתי, מודדת בעיקר FVC ו-FEV1 עם ספירומטריה, חיוני לאבחון וניהול ליקויים בדרכי הנשימה כמו מחלת ריאות חסימתית כרונית (COPD) (מחלת ריאות כרונית הגורמת לזרימת אוויר חסימה) ואסטמה.

מאז כניסתה הקלינית בשנת 1846, ספירומטריה הייתה קריטית, אך היא עלולה להיות מאתגרת עבור מבוגרים וילדים צעירים, והשימוש בה היה מוגבל במהלך מגיפת מחלת הקורונה 2019 (COVID-19).

צילומי רנטגן של החזה, בשימוש נרחב ומתואמים לתפקוד ריאתי, מציעים גישה חלופית. דרוש מחקר נוסף כדי לשפר שיטות להערכת תפקוד ריאתי במסגרות קליניות מגוונות ובאוכלוסיות חולים.

לגבי המחקר

המחקר הרטרוספקטיבי אסף צילומי חזה ונתוני ספירומטריה מחמישה מוסדות יפניים בין ה-1 ביולי 2003 ל-31 בדצמבר 2021. המחקר, שאושר על ידי מועצת האתיקה של אוניברסיטת אוסקה מטרופוליטן, ויתר על הסכמה מדעת שכן הנתונים הושגו במהלך השגרה פרקטיקה קלינית.

נתוני ספירומטריה סומנו עם FVC ו-FEV1 נעשה שימוש בערכים, ובצילומי חזה שנלקחו תוך 14 ימים מהספירומטריה. הנתונים חולקו למערכי נתונים של הכשרה, תיקוף ובדיקות פנימיות משלושה מוסדות (AC), ולמערכי נתונים חיצוניים של בדיקות משני המוסדות הנותרים (D ו-E).

מודל הבינה המלאכותית (AI), באמצעות Convolutional Neural Network Next (ConvNeXt) ושני מסווגים, הוכשר עם פונקציות אובדן ורזולוציות תמונה שונות, והדגם בעל הביצועים הטובים ביותר נבחר באמצעות מסגרת Python Torch (PyTorch).

הביצועים הוערכו על ידי חישוב מקדם המתאם של פירסון (r), מקדם המתאם תוך-מחלקה (ICC), שגיאת בסיס מרובע ממוצעת (RMSE), שגיאת ריבוע ממוצעת (MSE) ושגיאה ממוצעת (MAE) בין ערכי ספירומטריה חזויים וממשיים.

מפות בולטות שנוצרו באמצעות SHapley Additive ExPlanations (SHAP) הדגישו אזורים חשובים לתחזיות, שנבדקו על ידי רדיולוגים עצמאיים.

ניתוחים סטטיסטיים בוצעו באמצעות SciPy ב-Python, עם רווחי סמך של 99% שנאמדו באמצעות אתחול. המחקר התמקד בביצועים של מודל הבינה המלאכותית ולא בהשוואות של ערך p.

תוצאות המחקר

בסך הכל נכללו באנליזה 141,734 זוגות תואמי רנטגן וספירומטריה מ-81,902 מטופלים. מערכי הנתונים של ההדרכה, האימות והבדיקות הפנימיות כללו 134,307 צילומי רנטגן מ-75,768 מטופלים, עם חלוקה שווה של 50% נשים ו-50% גברים (גיל ממוצע 56 שנים, SD 18).

מערך ההדרכה כלל 108,366 צילומי רנטגן מ-61,009 מטופלים (50% נשים, גיל ממוצע 54 שנים, SD 17), בעוד שמערך האימות כלל 13,180 צילומי רנטגן מ-7,381 מטופלים (50% נשים, גיל ממוצע 54 שנים, SD 17) . במערך הבדיקה הפנימי היו 12,761 צילומי רנטגן מ-7,378 מטופלים (50% נשים, גיל ממוצע 54 שנים, SD 17).

מערכי נתונים חיצוניים של בדיקות כללו 2,137 צילומי רנטגן מ-1,861 מטופלים במוסד D (40% נשים, גיל ממוצע 65 שנים, SD 17) ו-5,290 צילומי רנטגן מ-4,273 מטופלים במוסד E (46% נשים, גיל ממוצע 63 שנים, SD 17 ).

נתוני גזע ומוצא אתני לא היו זמינים. המודל בעל הביצועים הטובים ביותר השתמש בפונקציית אובדן RMSE של 0.39 ובגודל תמונה של 1024 פיקסלים ב-182 עידנים.

עבור קביעת FVC באמצעות מערכי נתונים חיצוניים של בדיקות, למוסד D היה ערך r של 0.91 (99% CI 0.90-0.92), ולמוסד E היה ערך r של 0.90 (99% CI 0.89-0.91). ערכי ICC היו 0.91 ו-0.89, בהתאמה, ערכי MSE היו 0.17 L², ערכי RMSE היו 0.41 L, וערכי MAE היו 0.31 L.

עבור FEV1 קביעה, למוסד D היה ערך r של 0.91 (99% CI 0.90-0.92) ולמוסד E היה גם ערך r של 0.91. ערכי ICC היו 0.90 עבור שני המוסדות, ערכי MSE היו 0.13 L² ו-0.11 L², ערכי RMSE היו 0.37 L ו-0.33 L, וערכי MAE היו 0.28 L ו-0.25 L, בהתאמה.

לחולים עם COPD היו ערכי r של 0.81 עבור FVC ו-0.83 עבור FEV1 במוסדות D ו-E. לחולים עם אסתמה היו ערכי r של 0.89 עבור FVC ו-0.90 עבור FEV1.

השטח מתחת לעקומת ההפעלה האופיינית של המקלט לסיווג FVC של פחות מ-80% החזוי היה 0.88 עבור מוסד D ו-0.85 עבור מוסד E; עבור FEV1 פחות מ-80% חזו, זה היה 0.87 עבור שני המוסדות; ועבור FEV1יחס /FVC נמוך מ-70%, הוא היה 0.83 למוסד D ו-0.87 למוסד E.

מפות בולטות ממוצעות הראו שמודל הבינה המלאכותית התמקד בעיקר באזורי ריאות, נותן משקל נמוך יותר לשדות ריאות היקפיים ומשקל גבוה יותר לשדות ריאות מרכזיים.

רדיולוגים זיהו מאפיינים הקשורים לירידה ב-FEV1כגון היפר-אינפלציה בריאות ועיבוי דופן הסימפונות, ומאפיינים הקשורים לירידה ב-FVC, כולל אובדן נפח ריאות וצללים רשתיים בפריפריה.

מסקנות

לסיכום, מודל זה, המנבא תפקוד ריאתי ללא השתתפות פעילה של המטופל, הראה מתאמים חזקים (ערכי r של 0.91) הדומים לאלו ממחקרי טומוגרפיה ממוחשבת של החזה (CT).

רדיולוגים זיהו היפר-אינפלציה בריאות ועיבוי דופן הסימפונות כמאפיינים הקשורים לירידה ב-FEV1בעוד אובדן נפח ריאות וצללים רשתיים היו קשורים לירידה ב-FVC.

המודל יכול להשלים ספירומטריה, במיוחד עבור חולים שאינם מסוגלים לבצע ספירומטריה ולשפר את דיוק האבחון על ידי מתן הערכות תפקוד ריאתי מצילומי חזה שגרתיים.

דילוג לתוכן