AI מראה הבטחה לניבוי בריאות עוברית ללא בדיקות פולשניות

18:06
, 30 אוקטובר 2024
, בריאות ורפואה

סקירה זו מעריכה את היכולת של AI להעריך את בריאות העובר על ידי ניתוח תמונות כדי לחזות מצבי כרומוזומים ללא שיטות פולשניות, ומציעה התקדמות פוטנציאלית בהקרנת IVF לא פולשנית.

לִלמוֹד: חיזוי לא פולשני של פלואידיה עוברית אנושית באמצעות בינה מלאכותית: סקירה שיטתית ומטה-אנליזה. קרדיט תמונה: Krakenimages.com / Shutterstock.com

במחקר שפורסם לאחרונה ב eClinicalMedicineחוקרים מעריכים את היעילות של אלגוריתמים של בינה מלאכותית (AI) בחיזוי לא פולשני של פלואיד עוברי מתמונות עובריות.

כיצד מזוהה אנופלואידיה עוברית?

אנופלואידיה עוברית מוגדרת כספירת כרומוזומים לא תקינה המהווה גורם מוביל לכישלון ההשתלה, אובדן הריון ומומים מולדים.

ב בַּמַבחֵנָה הפריה (IVF), שיעורי האנופלואידיה נעים בין 25% ל-40% בעוברים בשלב מוקדם, כאשר השכיחות שלו עולה עם גיל האם. למרות שבדיקה גנטית טרום השרשה לאנופלואידית (PGT-A), טכניקה המבוססת על ביופסיה, משפרת את תוצאות הפריה חוץ גופית על ידי קביעת פלואיד העובר, היא יקרה, פולשנית ומוגבלת על ידי מגבלות אתיות וחוקיות, ובכך מגבילה את הנגישות שלה.

בינה מלאכותית, באמצעות למידת מכונה ומודלים של למידה עמוקה, הראתה פוטנציאל בחיזוי מדוייק של פלואיד העובר. עם זאת, דרוש מחקר נוסף כדי לשפר את המהימנות הניבוי ואת הישימות הקלינית של שיטות אלה.

לגבי המחקר

המחקר הנוכחי נרשם ב-International Prospective Register of Systematic Reviews (PROSPERO), עקב אחר פריטי דיווח מועדפים עבור סקירות ומטא-ניתוחים שיטתיים (PRISMA) ו-Critical Appraisal and Extraction Data for Systematic Review of Prediction Modeling Studies (CHARMS).

חיפושי ספרות מקיפים נערכו ברחבי Publisher Medline (PubMed), ניתוח ומערכת אחזור של ספרות רפואית מקוונת (MEDLINE), Excerpta Medica Database (שגרירות), המכון למהנדסי חשמל ואלקטרוניקה (IEEE), SCOPUS, Web of Science ומרכז Cochrane רישום מאגרי מידע. חיפוש זה זיהה מחקרים על אלגוריתמים של בינה מלאכותית שפותחו כדי להעריך פלואידית עוברית אנושית מהדמיה רפואית.

אסטרטגיית החיפוש כללה מונחים עבור AI, בדיקות גנטיות וחריגות כרומוזומליות. מחקרים שפורסמו עד 10 באוגוסט 2024 היו כשירים אם הם דיווחו על תוצאות אבחנתיות כגון רגישות, ספציפיות וערכים ניבויים או שהכילו נתוני מגירה רלוונטיים 2×2.

מאמרים הוקרנו על ידי שני סוקרים בלתי תלויים, עם אחזור טקסט מלא והתייעצות עם סוקר שלישי במקרה של אי התאמה. מחקרים חסרי מודלים של AI או כאלה שהשתמשו בדגימות לא אנושיות, כפילויות וסוגי פרסומים שונים, כגון מאמרי מערכת, לא נכללו בניתוח.

שני סוקרים חילצו נתונים באופן שיטתי באמצעות טופס סטנדרטי כדי להבטיח דיוק. מדדי אבחון כמו רגישות וסגוליות חושבו מטבלאות מגירה כאשר הם זמינים.

הערכת איכות נערכה באמצעות הערכת איכות של מחקרי דיוק אבחנתיים עבור קריטריונים של בינה מלאכותית (QUADAS-AI), והטיות פוטנציאליות וישימות הוערכו, כאשר כל ההבדלים נפתרו על ידי סוקר שלישי. מדדי תוצאה ראשוניים הכוללים רגישות (Se), ספציפיות (Sp) והשטח מתחת לעקומה (AUC) נותחו באמצעות עקומות אופייניות של מקלט היררכי ומודל אפקטים אקראיים דו-משתנים.

ההטרוגניות נחקרה באמצעות מטה-רגרסיה, כאשר גורמים כמו סוג האלגוריתם והמיקום הגיאוגרפי הוערכו. עלילת המשפך של Deek העריכה הטיית פרסום, בעוד שניתוחי תת-קבוצות זיהו מקורות הטרוגניות נוספים, כגון סוג מודל AI, שיטת הערות וסיכון להטיה.

ממצאי המחקר

החיפוש הראשוני הניב 4,774 רשומות, מהן הוסרו 1,543 כפילויות. כותרות ההקרנה והתקצירים לא כללו 2,837 מחקרים, מה שמותיר 65 מחקרים לסקירת טקסט מלא.

בסופו של דבר, 20 מחקרים עמדו בקריטריונים של הכללה, 12 מהם סיפקו נתונים מספיקים למטא-אנליזה. 16 מהמחקרים הללו היו רטרוספקטיביים, שניים היו פרוספקטיביים עם הערכת מודל AI כפול סמיות, ושניים לא ציינו עיצוב מחקר. אף אחד מהמחקרים לא השתמש בתמונות בגישה פתוחה, בעוד שמונה מחקרים לא כללו תמונות באיכות נמוכה, ו-12 לא התייחסו לגורם זה.

אימות חיצוני עם מערכי נתונים שאינם מדגמים בוצע בשבעה מחקרים. עשרה מחקרים השתמשו בלמידה עמוקה (DL), חמישה השתמשו בלימוד מכונה (ML), וחמישה השתמשו בשתי השיטות.

מערכות תמיכת החלטות מונעות בינה מלאכותית (DSS) סווגו לקטגוריות שחורות, מט וזכוכית בארבעה, חמישה וחמישה מחקרים, בהתאמה. ארבעה מחקרים השתמשו בדגמי קופסא שחורה או מט, בעוד שניים השתמשו בקופסה מט או קופסת זכוכית.

ביצועי האבחון המשולבים של אלגוריתמי AI הראו Se של 0.67, Sp של 0.58 ו-AUC של 0.67. בחירת טבלאות המגירה ברמת הדיוק הגבוהה ביותר במחקרים שיפרה את Se ו-Sp ל-0.71 ו-0.75, בהתאמה, עם AUC של 0.80. ניתוח תועלת קליני באמצעות נומוגרמה של Fagan קבע ערך ניבוי חיובי של 71% וערך ניבוי שלילי של 75%, בהנחה של 46% שכיחות של עוברים אופלואידים.

איכות המחקר הוערכה באמצעות הכלי QUADAS-AI, שהצביע על סיכון גבוה או לא ברור להטיה בבחירת מטופלים עבור 19 מחקרים, בעיקר עקב נתונים מוגבלים בקוד פתוח והיעדר אימות חיצוני קפדני. ניתוח הטרוגניות גילה שונות משמעותית, עם מדד אי עקביות (I²) של 97.7% עבור Se ו-92.2% עבור Sp. אפקט סף תרם להטרוגניות זו, עם וריאציות של ערכי חיתוך אבחנתיים עבור עוברים אופלואידים.

מטא-רגרסיה זיהתה גורמים המשפיעים על ההטרוגניות, כולל סוג אלגוריתם בינה מלאכותית, קטגוריית DSS, שיטת ביאור, אימות חיצוני, סיכון הטיה, גיל האם, גודל המדגם ושנת פרסום. Se ו-Sp היו בקורלציה שלילית, אשר נצפה לעתים קרובות במחקרי דיוק אבחון. עלילת המשפך של דיק לא הראתה עדות להטיה בפרסום.

ניתוחי תת-קבוצות הצביעו על כך שלמודלים של DL היה AUC גבוה יותר ממודלים של ML, ב-0.71 ו-0.63, בהתאמה. מחקרים ששילבו הן תמונה והן נתונים קליניים הראו ביצועים משופרים, עם AUC של 0.71 לעומת 0.62.

אימות חיצוני, סיכון נמוך יותר להטיה, הכללת גיל האם וגדלים גדולים יותר של מדגם השפיעו לטובה על תוצאות המודל. מחקרים חדשים יותר היו קשורים גם לספציפיות ו-AUC גבוהים יותר, ובכך הדגימו שיפורים ברמת הדיוק של מודל AI לאורך זמן.

מסקנות

למרות ש-PGT-A נמצא בשימוש נרחב לשיפור תוצאות ההריון על ידי זיהוי הפרעות כרומוזומליות, הפולשניות שלו מגבירה את הסיכון לסיבוכים מסוימים, כולל רעלת הריון ושליה, עם יתרונות מוגבלים בהריון או בשיעורי לידות חי. לפיכך, חיוני לפתח שיטות חיזוי פלואידי אמינות ולא פולשניות.

ל-AI, שכבר מיושמת בתחומים קליניים שונים, יש פוטנציאל לתמוך בהערכות עוברים ברבייה בסיוע. עם זאת, מודלים קיימים של AI לחיזוי פלואידיות חסרים את הדיוק הנדרש להחלפת PGT-A והם צריכים לשמש ככלי תמיכה לבחירת עוברים.

ניקולס וינשטיין

ניקולס וינשטיין הוא העורך הראשי של אתר Datilin.