Search
Study: Artificial intelligence–based assessment of built environment from Google Street View and coronary artery disease prevalence. Image Credit: yanto kw / Shutterstock

בינה מלאכותית מפענחת עיצובי עיר שיכולים להפחית את שיעורי מחלות הלב

במחקר שפורסם לאחרונה ב- יומן הלב האירופי, חוקרים השתמשו בטכניקות ובניתוחים חדישים של בינה מלאכותית (AI) כדי להעריך את הקשר בין 'מאפייני הסביבה הבנויה' שזוהו במודל AI לבין השונות הנצפית במחלת לב כלילית (CHD). באופן ספציפי, הצוות השתמש ברשתות עצביות קונבולוציוניות מותאמות אישית (CNNs), מודלים ליניאריים מעורבים (LMEM), ומפות הפעלה כדי לזהות אסוציאציות של תכונות הקשורות ל-CHD ולחזות תוצאות בריאותיות ברמת מערכת המפקד.

במחקר הראשון מסוגו, המחקר השתמש ביותר מ-0.53 מיליון Google Street View (GSV) להדרכה והערכה של מודלים, שתוצאותיו מצביעות על כך שאלגוריתמים של בינה מלאכותית יוכלו לעצב ערים עתידיות עם נטל CHD מופחת משמעותית.

מחקר: הערכה מבוססת בינה מלאכותית של סביבה בנויה מ-Google Street View ושכיחות של מחלות עורקים כליליים. קרדיט תמונה: yanto kw / Shutterstock

CHD, GSV והפוטנציאל לראיית מכונה בהערכות סביבות בנויות

מחלת לב כלילית (CHD), הידועה גם בשם מחלת עורקים כליליים (CAD), היא מחלה כרונית שעלולה לסכן חיים, שאינה מדבקת המאופיינת בשקיעת רובד לאורך דפנות העורקים הכליליים, ובכך מעכבת או חוסמת באופן מוחלט את התנועה של מחומצן. דם ללב. הצטברות זו היא בדרך כלל הדרגתית – היא עשויה להתחיל במהלך הילדות, להתקדם לאט, ולבסוף להתבטא כ-CHD בשלבי חיים מאוחרים יותר.

למרות עשרות שנים של מחקר והתקדמות מדעית משמעותית באיתור ומניעת סיכון ל-CHD, CHD נותר גורם מוביל לתמותה הקשורה למחלות לב, במיוחד בארצות הברית של אמריקה (ארה"ב), שם מוערך כי הוא מהווה הרבה יותר מ-50% מכלל התמותה הלבבית (~400,000 מקרי מוות ב-2020 בלבד). עדויות אחרונות מצביעות על כך שגורמי סיכון לא מסורתיים, כולל גזע, הכנסה, תרבות והשכלה, עשויים לשחק תפקיד עמוק בפתולוגיה של CHD.

גורמים סביבתיים כמו טמפרטורה וזיהום סביבתי (רעש ואוויר) היו מעורבים גם הם במחלה, אם כי עדויות להשערות אלה עדיין חסרות. מאגר בקנה מידה גדול של מאפיינים עירוניים 'בנויים' (בניינים, שטחים ירוקים וכבישים) יאפשר זיהוי סיכון CHD ספציפי למיקום ויהווה את הצעד הראשון בהתערבויות רפואיות מבוססות מדיניות.

"הערכה משולבת בקנה מידה גדול של הסביבה ברמת השכונה יכולה להקל על הערכה מהירה ומלאה של השפעתה על CHD. עם זאת, נתונים כאלה הם נדירים, בין השאר בגלל האופי היקר והגוזל של ביקורת שכונות ומדידות וסטנדרטים לא עקביים לאיסוף נתונים. גישות ראיית מכונה כגון Google Street View (GSV) הפכו לגישה פופולרית יותר ויותר עבור ביקורת שכונות וירטואלית מאז השקתה ב-2007."

Google Street View (GSV) היא טכנולוגיית הדמיה המופיעה ביישומי Google רבים, כולל מפות Google ו-Google Earth. הושק לראשונה בשנת 2007, מערך התמונות שמקורו בעיקר בהמון מציג תמונות פנורמה אינטראקטיביות של צילומי VR תפורים והשיג כמעט 100% כיסוי של ארה"ב. מחקר לא קשור המנצל את הפוטנציאל הבלתי מנוצל עד כה של GSV ביסס את הטכנולוגיה הדומה לאמיתות הקרקע האנושיות ברמת הדיוק, במיוחד כאשר משתמשים באלגוריתמים של למידת מכונה כדי לסווג ולהעריך תכונות סביבתיות בנויות מתמונות GSV.

לגבי המחקר

המחקר הנוכחי נועד להשתמש בתמונות GSV כדי להעריך סביבות בנויות בשבע ערים בארה"ב ולהשתמש בתוצאות אלו כדי להעריך את שכיחות CHD ברמת מערכת המפקד. הנתונים ברמת המפקד (לשנים 2015-16) התקבלו ממערכת מעקב גורמי הסיכון ההתנהגותית (BRFSS), שיתוף פעולה בין המרכז לבקרת ומניעת מחלות (CDC) לשנת 2018 ניתוח רמת אוכלוסיה ואומדני קהילה (PLACES) ו קרן רוברט ווד ג'ונסון. מערך הנתונים כלל מבוגרים אמריקאים (מעל 18 שנים) עם אנגינה או סטטוס CHD מאושר קלינית (חיובי או שלילי) מ-789 ערכות מפקד ברחבי Bellevue, WA; בראונסוויל, טקסס; קליבלנד, אוהיו; דנבר, CO; דטרויט, MI; פרמונט, קליפורניה; וקנזס סיטי, KS.

הנתונים שנאספו כחלק ממחקר זה כללו גורמים דמוגרפיים וסוציו-אקונומיים (DSE; גיל, גזע, מין, רמת השכלה, הכנסה ועיסוק) והיסטוריה רפואית שלא זוהו. מערך התמונות כלל יותר מ-0.53 מיליון תמונות משרת ה-GSV, מה שהותיר את סיווג התמונות של גוגל ללא פגע. תארו לעצמכם חילוץ הנתונים בוצע באמצעות CNN עמוק (DCNN) בשם Places365CNN, מחלץ ברירת המחדל של מסד הנתונים של המקומות. בהתחשב בדמיון בין סיווג תכונות התמונות של GSV ו-Places, נמצא כי Places365CNN עמיד עבור מיצוי נתוני מחקר נוכחיים לאחר אימון באמצעות יותר מ-10 מיליון תמונות אימון.

כדי לחקור את הקשרים בין מאפיינים גולמיים שחולצו DCNN (N = 4096) לבין שכיחות CHD ברמת מערכת הערוצים, חוקרים אימנו ובדקו שלושה מודלים של למידת מכונה עצמאית (ML), כלומר הרגרסטור האקסטרה-עצים (ET), הרגרסטור האקראי של היער (RF). ), ו-Regressor Machine עם חיזוק שיפוע האור (LGBM). כדי לשפר את דיוק הניבוי של המודלים ולהביא לחוסן, כל שלושת המודלים עברו אימות צולב פי 10. לאחר אימון מודלים, בוצעו ניתוחי רגרסיה רב-שכבתיים תוך שימוש גם בהשפעות קבועות ליניאריות וגם במודלים של אפקטים אקראיים עם משתנים מותאמים לגיל, מין, הכנסה, גזע ורמת השכלה.

"…השתמשנו בטכניקת Grad-CAM כדי ליצור את מפת הבולטות כדי להדגיש את התכונות הבולטות הללו בתמונות ה-GSV המקוריות. תהליך זה מספק הסברים מסוימים לגבי המאפיינים הסביבתיים ש-CNN חושב שקשורים לשכיחות CHD בשכונה."

ממצאי מחקר והשקפות

נמצא כי השכיחות הגיאוגרפית של CHD שונה באופן מהותי, כאשר Bellevue הציגה אחוז שכיחות חציוני של 4.70 בעוד שקליבלנד הייתה גבוהה בהרבה ב-8.70. נמצא כי תכונות שחולצו על ידי DCNN מכילות יותר מ-4,096 תכונות מסווגות ב-ML. גולת הכותרת של עבודה זו היא שהתכונות שחולצו לבדן הצליחו להסביר 63% מהשונות הבין-אזורית שנצפתה בשכיחות CHD.

"מצאנו מספר קטן של ערכים קיצוניים שזכו לזלזל על ידי המודלים במערכות מפקד מסוימות של דטרויט וקליבלנד. שכיחות ה-CHD של ערכי מפקד אוכלוסין לא מוערכים אלה הייתה לעתים קרובות יותר מ-12%. כשבדקנו את התכונות שחולצו על ידי CNN באמצעות t-SNE, שמנו לב להתקבצות של ערכות מפקד עם ערכים דומים של שכיחות CHD."

מודלים רב-שכבתיים גילו כי גורמי DSE (במיוחד גיל, מין ומצב השכלה) נמצאו כמנבאים מדויקים יותר של CHD מאשר תכונות GSV. תוצאות אלו מצביעות על כך שלמרות שתכונות GSV אכן עשויות להועיל בהדגשת מידע ספציפי על הסביבה הבנויה הקשורה לשכיחות CHD ברמת השכונה, נדרש חישוב נוסף (למשל, שיטות Grad-CAM) לפני שניתן יהיה להשתמש בטכנולוגיה כדי לספק דרך פוטנציאלית של זיהוי מידע על הסביבה הבנויה.

"תוצאות המחקר שלנו מספקות הוכחה לקונספט לזיהוי מאופשר ראיית מכונה של תכונות רשת עירוניות הקשורות לסיכון, שבאופן עקרוני עשויות לאפשר זיהוי מהיר והתערבויות מיקוד בשכונות בסיכון כדי להפחית את העומס הקרדיווסקולרי."

דילוג לתוכן