Search
Study: Comprehensive evaluation and performance analysis of machine learning in heart disease prediction. Image Credit: Summit Art Creations/Shutterstock.com

מודל למידת מכונה חדש משיג פריצת דרך בחיזוי מחלות לב עם דיוק של למעלה מ-95%.

במחקר שפורסם לאחרונה ב-Scientific Reports, חוקרים פיתחו מודל חיזוי מחלות לב מבוסס למידת מכונה (ML-HDPM) המשתמש בשילובים שונים של מידע ושיטות סיווג מוכרות רבות.

לימוד: הערכה מקיפה וניתוח ביצועים של למידת מכונה בחיזוי מחלות לב. קרדיט תמונה: Summit Art Creations/Shutterstock.com

רקע כללי

מחלות לב הן סיכון בריאותי עולמי שאנשי מקצוע בתחום הבריאות חייבים להעריך ולטפל בו באמצעות בדיקות רפואיות, טכניקות הדמיה מתקדמות והליכי אבחון. קידום שיטות בריאות לב ואבחון מוקדם יכול לעזור למזער את שכיחות מחלות לב וכלי דם ולשפר את הבריאות הכללית.

גישות נוכחיות כגון למידת מכונה, למידה עמוקה ואיסוף נתונים מבוסס-חיישנים מייצרות ממצאים מבטיחים אך יש להן מגבלות כגון דיוק אבחון לא אחיד והתאמת יתר.

הגישות המוצעות משתמשות בטכנולוגיה מודרנית וכוללות נהלי בחירה כדי לשפר את האבחנה והפרוגנוזה של מחלות לב.

לגבי המחקר

במחקר הנוכחי, החוקרים בנו את מודל ML-HDPM לחיזוי מחלות לב מדויקות.

החוקרים השתמשו במסד הנתונים של קליבלנד, במסד הנתונים של שוויץ, במסד הנתונים של לונג ביץ' ובמסד הנתונים של הונגריה כדי להשיג נתונים קרדיווסקולריים. הם עיבדו מראש נתונים קליניים ואחריהם בחירת תכונה, מיצוי תכונה, דגימת יתר מבוססת אשכולות וסיווג.

הם השתמשו בנתוני אימון כדי להתאים את המודל למערך התכונות, לחשב ציוני חשיבות ולהסיר את ציוני התכונות הנמוכים ביותר כדי להשיג את התכונה הרצויה.

האלגוריתם הגנטי (GA) כלל אתחול האוכלוסייה, בחירה, הצלבה ומוטציה כדי לקבוע אם קריטריון הסיום התקיים.

החוקרים דגמו מעט נתונים גולמיים עם תוויות רוב ודגימות מקובצות עם תוויות מיעוט כדי למזג את מערך ההדרכה ולבצע דגימת יתר סינתטית של מיעוטים (SMOTE) כדי ליצור פלט של המודל.

המודל בוחר תכונות רלוונטיות באמצעות שיטת ביטול תכונות רקורסיביות (RFEM) והאלגוריתם הגנטי (GA), המשפר את חוסנו של המודל. טכניקות כמו טכניקת תת-דגימת אשכולות יתר (USCOM) מתקנות חוסר איזון בנתונים.

משימת הסיווג משתמשת ברשתות עצביות קונבולוציוניות עמוקות רב-שכבתיות (MLDCNN) ובשיטת האופטימיזציה של עדר פילים אדפטיבית (AEHOM).

מסווג המודלים היו ניתוח רכיבים עיקריים (PCA), מכונת תמיכה וקטורית (SVM), ניתוח מבחין ליניארי (LDA), עץ החלטות (DT), יער אקראי (RF) ו-Bayes נאיבי (NB).

המודל משלב בחירת תכונות אינסופית מפוקחת עם אלגוריתם יער אקראי משוקלל משודרג. שלב העיבוד המקדים של ML-HDPM מבטיח שלמות הנתונים ויעילות המודל. מבחר תכונות נרחב חושף מאפיינים חשובים למידול חזוי.

טכניקה סקלרית משיגה אפקט תכונה עקבי, בעוד SMOTE מתקן חוסר איזון בכיתה. האלגוריתם הגנטי משתמש בעקרונות הברירה הטבעית כדי ליצור מספר פתרונות בדור אחד.

ביצועי האסטרטגיה מוערכים באמצעות בדיקות מדומה ומשווים למודלים קיימים. מערכי הנתונים של הבדיקות, ההדרכה והאימות כללו 80%, 10% ו-10% נתונים, בהתאמה.

תוצאות

ML-HDPM ביצע בצורה מרשימה במגוון רחב של קריטריונים להערכה קריטית, כפי שהוכח מהבדיקה המקיפה. באמצעות נתוני אימון, מודל ML-HDPM חזה מחלות לב וכלי דם עם 96% דיוק ודיוק של 95%.

רגישות המערכת (ריקול) הניבה 96% דיוק, בעוד שציוני F של 92% שיקפו את הביצועים המאוזנים שלה. הספציפיות של ML-HDPM של 90% ראויה לציון.

ML-HDPM מספק תוצאות מדויקות ואמינות. הוא משלב טכנולוגיות מורכבות כגון בחירת תכונות, איזון נתונים, למידה עמוקה ואופטימיזציה של עדרי פילים אדפטיבית (AEHOM). אסטרטגיות אלו מאפשרות למודל לחזות בצורה מהימנה מחלות לב, מה שמשפר את ההחלטות הקליניות ואת תוצאות המטופל.

ML-HDPM עולה על אלגוריתמים אחרים באימון (95%) ובבדיקות (88%). ההצלחה נובעת מהשילוב של מיצוי תכונות מורכבות, תיקוני חוסר איזון בנתונים ולמידת מכונה.

אלגוריתמים לבחירת תכונות מאפשרים למצוא איכויות משמעותיות הקשורות לבריאות הלב וכלי הדם, ומאפשרים להם לזהות דפוסים עדינים המעידים על מחלות לב וכלי דם.

תיקון נתונים באמצעות טכניקות יעילות לאיזון נתונים מבטיח הכשרת מודלים על מערכי נתונים מייצגים, כולל למידה עמוקה באמצעות גישת MLDCNN ואופטימיזציה של AEHOM לשיפור דיוק המודל.

ל-ML-HDPM, מודל למידה עמוקה, שיעורי חיובי-שגויים נמוכים יותר (FPR) באימון (8.20%) ובבדיקות (15%) מאשר בגישות אחרות, בשל בחירת תכונות, איזון נתונים ורכיבי למידת מכונה משופרים ב-ML-HDPM .

למודל היו שיעורים חיוביים אמיתיים (TPR) גבוהים במערך האימון (96%) ובבדיקות (91%) בשל זיהוי תכונות, איזון נתונים ושיפורי למידה עמוקה. הגישה משפרת את יכולת המודל לזהות נקודות חיוביות אמיתיות.

סיכום

המחקר מציג גישת ML-HDPM ייחודית המשלבת בחירת תכונות, איזון נתונים ולמידת מכונה לשיפור חיזוי מחלות לב וכלי דם.

ערכי F המאוזנים לדיוק וזיכרונות, שיעורי דיוק ודיוק גבוהים ושיעורי חיובי שווא נמוכים במערך הנתונים של האימון והבדיקה מדגישים את הפוטנציאל המבטיח של המודל ביישומי אבחון קרדיווסקולריים.

הממצאים מצביעים על כך שמודל ML-HDPM יכול להגביר את הדיוק והמהירות של זיהוי מחלות לב וכלי דם, ובכך לשפר את רמת הטיפול.

עם זאת, נדרשת חקירה נוספת כדי לשפר את אופטימיזציית המודל ואיכות הנתונים ולחקור את השימוש בו על ידי אנשי מקצוע בתחום הבריאות בסביבה אמיתית.

דילוג לתוכן