מדאגות לתסמינים בשעות הלילה המאוחרות ועד עזרה בפגישות ובניירת, המחקר הזה מראה כיצד אנשים פונים לצ'אטבוטים של AI עבור הרבה יותר מאשר עובדות בריאות פשוטות.
מחקר: שימוש ציבורי בצ'אטבוט LLM כללי לשאילתות בריאות. קרדיט תמונה: Azurhino / Shutterstock
במחקר שפורסם לאחרונה בכתב העת בריאות הטבעחוקרים במיקרוסופט AIרדמונד, וושינגטון, ארה"ב, ניתח יותר מ-500,000 שיחות לא מזוהות הקשורות לבריאות עם Microsoft Copilot כדי לאפיין את מה שאנשים שואלים על בריאות.
בריאות היא אחד מתחומי ההימור שעליהם אנשים שואלים בינה מלאכותית (AI) צ'אטבוטים. שיחה AIבמיוחד אלה המופעלים על ידי מודלים של שפות גדולות (לימודי תואר שני), כגון ChatGPT, Copilot ו-Gemini, משחקת תפקיד חשוב יותר ויותר עבור משתמשים רבים, החל מנקודת המגע הראשונה במהלך הופעת הסימפטומים ועד לשאלות על תרופות והבנת האינטראקציות עם אנשי מקצוע בתחום הבריאות ומערכת הבריאות. שיחה AI מייצג שינוי משמעותי באופן שבו בני אדם מתקשרים עם טכנולוגיה דיגיטלית ופלטפורמות מידע.
Copilot Health Query עיצוב מחקר
במחקר הנוכחי, חוקרים ניתחו שיחות הקשורות לבריאות באמצעות Microsoft Copilot כדי לאפיין את מה שאנשים שואלים על בריאות. מדגם אקראי של שיחות עם Copilot הוצא מדי יום בינואר 2026. לכל שיחה הוקצה נושא כללי, כוונה כללית וסיכום שמירה על הפרטיות, ושיחות שסווגו כ"בריאות וכושר" נכללו במחקר זה.
יתרה מכך, כל שיחה הוקצתה לאחת מ-12 קטגוריות הכוונה הבריאותית הכללית באמצעות LLMמסווג מבוסס. הבא, א LLMשיטת אשכול מבוססת יושמה על תת-מדגם אקראי של 10,000 שיחות. כל שיחה בתת-דגימה זו צוינה בתכונות נוספות. ה LLM קיבלו כ-250 סיכומי שיחה ותכונות וקיבוץ אותם לפי מסע משתמש.
מידע בריאותי וממצאי כוונות אישיות
בסך הכל, מערך הנתונים האנליטי כלל 617,827 שיחות שסווגו כבריאות וכושר. קטגוריית כוונת הבריאות הגדולה ביותר הייתה מידע בריאות וחינוך, המהווה כ-41% מהשיחות.
קטגוריה זו תפסה שאילתות בריאות שאינן מותאמות אישית, כולל מידע תזונתי כללי, גורמים למצבים רפואיים וכיצד תרופות פועלות. מכיוון שחלק מהשאילתות הכלליות עשויות לשקף חששות אישיים, החלק האמיתי של החששות האישיים עשוי להיות גבוה יותר, מה שהופך את השיעור המדווח לגבול נמוך יותר.
יתרה מכך, שאילתות רבות היו לגבי מצבים וטיפולים ספציפיים ולא מידע בריאותי כללי, מה שמצביע על כך שאנשים עשויים לחפש מידע בריאותי כללי לצורך קבלת החלטות אישית. שיחות בנייד היו נפוצות יותר בלילה, בעוד שהשיחות במחשב שולחני התרחשו בעיקר במהלך היום. חלוקת כוונות הבריאות הייתה שונה באופן משמעותי בין הפלטפורמות.

התפלגות השימוש בכוונות בריאות, באחוז השיחות.
סוג מכשיר ודפוסי זמן שימוש
לא כולל מידע בריאותי וחינוך, שהיוו כ-40% בשני סוגי המכשירים, דפוסי השימוש השתנו בין המכשירים. ההבדלים היו בולטים ביותר מבחינת הכוונה האישית והמקצועית. לדוגמה, תמיכה אקדמית ומחקר היוו 16.9% מהשיחות במחשב שולחני אך 5.3% בנייד, בעוד ששאלות סימפטומים וחששות בריאותיים היוו 15.9% בנייד אך 6.9% במחשבים שולחניים.
ריבוד של כוונות בריאות לפי שעה גילה ששימוש ב-Copilot במחשב שולחני התרחש לעתים קרובות לצד פעילויות אחרות, כגון מחקר, כתיבת תזה או ניירת. לדוגמה, שיחות הניירת הרפואית הגיעו לשיא במהלך שעות העבודה, בעוד אלו הקשורות לתמיכה אקדמית ומחקר גדלו לאורך היום, במיוחד לאחר שעות הלימודים/עבודה. יתרה מכך, הכוונות האישיות עלו בערב או בלילה, בעוד שהכוונות המלומדים פחתו.
המחברים ציינו, עם זאת, שהדפוסים הזמניים הללו התבססו על נתוני חתך ויכולים לשקף הבדלים במי שמשתמש בקופיילוט בשעות שונות של היום ולא בשינויים בתוך האדם בלבד.
שאילתות בריאות אישיות והשלכות ניווט לטיפול
לבסוף, הצוות חקר על מי היו שאילתות הבריאות לגבי שימוש בתת מדגם של 2,165 שיחות. מדגם משנה זה כלל שלוש כוונות אישיות: רווחה רגשית, שאלות תסמינים וחששות בריאותיים, ושאלות מידע על מצב וטיפול.
בכל קטגוריה, רוב השאלות היו על דאגות אישיות; עם זאת, 1 מתוך 7 שאילתות הייתה מטעם אחרים, כגון בן זוג, ילד או הורה, עבור שאלות תסמינים וקטגוריות מידע על מצב.
ביחד, הממצאים חושפים דפוסים ברורים של AI מעורבות לשיחות הקשורות לבריאות. שאילתות בריאות אישיות, במיוחד לגבי תסמינים ורווחה רגשית, גדלו בשעות הערב והלילה. דפוס זה של שאילתות רווחה עולה בקנה אחד עם מחקר קודם על קצב יומי בהשפעה שלילית, שבו ההשפעה השלילית נוטה להיות הנמוכה ביותר בבוקר ומתגברת לאורך היום, ומגיעה לשיא בשעות הלילה, אם כי המחקר לא הצליח לקבוע אם זה משקף רגשות משתנים אצל אותם משתמשים או הבדלים בין משתמשים פעילים בזמנים שונים.
כמעט חמישית מהשיחות כללו משתמשים שתיארו תסמינים אישיים, תוצאות בדיקות או מצבים. יתר על כן, דפוסי השימוש השתנו במידה ניכרת לפי סוג המכשיר. כוונות בריאות אישיות היו נפוצות יותר בנייד, בעוד שהשימוש במחשב שולחני כלל בעיקר תמיכה אקדמית, ניירת רפואית ומחקר.

אחוז השיחות על שלוש כוונות (שאלות סימפטומים, מידע על מצב ורווחה רגשית) הקשורות למשתמש, תלוי, אחר או לא ידוע.
המחקר מצא גם שמשתמשים רבים ביקשו מ-Copilot עזרה בניווט מערכות בריאות, כולל מציאת ספקים, הבנת הכיסוי וניהול פגישות או ניירת, מה שמרמז על כך שהשיחה AI משמש לטיפול בחיכוכים מנהליים כמו גם בשאלות בריאותיות.
למחקר מספר מגבלות; ראשית, הניתוח הסתמך אך ורק על יומני Copilot, המשקפים פלטפורמה והקשר ספציפי של משתמש.
שנית, המדגם כלל שיחות מחודש בודד; לפיכך, השפעות עונתיות עשויות להשפיע על התפלגות הכוונות.
שלישית, המחקר בדק רק שאילתות, לא תוצאות, ולפיכך, לא ניתן לקבוע אם משתמשים ביקשו טיפול אחר או שהמידע שהתקבל שיפר את קבלת ההחלטות שלהם.
מחקר עתידי צריך לכוון לקבוע אם מידע מסופק באמצעות שיחה AI למעשה עוזר למשתמשים.