חוקרים בתחומי מדעי המחשב ובריאות הנפש פיתחו אלגוריתם שמזהה את מצבם הנפשי של אנשים לפי סגנון הכתיבה שלהם. באמצעות שימוש בטכנולוגיות בינה מלאכותית - עיבוד שפה טבעית (NLP) ולמידה עמוקה (deep learning) - הצליחה המערכת לזהות 80% מהמקרים מתוך אוכלוסיית בני אדם הידועים כסובלים מדיכאון. המערכת מאתרת תבניות שפה שמאפיינות אנשים דיכאוניים באמצעות ניתוח כמות גדולה של טקסטים. הבעיה: המערכת אינה מסבירה את הממצאים שלה. כעת עסוקים החוקרים בניסיון לפענח את הממצאים.
במחקר לקחו חלק ד"ר יהונתן שלר ותלמידו גלעד גכט מהמחלקה למדעי המחשב במכון הטכנולוגי חולון (HIT) בשיתוף פעולה עם פרופ' מולי איירלנד וד"ר קייט נידרהופר מהמחלקה למדעי הפסיכולוגיה באוניברסיטת טק בטקסס.
3 צפייה בגלריה
גבר מול לפטופ
גבר מול לפטופ
לזהות דיכאון לפי הטקסטים שלך
(צילום: shutterstock)
"האלגוריתם שפיתחנו מנתח את סגנון הכתיבה של אדם ומעריך אם הוא נמצא בדיכאון", אומר שלר בשיחה עם ynet, "מדובר באנשים שפנו לעזרה בעניין תוכנה או בנושאים אחרים ואנחנו מזהים אם הם סובלים מדיכאון". לדבריו, מדובר בחלק ממחקר רחב יותר שמזהה מאפייני אדם מתוך סגנון הכתיבה שלו. במחקר קודם הצליחה הבינה המלאכותית לזהות טקסטים שנכתבו על ידי נשים או גברים, ויש אפשרות לזהות בכתיבה עוד מרכיבים אישיותיים רבים.
"במחקר הזה רצינו לבדוק אם אפשר לזהות את מצבו הנפשי של האדם. זה מקבל משנה חשיבות עכשיו, בעידן הקורונה, כשלא רואים את האנשים. פעם מורה פוגש בתלמידים, בעבודה היו רואים אותו הקולגות. היום הכלי של השפה הכתובה מקבל משנה חשיבות", אומר שלר.
3 צפייה בגלריה
אישה מבוגרת בוכה
אישה מבוגרת בוכה
אנשים בדיכאון מרוכזים בעצמם
(צילום: Shutterstock)
לצורך ביצוע המחקר החוקרים השתמשו באוסף של כ-300,000 פוסטים מהרשת החברתית Reddit, שנכתבו על ידי כ-12 אלף משתמשים לאורך כעשר שנים. מתוכם נבחרו 983 משתמשים שדיווחו בפורומים לייעוץ נפשי, שהם סובלים מדיכאון. אותם משתמשים העלו גם 2,981 פוסטים ניטרליים בנושאים שונים כמו בקשות תמיכה טכנית ועוד. החוקרים אימנו את הבינה המלאכותית עם הטקסטים האלה מול 2,822 טקסטים של 183 אנשים שלא דיווחו על דיכאון, במטרה לאפיין את התבניות הייחודיות לבעלי הדיכאון. בהמשך הציגו החוקרים למחשב לקט חדש ובלתי מוכר של טקסטים שנכתבו על ידי מדוכאים והוא הצליח לזהות מעל 80 אחוזים מהם.
אילו התבטאויות מאפיינות אנשים הסובלים מדיכאון?
"יש אצלם שימוש תכוף בגוף ראשון, כותבים ב'אני', זה לא אומר שכל טקסט בגוף ראשון מעיד על דיכאון אבל אני מבחין שאנשים בדיכאון יותר מרוכזים בעצמם והפריזמה שלהם יותר מצומצמת. יש יותר קללות בטקסטים שלהם, אולי כעס מסוים. יש שימוש בהווה, כלומר הם בתוך המצב שלהם".
אלה התבניות שמערכת הלמידה העמוקה זיהתה?
"ב-deep learning הבעיה יותר מורכבת כי אתה לא יודע לקרוא אותו, זו קופסה שחורה. הוא אומר לך בסוף העיבוד אם האדם בדיכאון או לא בדיכאון. קשה להבין את הלמידה העמוקה, זה תחום מחקרי בפני עצמו. לכן אנחנו מנסים להגיד מה אנחנו רואים בטקסטים האלה, יהיה קשה להתחבר לזה בלי שאבין מה שקורה אבל זה לא לגמרי ההסבר של איך המכונה עובדת".
הייתם יכולים לתקף את התוצאה על ידי בדיקה אם האנשים שאותרו אכן סובלים מדיכאון
"אנחנו מנסים לעשות מחקרים כאלה במקביל, אבל כמובן ששם כמויות הטקסטים הרבה יותר קטנות. הם מגיעים מאנשים שבאים לקליניקות או אנשים שמוכנים להשתתף במחקר כזה, ואלה כמויות הרבה יותר קטנות".
3 צפייה בגלריה
נער
נער
לזהות בני נוער שסובלים מבריונות וביוש ברשת
(צילום: shutterstock)
ד"ר שלר מוסיף: "אנחנו מאמינים שבעתיד יוכל המודל שבנינו, לצד מודלים דומים המזהים מצבים פסיכולוגיים אחרים, לשמש ככלי יעיל עבור אנשי מקצוע בתחום בריאות הנפש. בשלב זה אנו סבורים שהמודלים שלנו יכולים לקדם את המחקר התיאורטי במדעי ההתנהגות. בעתיד אנחנו מקווים לפתח כלי יישומי שיספק למטפלי הנפש תובנות פסיכולוגיות מאלגוריתמים של למידת מכונה". לדבריו, כעת עובדים החוקרים על מחקר רחב יותר עם אוכלוסיות נרחבות ושפות דיבור נוספות במטרה שבעתיד המערכת תוכל בעתיד לזהות אנשים שסבלו מבריונות, נטיות אובדניות והפרעות אחרות.
אתה רואה מצב שפייסבוק למשל תשתמש בכלי שלכם ותדווח לי שנמצאתי דיכאוני ועלי לפנות לטיפול?
"כנראה שלא נרצה ללכת לשם. אבל בתי ספר יוכלו לבקש מהתלמידים לכתוב חיבור, בהסכמת ההורים. אולי הורים יוכלו לאבחן את מצב הילד שלהם, מעין בדיקת דופק. ויש גם בעיה של עומס מאוד גדול במרפאות בריאות הנפש עם המתנה של שבועות וחודשים, אבל עם המערכת זאת, קופות החולים יוכלו לעשות בדיקה ראשונית, ולאתר את מי שצריך את הביקור בדחיפות יותר גדולה וזה יכול לעזור ולייעל את מערך הטיפול".
ד"ר שלר, מומחה לניתוח טקסטים באמצעות למידת מכונה ולמידה עמוקה, פיתח ויישם מודלים מסוג זה על מגוון רחב של טקסטים, ולצורך כך עבד בשיתוף עם חוקרים מתחומי מדעי הרוח, מדעי החברה ומדעי ההתנהגות. המחקרים, המשתייכים לתחומים חדשים הקרויים "מדעי הרוח דיגיטליים", "מדעי החברה דיגיטליים", "מדעי ההתנהגות הדיגיטליים", והם מתפרשים על מנעד רחב - מבניית תזאורוס רב-לשוני ל-2,000 שנה של טקסטים יהודיים ועד לזיהוי פרופילים מזויפים ברשתות החברתיות.

נמצאים במצבי מצוקה? צרו קשר: