מחקר: כך הבינה המלאכותית מייצרת סטריאוטיפים על יהודים

מערכות בינה מלאכותית גנרטיבית, המשמשות כיום מאות מיליוני בני אדם ברחבי העולם, עשויות לשמר ולהפיץ ייצוגים סטריאוטיפיים של יהודים - גם כאשר הן אינן מפיקות תוכן אנטישמי מפורש. כך עולה ממחקר חדש של פרופ' מיכאל גלעד מבית הספר לפסיכולוגיה באוניברסיטת תל אביב וד"ר גל גוטמן מהפקולטה לניהול באוניברסיטת בן-גוריון בנגב. המחקר פורסם בכתב העת American Psychologist.
המחקר ביקש לבחון כיצד מיוצגים יהודים בתוך מודלי שפה מתקדמים, דוגמת ChatGPT, DeepSeek ו-Mistral. החוקרים הסבירו כי מודלים אלה מאומנים על כמויות עצומות של טקסטים שנכתבו על ידי בני אדם – ספרים, אתרי אינטרנט, מאמרים, רשתות חברתיות ותכנים נוספים - ולכן הם עשויים לשקף גם דפוסי חשיבה והטיות הקיימים בתרבות האנושית.
גלריה
(shutterstock)
כדי לחשוף הטיות סמויות, החוקרים פיתחו שיטה ייחודית. במקום לשאול את המודלים ישירות על יהודים, הם ביקשו מהם ליצור מאות ביוגרפיות קצרות של דמויות בעלות שמות יהודיים ולא-יהודיים. לאחר מכן הוסרו כל הסימנים המזהים - כולל השמות עצמם - והמודלים התבקשו להעריך את תכונות האישיות, המעמד החברתי והמאפיינים הפסיכולוגיים של הדמויות. כך ניתן היה לבחון אילו תכונות "הושתלו" מלכתחילה בדמויות רק בגלל השם שניתן להן. 
התוצאות היו עקביות: דמויות בעלות שמות יהודיים תוארו כחכמות יותר, יעילות יותר, אסרטיביות יותר ובעלות יכולות מנהיגות גבוהות יותר. במקביל הן נתפסו כפחות חביבות, פחות חמות מבחינה חברתית ויותר פריבילגיות ובעלות כוח והשפעה. כמו כן יוחסו להן נטיות גבוהות יותר לאובססיביות, סדר ושליטה עצמית.
שובר שורות ביציע. אוהדי מכבי ת"א עם שלט של וולטר וויט מהסדרה המצליחה, במשחק מול הפועל באר-שבע
(צילום: עוז מועלם )
לדברי החוקרים, הבעיה אינה נעוצה בכל אחת מהתכונות בפני עצמה. אינטליגנציה, יעילות או חשיבה לטווח ארוך הן כמובן תכונות חיוביות. אולם כאשר הן מופיעות יחד עם תפיסות של כוח, ריחוק חברתי, שליטה ונוקשות, הן יוצרות דמות סטריאוטיפית המזכירה ייצוגים אנטישמיים מוכרים מהעבר.
כדי להמחיש זאת, ביקשו החוקרים מהמודלים לתרגם את מכלול התכונות הללו לדמויות בדיוניות מוכרות. בין הדמויות שעלו שוב ושוב נמצאו שרלוק הולמס, ד"ר האוס, וולטר וייט מ"שובר שורות", טוני סטארק (איירון מן), מייקל קורליאונה מ"הסנדק" ודמויות נוספות המאופיינות באינטליגנציה יוצאת דופן, עצמאות קיצונית, מורכבות מוסרית ולעיתים גם ניכור חברתי.
פרופ' מיכאל גלעד
(צילום: אוניברסיטת תל אביב)
"הדמויות הללו אינן יהודיות, כמובן", מסביר פרופ' גלעד, "אבל הן מייצגות סטראוטיפ תרבותי מסוים: אדם מבריק, חזק, מחושב וממוקד מאוד במטרותיו, אך גם מרוחק חברתית ולעיתים נתפס כמי שפועל לפי כללים משלו. זהו בדיוק סוג הדימוי שהופיע כאשר המודלים התבקשו לתאר דמויות שנשאו שמות יהודיים".
החוקרים מסבירים כי אף אחת מהתכונות שנמצאו אינה אנטישמית בפני עצמה, אך כאשר הן מתלכדות לכדי וקטור תכונות משותף - אינטליגנציה, מסוגלות, אסרטיביות, דומיננטיות, שליטה עצמית, נטיות אובססיביות וריחוק חברתי - הן יוצרות ייצוג מורכב בעל שכבות של משמעות. ייצוג זה מתורגם לדמויות המאופיינות ביכולת גבוהה לצד נגישות רגשית נמוכה, כוח והשפעה חברתית, ובכך משקף מבנה עומק של סטריאוטיפים היסטוריים על יהודים.
הממצאים קיבלו חיזוק נוסף כאשר נבדקו הן באמצעות מודלי בינה מלאכותית אחרים והן באמצעות מאות משתתפים אנושיים מארצות הברית. גם בני אדם שקראו את הביוגרפיות, מבלי לדעת אם מקורן בשם יהודי או לא-יהודי, זיהו בהן דפוסים דומים.
ד"ר גל גוטמן
(צילום: נעם לוקר זומבק)
"מערכות בינה מלאכותית אינן מבטאות אנטישמיות במובן מכוון או מודע, אלא עשויות לשעתק דפוסי ייצוג וסטריאוטיפים תרבותיים שהוטמעו במאגרי המידע שעליהם אומנו", מסבירה ד"ר גוטמן. לדבריה, מערכות בינה מלאכותית משקפות במידה רבה את התכנים והמבנים התרבותיים הקיימים בחברה האנושית, ולכן הטיות היסטוריות אינן נעלמות אלא עשויות להשתמר ברמת מבנה העומק של הידע שהמודלים לומדים. ממצא חשוב במחקר הוא שהדפוסים הללו עשויים להופיע גם במודלים שעברו תהליכי alignment  והפחתת הטיות, כלומר גם כאשר קיימים מנגנונים שנועדו למנוע ביטויים פוגעניים או מפלים, חלק מן ההטיות עדיין עשוי להישמר.
החוקרים מדגישים כי ככל שבינה מלאכותית משתלבת בתחומים כמו חינוך, תעסוקה, שירות ציבורי וקבלת החלטות, חשוב לבחון לא רק ביטויי שנאה גלויים, אלא גם את ההנחות התרבותיות והסטריאוטיפים הסמויים שעלולים להיות מקודדים עמוק בתוך המערכות עצמן.