שתף קטע נבחר

ללמד את המחשבים לדבר

השפות האנושיות התפתחו באמצעות שורה ארוכה של כללים ותהליכים שעדיין לא מובנים לחלוטין למדע ומפתיעים את החוקרים. האם נוכל ללמד את המחשבים שלנו להשתמש בכללי שפה דומים, לצורך עבודה יעילה יותר?

עבור מושג חדש נדרשת מלה חדשה. לפעמים מוכתבת המלה על ידי גורם אחד, וכל שאר המשתמשים בשפה מקבלים תכתיב זה; כך עשוי לקרות בהקשרים מדעיים או הנדסיים, בפעולת גופים כמו האקדמיה ללשון וכו', כמו גם בשאיפה של פרסומאים ליצור מלה חדשה שתיכנס לסלנג ותקושר למוצר שהם מוכרים.

 

במקרים אחרים, עם הופעת דבר-מה שאינו מתאים למילים קיימות, מופיעות כמה מילים שונות המועמדות להיות השם של אותו מושג. בדרך כלל יהיה קשה להתחקות אחרי מקורן וממציאיהן של מילים אלו, אבל לאחר זמן קצר בצורה מפתיעה תגבר מלה אחת על האחרות ותהפוך להיות, לפחות דה-פקטו, השם היחיד המקובל בשפה. הדבר המרשים והמפתיע בתהליך זה הוא ההצלחה שלו לבחור "מנצח" אחד ללא כל סמכות מרכזית המכתיבה את הבחירה.

 

מחקרים בלשניים רבים עקבו אחר תופעות אלו, כמו אחר תופעות רחבות יותר - למשל, הופעת שפות וניבים חדשים - אך במאמר זה נתרכז בניסיון לחקות תהליכים אלה כדי לפתור בעיות מעשיות בעולם פשוט הרבה יותר מהעולם של השפות האנושיות - העולם של "רובוטים", בין אם הם בעלי קיום פיזי וכוללים חומרה ותוכנה, ובין אם הקיום שלהם הוא וירטואלי, כתוכנה בתוך רשתות מחשבים. בכל מקרה, יש סיבות רבות ליצור יחידות רבות בעלות תפקוד עצמאי המשתפות פעולה לצורך השגת מטרה. יחידות כאלו נקראות "סוכנים" (ראו: "דבר עם הסוכן שלי").

 

דוגמה אחת לצורך ביצירה עצמאית של מונחים המשותפים לסוכנים רבים היא בפעולה של "נחיל" של רובוטים: קבוצה של רובוטים הנעים בסביבה לא מוכרת ומשתפים פעולה כדי לחקור אותה. בסיטואציה כזו נוצר צורך לתת שם לאובייקטים המתגלים בסביבה הנחקרת, לתופעות החוזרות על עצמן בכמה מקומות וכו'. כך, לדוגמה, נתנו מדעני NASA שמות לסלעים וגבעות שנחקרו על ידי כלי הרכב הנעים על פני מאדים, לתצורות מינרלים מיוחדות וכו'. בלי שמות אלה יהיה קשה לדון בממצאים או לתכנן פעילויות. בעתיד יבוצעו משימות כאלו בצורה עצמאית הרבה יותר, כך שרובוטים שונים יחליפו ביניהם מידע ויבחרו מטרות מחקר, והם יזדקקו לדרך כלשהי ליצור "מילון" משותף עבור מושגים וחפצים שמתכנניהם לא יכלו לצפות מראש.

 

קרוב יותר למקום ולזמן שלנו, אנו רואים כבר תוכנות עצמאיות המשתפות פעולה בתחומים כמו מסחר אלקטרוני, שיתוף מידע, "כריית נתונים" (Data mining - חיפוש תבניות החוזרות על עצמן בתוך הררי מידע כדי לעזור למחקר, שיווק או גילוי תרמיות) ועוד. אחד האתגרים העומדים בפני בוני התוכנות היא הגדרת השפה שבה יתקשרו ביניהם סוכנים אלה. כיום אפשר למצוא שפות סינתטיות, וגופים המגדירים שפות נוספות, כמעט בכל תחום. בין מאות השפות שכבר קיימות אפשר למצוא הגדרות עבור דיווחי מס, אבטחה, תבואה, נדל"ן, ביוכימיה, פיננסים, שחמט, שירותי בריאות, ספרי טלפון ועוד - והרשימה גדלה והולכת בקצב מתגבר.

 

מאמץ אנושי רב מושקע ביצירת שפות אלו, בהגעה להסכמה כללית ובניסיון להגן על האינטרסים של כל הגופים המעורבים. ברגע שנוצרו השפות, הן סטטיות במידה רבה: כדי להתאים אותן לצרכים חדשים, יש לכנס שוב את הוועדה שהגדירה אותן. מאמצים אלה מושקעים כי בלעדיהם יואט מאוד השילוב בין פעילויות של גופים שונים, מה שיגרום לבזבוז כספים ולהחמצת הזדמנויות. מה היה קורה לו היו התוכנות שלנו יוצרות את השפות באופן אוטומטי?

 

גישושים ראשונים

 

כאשר מנסים להגיע לפריצת דרך כל כך משמעותית, כדאי לנסות להציב מטרה פחות שאפתנית ולחקור איך ניתן להגיע אליה. דרך אחת לעשות זאת היא ליצור "עולם" מופשט שבו קיימים סוכנים (אלמנטים עצמאיים של תוכנה), שכל מטרתם היא לתקשר ביניהם בעזרת זיהוי חד-משמעי של האובייקט שאליו הם מתייחסים. תיאור אחד של עולם כזה אפשר למצוא במאמר משותף של חוקרים מאוניברסיטת רומא וממעבדת מדעי המחשב של סוני בפאריס. זהו עולם "משחק השמות". הסוכנים "נולדים" עם מילון ריק - לא ידוע להם שם עבור אף אובייקט.

 

בכל סיבוב של המשחק, נבחרים אקראית סוכן "דובר", סוכן "מאזין" ואובייקט כלשהו בעולם. אם הדובר אינו מכיר שם עבור האובייקט, הוא יבחר שם אקראי (משהו כמו "AAGH"). אם ידוע לו שם אחד, הוא "יאמר" את השם - כלומר ישלח את השם אל המאזין. כפי שנראה בהמשך, ייתכן שלדובר, כמו גם למאזין, יהיו ידועים כמה שמות אפשריים עבור האובייקט. במקרה זה יבחר הדובר אקראית אחד מהשמות.

 

המאזין יודע איזה אובייקט נבחר (כאילו ראה את הדובר מצביע על אותו אובייקט), וגם לו עשויים להיות ידועים שם אחד או יותר עבור אותו אובייקט. הוא בודק האם השם שאמר הדובר נמצא בין השמות הידועים לו. אם כן, סיבוב זה במשחק נחשב כהצלחה, ושני הסוכנים - הדובר והמאזין - שומרים לעצמם את השם שנאמר בתור השם היחיד של האובייקט. משמעות הדבר שהם מוחקים את כל השמות האחרים שהיו ידועים להם עבורו. אם המאזין אינו מזהה את השם כשייך לאובייקט שנבחר, הסיבוב נחשב ככישלון, והמאזין מוסיף את השם שנאמר לרשימת השמות שהוא משייך לאותו אובייקט.

 

מובן כי הסיבובים הראשונים יהיו ברובם כישלונות, כי רבים מהדוברים עדיין לא מכירים שם כלשהו לאובייקטים הנבחרים. בהמשך עשויים עדיין להיות כישלונות, מכיוון שלאותו אובייקט "הומצאו" שמות שונים על ידי דוברים שונים. מחוקי המשחק נובע כי הצלחות מקטינות את מספר השמות הידועים באוכלוסייה, בעוד כישלונות מעלים מספר זה. אנו מעוניינים להגיע למצב בו לכל האוכלוסייה ידוע שם אחד בלבד, המשותף לכולם, עבור כל אובייקט. במצב זה כל משחק יהיה הצלחה, והשפה תפסיק להתפתח עד אשר יופיע אובייקט חדש בסביבתם של הסוכנים. התוצאה, המפתיעה במידת מה, היא כי האוכלוסייה תמיד תגיע למצב זה. באנלוגיה לעולם האמיתי, נוכל לומר כי ללא כל שליטה מרכזית, פיתחה אוכלוסיית הסוכנים מילון של שמות עבור כל נושאי השיחה שלהם, ודבר זה נעשה בתהליך פשוט וזול מאוד מבחינה חישובית.

 

המאמר המתואר כאן אינו הראשון העוסק בתהליכים כאלה. ייחודו של המאמר הוא בניתוח מתמטי מפורט של הקצב שבו תתייצב כל האוכלוסייה על שפה אחידה, ותלותו של קצב זה בגודל האוכלוסייה. ממצאים אלה חשובים עבור מימוש מעשי, והם מראים כי התייצבות כזו היא מספיק מהירה אפילו עבור מספר גדול של סוכנים: תכונה שתהיה חשובה כאשר נרצה להפעיל סוכנים כאלה, למשל, עבור כל מי שמעורב במסחר אלקטרוני בתחום מסויים, ללא המאמץ הארוך של ועדות תקינה המגדירות את השפה שבה יתקשרו ביניהם הסוכנים.

 

מודלים ריאליסטיים יותר

 

המודל שבו עסקנו פשטני למדי. אחד מחסרונותיו הבולטים הוא ההנחה כי שני הסוכנים יכולים להעביר ביניהם בדרך כלשהי את המידע על איזה אובייקט הם מדברים - כאילו היו מורה ותלמיד, והמורה מצביע על אובייקט כלשהו ואומר את שמו. הבעיה אינה נעוצה בכך שיכולת זו הופכת את נתינת השם למיותרת - אפשר להניח כי "ההצבעה" על האובייקט היא יקרה ואיטית, ולכן כדאי להשתמש בה רק בשלב יצירת השפה המשותפת. החיסרון הוא אחר: לא תמיד קיים אובייקט מוחשי שעליו אפשר להצביע. אולי זו אחת הסיבות לכך שבלמידת שפה אנושית, לעיתים קרובות אין הצבעה חד-משמעית, וה"תלמיד" נאלץ להסיק - לא תמיד בהצלחה - על מה דיבר המורה.

 

בעיה קשה יותר, הקשורה לבעיה זו, היא הבעיה הידועה לפילוסופים כבעיית הקטגוריות: לא כל מלה מתייחסת לאובייקט ספציפי אחד. המלה "כיסא", למשל, מציינת אוסף גדול של עצמים, וגבולותיה לא יהיו מוסכמים על כל המשתמשים בשפה (הגבולות גם תלויים במידה רבה בהקשר של השיחה הספציפית): האם כיסא בובה הוא כיסא? מה לגבי כיסא שבור? איך לומד ילד שכבר יודע לזהות כיסא-מטבח בעל ארבע רגליים כי גם כיסא מסתובב בעל רגל אחת שייך לאותה קטגוריה?

 

עבור אתגרים אלה נבנו עולמות ותהליכים מורכבים יותר מאשר "משחק השמות", אם גם פשוטים הרבה יותר מהעולם האמיתי. בין העבודות הרבות בתחום זה אפשר למצוא כאלה המתמודדות עם הסקה מתוך ההקשר של האובייקט שאליו התכוון הדובר; התמודדות עם מצבים בהם יש מספר מילים לכל אובייקט ומספר אובייקטים שאליהם מתייחסת כל מלה; וסימולציות של שינויים דינמיים של השפה עקב הופעת סוכנים חדשים, בעלי מילון שמות אחר, בתוך האוכלוסייה.

 

עד כמה רלוונטיות עבודות אלו לחקר האופן בו נוצרו השפות האנושיות והאופן שבו הן מתפתחות כיום? המודלים שלהן רחוקים מאוד גם מהאתגרים איתם מתמודדים דוברים אנושיים וגם מהידוע לנו על למידת שפה אצל ילדים או על הופעת שפות וניבים חדשים. עם זאת, חלק מההתנהגות הנצפית במודלים כאלה תואמת תוצאות אמפיריות מהמחקר הבלשני - כמו למשל ההתפלגות המספרית של שכיחות המילים האלטרנטיביות עבור אותו מושג.

 

לפי פרופ' ג'יימס הורפורד, מהיחידה למחקר אבולוציוני וחישובי של שפות באוניברסיטת אדינבורג, אין בכך מקריות: לדעתו, מודלים כאלו מצליחים לחקות אלמנטים משמעותיים בהיסטוריה ובהתפתחות של השפות האנושיות, למרות שהם עדיין אינם יכול להסביר את יצירת המבנים העשירים של השפה. הורפורד ואחרים מקווים להרחיב את המודל מעבר לתחום הלקסיקון, למשל לכיוון של יצירת דקדוק משותף.

 

בספר בראשית, פרק י"א, בסיפור מגדל בבל, מתואר איך הופיעו השפות השונות מתוך "שפה אחת ודברים אחדים" שדיברו צאצאי נוח. המחקרים שהוזכרו ברשימה זו רומזים כיצד יכול לקרות התהליך ההפוך: יצירת שפה משותפת עבור כלי תוכנה ורובוטים עצמאיים, שבה יוכלו להעביר ביניהם מידע על נושאים שיוצריהם מעולם לא חזו.

 

לפנייה לכתב/ת
 תגובה חדשה
הצג:
אזהרה:
פעולה זו תמחק את התגובה שהתחלת להקליד
צילום: סי די בנק
האם נוכל ללמד את הרובוטים לדבר? (אילוסטרציה)
צילום: סי די בנק
מומלצים