הכניסה למכונות אסורה

כיצד ניתן לזהות מתי מכונות מזדהות לבני אדם, ולחסום את גישתן? אילו כלים מדעיים מאפשרים לאתרי אינטרנט להתגונן מפני תוכנות רישום המוניות ואוטומטיות? ומדוע משימות פשוטות לאדם - קשות ביותר למחשב?

ישראל בנימיני, גלילאו פורסם: 18.03.04, 10:45

כאשר נרשמים לשירות הדואר האלקטרוני של יאהו!, אחד הצעדים הנדרשים בתהליך הוא "ווידוא מילה": האתר מציג למשתמש מילה מטושטשת במקצת ומבקש מהנרשם לשירות לקרוא את המלה ולהקליד אותה. רק אם המלה הוקלדה נכון יוכל לקבל חשבון דוא"ל (דואר אלקטרוני).

תהליך זה נראה מוזר, אך מטרתו לוודא כי הנרשם לשירות הוא אדם ולא מכונה. אנשי יאהו מפעילים שיטה זו בניסיון להילחם באחת המחלות הקשות של האינטרנט המודרני - דואר הזבל. ככל שבעיית דואר הזבל מחמירה, מתרבים אמצעי ההגנה נגדה, ואלה מתבטאים בין השאר בחסימת חשבונות דוא"ל שמהם נשלחו ההודעות.

לכן, מפיצי דואר זבל זקוקים להרבה כתובות דואל שונות. גם כאן באה הטכנולוגיה המודרנית לעזרת המפיץ: קל לכתוב תוכנה הניגשת לאתר האינטרנט של יאהו (או כל ספק דואל אחר), ממלאת אוטומטית את טפסי ההרשמה, ומקבלת חשבון דואל חדש במקום הישן שנחסם. תוכנה כזו יכולה ליצור אלפי חשבונות שונים בלחיצת כפתור אחת.

איך יכול אתר אינטרנט לדעת אם "המשתמש" הניגש אליו הוא אדם או מכונה המתחזה לאדם? כאשר הביסו אנשי יפתח הגלעדי את שבט אפרים (שופטים, פרק י"ב), הם היו זקוקים לדרך לזהות את פליטי הקרב, והשתמשו בעובדה כי האפרתים אינם יכולים לבטא ש' ימנית כבמלה "שיבולת". מפעילי יאהו חיפשו מטלה שמחשבים אינם מסוגלים לבצע. זוהי מטרת אתגר "וידוא המילה". מתברר כי קשה לכתוב תוכנת מחשב המצליחה לקרוא טקסט, אם הטקסט שובש במתכוון על ידי הוספת "רעש", עיוותים, ורקע מבלבל.

מבחן טיורינג ההפוך

ב-1950 כתב המתמטיקאי ומפענח-הצפנים אלן טיורינג (Turing) את אחד מהמאמרים המשפיעים ביותר בתולדות מדעי המחשב: "מכונות חישוב ואינטליגנציה". במאמר זה הוא הציע את "מבחן טיורינג". וריאציה פשוטה של המבחן כוללת שופט אנושי בחדר אחד, ואדם או מחשב בחדר שני. השופט יכול לתקשר עם החדר השני דרך הודעות כתובות. מטרת השופט להחליט אם בחדר זה נמצא אדם או מחשב; אם לעיתים קרובות יזהה השופט בטעות מחשב כאילו היה אדם, אומר טיורינג, אין מנוס מההכרזה כי מחשב זה יכול באמת לחשוב.

המבחן של יאהו הוא סוג של מבחן "טיורינג הפוך". כאן השופט הוא מכונה (המחשבים של יאהו), ומטרתו להחליט אם הנרשם לשירות הוא מכונה. מכונה ניתנת לזיהוי על ידי אי יכולתה לעמוד במטלות קוגניטיביות מסויימות. נזכיר כמה שימושים אחרים למבחן כזה: אחת הדרכים הפשוטות ביותר לפרוץ למחשב המוגן על ידי סיסמה הוא ניסיונות חוזרים ונשנים לנחש את הסיסמה. אנשים רבים בוחרים מילה או שם ידוע כסיסמתם, כך שמספר האפשרויות הוא לכל היותר כמה עשרות-אלפים.

קל לכתוב תוכנה שתנסה אפשרויות אלו בזו אחר זו. בעולם אבטחת התוכנה, תהליך כזה נקרא "התקפת מילון". אם נמנע ממכונה מלנסות להיכנס, נוכל לגרום להתקפה כזו להיות הרבה יותר יקרה ולכן פחות מעשית וכדאית.

קשה למחשב, קל לאדם

מכאן ניתן להסיק את התכונות הדרושות ממבחן "טיורינג הפוך": ראשית, המבחן חייב להציג אתגר קל לביצוע בזמן קצר על ידי רובם הגדול של בני האדם, אך אינו ניתן לפתרון על ידי תוכנה. שנית, על תוצאות המבחן להיות ניתנות לבדיקה על ידי מחשב. שלישית, מחשב צריך להיות מסוגל לייצר מספר בלתי-מוגבל של מבחנים כאלה - אם מספר המבחנים יהיה מוגבל, יהיה ניתן להציג את כל המבחנים לפותר אנושי, וללמד תוכנה להתאים כל מבחן לפתרון שנתן אותו פותר.

איך מתבצע המבחן באתר יאהו? עבור כל תהליך רישום, נוצרת תמונה שונה על ידי התהליך הבא: בתחילה נבחרת מילה אקראית מתוך רשימה של כמה אלפי מילים אפשריות. למילה נבחר מיקום אקראי בתוך התמונה. לאחר מכן נבחרת סידרה של עיוותים, טשטושים והטעיות: למשל, עיוות המילה “border” בצירוף הטעייה של קו אלכסוני כהה ו"משחקי צבע" ברקע. המשתמש האנושי מקליד את המילה שקרא, והמחשב של יאהו משווה זיהוי זה למילה המקורית שנבחרה. בכך, המבחן עומד בתנאים של ייצור ממוחשב של מספר בלתי-מוגבל של מבחנים (צירופים אקראיים של בחירת מילה, מיקום וטשטושים), ושל בדיקה אוטומטית של תוצאת המבחן.

כדי להבטיח כי תהליך זה אכן יוצר תמונות הניתנות לפיענוח, יוצרים מפתחי המבחן מבחר גדול של תמונות שונות ומציגים אותם לדגימה מייצגת של "נבחנים". אם אחוז גבוה מאוד של התמונות מובנות לקוראים אנושיים, אפשר תמיד להתגבר על אותו מספר קטן של מילים שאולי יעוותו יתר על המידה: המשתמש יכול לבקש תמונה אחרת (באתר אינטרנט, מספיק ללחוץ על כפתור "רענן דף" כדי לקבל תמונה חדשה).

הבעיה: אנשים עם מגבלות

נעיר כאן כי קיימת קבוצת אנשים שאינה מסוגלת לעבור מבחן זה: אנשים בעלי ראייה מוגבלת, המשתמשים במחשב נעזרים בכלי תוכנה הקוראים להם את המוצג על המסך. אותו קושי המונע ממחשב לפענח את התמונה מונע גם מכלי עזר אלה מלקרוא את המלה המוטמנת בה. ייתכן כי גם דיסלקטים יחושו בקושי דומה.

יאהו מודעים לבעיה זו, ומציעים למי שאינו יכול לפתור את המבחן דרך חלופית לרישום, דרך תקשורת עם אנשי תמיכה ביאהו, אך ברור כי המבחן מקשה עוד יותר על בעלי מוגבלויות כאלו. קשה לומר אם המבחן אכן מקטין את כמות דואר הזבל, ואם ירידה זו מצדיקה את הפגיעה בנגישות. כדי להמעיט בפגיעה זו, אפשר להציע מבחן אלטרנטיבי המבוסס על שמיעה במקום ראייה: הקראת מלה תוך עיוות הצליל.

מנקודת המבט של הבינה המלאכותית, החלק המעניין הוא קלות הקריאה על ידי האדם מול הקושי בקריאה על ידי מחשב. אמנם, תוכנות "זיהוי אופטי של אותיות", OCR (ראשי תיבות של Optical Character Recognition) נמצאות כיום בשימוש נרחב, אך אלו אינן יכולות לקרוא את המילים בגלל העיוותים והטשטושים. חלק מהמאפיינים שעליהם נשען תהליך ה-OCR נמחק במתכוון - גם המהלך של מציאת מלבן ה"חשוד" במציאות אות בתוכו מוכשל על ידי עיוות גיאומטרי, קווים מטעים, ו"רעש"

איך מתגבר האדם בקלות כה רבה על קשיים אלה? פרטים רבים עדיין חסרים בהבנתנו של תהליך הראייה האנושי, אך ידוע כי תהליך זה נשען על שיתוף פעולה של תהליכי זיהוי מסוגים שונים, הכוללים זיהוי תבניות כמו קווים ישרים ועיגולים (גם כאשר חלקים מהתבנית חסרים), סינון והפרדה מהירים של סוגי המידע השונים בתמונה, ואינטגרציה של הציפיות עם המידע מהחושים.

אינטגרציה זו היא הסיבה לבחירת מילה ידועה ולא צירוף אותיות מקרי, קשה להחליט אם האות האמצעית היא e או c, אך המילה "clear" נראית לנו עד כדי כך יותר סבירה עד שיש להניח כי רוב הקוראים אינם מודעים לאפשרות של קריאת "clcar".

בינה מלאכותית לעצלנים

הוצעו מספר מבחנים אחרים, שברובם מנצלים את היתרון המוחלט של כישורי עיבוד הראייה האנושי על כל מה שהושג עד עתה בבינה המלאכותית ובראייה ממוחשבת. למשל, מבחן “AnimalPix” מציג שלוש תמונות של חיות ודורש מהנבחן לזהות כל חיה על ידי בחירה מתוך רשימה של שש אפשרויות.

כדי למנוע זיהוי התמונות על ידי השוואתן למאגר תמונות ידועות, מעוותת כל תמונה לפני הצגתה למשתמש. מבחנים אחרים מבוססים על מטלות קוגניטיביות יותר, כמו זיהוי תבניות בדומה למבחני אינטליגנציה הדורשים מציאת תרשים המתאים לסידרת תרשימים נתונה. מכיוון שידוע כי מערכת הראייה האנושית מוכשרת במיוחד באיתור פנים אנושיות - אפילו בתוך תמונה מעוותת ו"רועשת", פיתח צוות בחברת מיקרוסופט מבחן המנצל יכולת זו.

בלייד ראנר כבר כאן

אתר CAPTCHA מכיל מידע רב על מבחני טיורינג הפוכים. בין השאר, אפשר למצוא בו דיווח על הצלחת החוקרים מאליק ומורי (Malik, Mori) מאוניברסיטת ברקלי בקליפורניה, ביוני 2003, לכתוב תוכנה שהצליחה לפתור 80% מהמבחן ששימש את שירותי הדואר האלקטרוני של יאהו באותה תקופה, וגרמה לאנשי יאהו להקשות על המבחן. תהליכים כאלה הופכים את מפתחי המבחנים ל"חוקרים עצלנים": הם מציבים בעיה בפני קהילה גדולה. לקהילה זו יש מוטיבציה גבוהה - ידידותית או עויינת - לפתור את הבעיה.

בכך נוצר תהליך שהוא חיובי בבסיסו: אם קהילה גדולה זו אינה יכולה "לשבור" מבחן טיורינג הפוך, נחזק את ביטחוננו כי מי שעבר אותו הוא אדם ולא מכונה. לעומת זאת, אם חוקרי בינה מלאכותית - או גורמים המעוניינים מסיבה כלשהי "לרמות" את המבחן - מצליחים לכתוב תוכנה העוברת את המבחן, הם מקדמים בכך את המחקר ותורמים להבנת הבינה המלאכותית והאנושית.

באחד מסרט המדע הבדיוני הטובים ביותר, "בלייד ראנר" (1982, ביים רידלי סקוט לפי סיפור של פיליפ ק. דיק), המכונות הן כל כך דומות לאנשים עד כי רק תכונה אחת בלבד מבדילה ביניהן - היכולת לאמפתיה, כלומר הבנת תחושותיהם ורצונותיהם של אחרים.

לכן, משתמשת המשטרה במבחן מיוחד הרושם את התגובות הפיזיולוגיות של הנבדק כאשר מוצגים לו מצבים המעוררים אמפתיה אצל בני אדם. במהלך הסרט, מסתמנת האפשרות כי חלק מהמכונות מהדור האחרון כבר יכולות לעבור מבחן זה. כפי שמעידים המבחנים שתוארו כאן, חזון עתידני זה מתחיל להתממש כבר היום.

מצאתם טעות בכתבה? כתבו לנו