זיהוי פנים יסייע לשכחנים להיזכר בשמות
אם תמונתו של אדם זה אינה במאגר שלי, יפנה המחשב לאינטרנט, דרך חיבור אלחוטי, ויבדוק אם הפנים המסתוריות מופיעות במקום כלשהו לצד שמו של האדם. גם זה לא הצליח? איאלץ לשאול מיהו אותו מכר ותיק, ואז אומר: "נעים מאוד, אהרון"
האח הקטן צופה בך
לא רק ממשלות מתעניינות בזיהוי פנים. אחת החברות שהגיעה להישגים גבוהים במבחן FVRT נקראת נֶבֶן (Neven Vision). באוגוסט 2006 רכשה את נבן חברת אינטרנט המוכרת לכולנו - גוגל.
ההסבר של גוגל לרכישה זו מופיע בקישור הקודם: גוגל מתכננת לצייד את Picasa, תוכנת ניהול אלבום התמונות האישי שלה, ביכולת לסווג תמונות לפי נושא (אנשים או נוף, למשל), ובעתיד גם לזהות את האנשים והמקומות המופיעים בהן. מי לא היה רוצה לחפש בארכיון שלו את כל התמונות שצולמו במקום מסוים, או את כל התמונות שבהן מופיעה האחיינית החמודה?
הרכישה של גוגל היא רק דוגמה אחת: חברות אחרות שהגיעו להישגים גבוהים הן סמסונג וטושיבה, שגם להן יש ודאי רעיונות איך לשפר (?) את חיינו בעזרת זיהוי פנים. אפשרות אחת, שכבר הוצגה בכמה מעבדות בעולם: כדי להימנע מהמצב המביך שבו איני זוכר מיהו האדם שקרא הרגע בשמי, ארכיב על משקפיי מצלמה מיניאטורית. המצלמה תהיה מחוברת למחשב שאליו הזנתי תמונות ושמות, ואוזנייה קטנה המוחבאת במוט המשקפיים תלחש לי את השם ששכחתי.
אם תמונתו של אדם זה אינה במאגר שלי, יפנה המחשב לאינטרנט, דרך חיבור אלחוטי, ויבדוק אם הפנים המסתוריות מופיעות במקום כלשהו לצד שמו של האדם. גם זה לא הצליח? איאלץ לשאול מיהו אותו מכר ותיק, ואז אומר: "נעים מאוד, אהרון".
המחשב יזהה אמירה זו כקוד הדורש ממנו לשמור את תמונתו של אהרון ליד השם "אהרון", ובפעם הבאה כבר יהיה אהרון בטוח שאני זוכר אותו (המחשב גם יוכל להזכיר לי היכן הייתי כאשר דיברתי עם אהרון בפעם האחרונה, ולהשמיע לי חלק משיחתנו באותה הזדמנות, אך זה נושא לכתבה אחרת).
גם כאן משתרע לפנינו מדרון חלקלק. יותר ויותר אנשים מעלים את ארכיון התמונות שלהם לאינטרנט. אם במקום כלשהו נמצאת התמונה שלי ליד שמי, זה מספיק כדי לחפש את פניי בכל תמונה אחרת המופיעה באתר כלשהו באינטרנט. יהיה אפשר גם לחפש אותי בהקלטות של שידורי כל מצלמת רשת (Web Cam) שהתמונות שהיא מצלמת נגישות לקהל הרחב.
כיום זוכים רק סלבריטאים לזיהוי בכל אשר ילכו. האם בעתיד יהיה כל אחד מאיתנו אובייקט לחיפוש? האם כאשר יתכונן מישהו מאיתנו לפגישה חשובה, עסקית או חברתית, הוא יוכל למצוא באינטרנט לא רק היכן הופיע שמו של האדם שאיתו נפגש, אלא גם היכן היה בימים האחרונים (או גם לפני חמש שנים), היכן הוא נוהג לבלות, לאילו חנויות הוא נכנס וכו'?
מה יעשו פושעים בעזרת טכנולוגיה כזו? הם יוכלו לדעת מתי אתה רחוק ולכן אפשר לפרוץ לביתך, הם יוכלו להטריד ולהפחיד, הם יחפשו הזדמנויות לסחיטה, וודאי יחשבו על רעיונות יצירתיים נוספים.
תסריטים מעוררי-חשש אלו אינם אפשריים עדיין, אך בקצב ההתקדמות הנוכחי, אין סיבה שלא נראה אותם מתממשים אפילו לפני סוף העשור.
הטכנולוגיה נותנת, הטכנולוגיה לוקחת
רלף גרוס (Gross), ממכון הרובוטיקה של אוניברסיטת קרנגי-מלון (Carnegie Mellon), מכיר היטב את שני הצדדים של הסוגיה. בין השאר, הוא עזר למכוני רישוי בארצות-הברית לחפש אנשים שרישיון הנהיגה שלהם נשלל במדינה אחת, ואז ביקשו רישיון חדש במדינה אחרת, או תחת שם אחר באותה מדינה. מתברר כי על-ידי השוואת התמונות של אנשים שונים-לכאורה נתפסו כמה עבריינים כאלו, וייתכן שכך נמנעו כמה תאונות קטלניות.
מצד אחר, גרוס עובד עם מעבדת פרטיוּת המידע (Data Privacy Lab) של קרנגי-מלון כדי למצוא דרכים לעצור את ההחלקה במדרון. הגישה שהם מציעים מתבססת על עובדה מעניינת: אף שהן בני-אדם והן מחשבים מגיעים ליכולת גבוהה בזיהוי פנים, הם מבצעים אותה מטלה בדרכים שונות לחלוטין.
המסתורין של השיטה האנושית
למעשה, איננו יכולים לומר הרבה על השיטה האנושית או על השיטה הממוחשבת: לגבי בני-אדם, למרות ממצאים רבים על המקומות במוח שבהם מתבצע הזיהוי, ועל הגורמים למצבים פתולוגיים שבהם אובדת היכולת לזיהוי פנים (Prosopagnosia – מיוונית; פרוסופון פירושו "פנים" ואגנוסיה פירושה "אי-ידיעה"), עדיין איננו יודעים לתאר את עקרונות השיטה שבה פועל המוח (וראו: יפעת לוי ורפאל מלאך – "מקטן ועד גדול במוח האדם", "גליליאו" 49).
מן הצד הטכנולוגי, אף שפורסמו בעבר כמה אלגוריתמים יעילים לזיהוי פנים, החברות שהשיגו את ההתקדמויות המרשימות שעליהן דווח ב-FRVT אינן חושפות את השיטות שבהן הגיעו לשיפורים אלו.
גם אם לא נוכל לבחון את השיטות השונות של האדם ושל המחשב, נוכל לראות כי במבחן התוצאה יש הבדלים: אנשים טובים יותר בזיהוי פנים שהם מכירים היטב (כלומר שכבר ראינו אותם בצורות שונות, בתאורות שונות וכו'), ובזיהוי פנים הנצפים מזוויות לא-שגרתיות (מהצד או מלמטה, למשל). מחשבים טובים יותר בזיהוי פנים שנראו רק פעם אחת וכאשר שתי העיניים נראות בבירור.
שיטות המקשות על בני-אדם לזהות פנים אינן מקשות בהכרח על מחשבים: גרוס וחבריו לקבוצה מצאו כי הריבועים המסתירים את פני דמויות בטלוויזיה ובעיתונות עדיין מאפשרים לעתים קרובות לתוכנה לגלות את זהות המרואיין – אפילו ברמות טשטוש (גודל ריבוע) גבוהות במיוחד. לפעמים ריבועים אלו אפילו משפרים את יכולת הזיהוי של המחשב, מכיוון שהם מסירים פרטים שנוטים "לבלבל" את התוכנה! (בסוף הכתבה יש קישור למאמר על כך, ועל השיטה המוצגת בהמשך.)
אם כך, האם אפשר למצוא תהליך הפוך – תהליך שימנע ממחשב לזהות את הפנים, אך עדיין לא יפגע בשימושיות של התמונה עבור בני-אדם? נראה כי קיימת שיטה כזו.
חוקרים במעבדת פרטיוּת המידע, בראשות לטניה סוויני (Sweeney), פיתחו תהליך שבו משולבים פרטי הפנים של כמה אנשים שונים כדי ליצור תמונה חדשה, ותמונה זו מושתלת על גבי התצלום או סרט הווידיאו המקורי (קישור בסוף הכתבה).
מטרתם היא להתמודד עם מצבים שבהם המשטרה, למשל, חושבת כי ייתכן שבסרטי מעקב מסוימים קיים מידע הקשור לחקירת פשע, אבל אין לה טיעונים מספיק משכנעים כדי ששופט יאשר גישה לאותם סרטים. הטיעונים יכולים להיות מוצגים רק לאחר שהמשטרה אכן תצפה בסרטים – מצב של "מלכוד 22".
הצוות של סוויני מציע שיטה להסוואת זהות: המשטרה תוכל לצפות בגרסה של הסרט שבה כל הפנים הוחלפו ב"פנים משולבים", כך שכל אחד מהם מורכב בצורה אחרת מכמה דמויות שונות. בסרט זה אפשר לראות אפילו הבעות פנים ולהבין את המאורעות, אך המשתתפים יוכלו להיות מזוהים רק לאחר קבלת צו שופט.
תוך כדי הפיתוח התברר כי אפשר להשתמש בשיטה דומה גם כדי ליצור תמונות שבני-אדם מזהים טוב יותר מאשר המחשב (אם כי עדיין הזיהוי לא יהיה וודאי) – נסו את ההדגמה (קישור בסוף הכתבה) כדי לראות כמה פעמים הניחוש שלכם מוצלח יותר משל התוכנה המתחרה בכם.
מחקר זה הוא חלק מתחום מחקר רחב וחשוב, הבודק שני צדדים של אותה שאלה: מצד אחד, המחקר מראה את היכולת של תוכנה לפרוץ את מעטה האנונימיות והפרטיות – אותו מעטה שאנו משלים את עצמנו אם אנו מאמינים כי הוא קיים וימשיך להתקיים בעתיד. מצד אחר, הוא מפתח כלים להסוואת זהות תוך פגיעה קטנה בכל האפשר בשימושיות של אותה טכנולוגיה העוזרת לנו ומגנה עלינו בשיטוטינו ברשת, בתהליכים רפואיים, או אפילו כשאנו מהלכים ברחוב. לבינה המלאכותית יש חלק חשוב בשני צדדים אלו.
קישורים
מאמר על זיהוי דמויות "מפוקסלות" ועל הדרך הנכונה להסוואת זהות.
הדגמה של שיטת הסוואת הזהות.
ישראל בנימיני עובד בחברת ClickSoftware בפיתוח שיטות אופטימיזציה מתקדמות.
מתוך גיליון אוגוסט של מגזין "גלילאו"