שתף קטע נבחר

חשש: זיהוי פנים בקהל יפגע בפרטיות

טכנולוגיית זיהוי פנים עלולה לשמש כדי להגביל מאוד את חירויות הפרט. מה ימנע את המשטרה מלהשתמש במאגר התמונות מתעודות הזהות ורישיונות הנהיגה?

בחודש מרץ, 2007, פירסם המכון הלאומי לסטנדרטים וטכנולוגיה (NIST – National Institute of Standards) של ארצות-הברית את תוצאות מבחן יצרני תוכנות זיהוי הפנים של שנת 2006 (FVRT – Face Recognition Vendor Test).

 

המבחן כלל, בין השאר, השוואה של יכולת הזיהוי של כמה אלגוריתמים (שיטות הניתנות למימוש כתוכנות מחשב) ליכולת אנושית. התוצאות: שלושה אלגוריתמים הצליחו לזהות פנים טוב יותר מאשר בני-האדם שהשתתפו בניסוי, בכל התנאים שנכללו בניסוי עבור רמות התאורה ועבור רמת ההפרדה (הרזולוציה) של תמונות הפנים.

 

זו, כנראה, הפעם הראשונה שבה בוצע מבחן השוואתי בין בני-אדם לבין מחשבים בתחום זה. עם זאת, ידועות התוצאות הטובות ביותר שהשיגו מחשבים בשנים קודמות, כך שאפשר גם להסיק כי 2006 היתה השנה שבה באמת הצליחו מחשבים להדביק ולעבור את הביצועים האנושיים.

 

כדי להבהיר זאת, יש להסביר את השיטה שבה נבדקים ההישגים בזיהוי: NIST וגופים אחרים המשתתפים בפיתוח ובבחינה של תוכנות זיהוי פנים אספו מאגרים גדולים של תמונות, כך שעבור כל אדם במאגר קיימות כמה תמונות במאגר. באחד המאגרים, לדוגמה, יש 108,000 תמונות של 36,000 אנשים.

 

כדי לבחון את יכולת הזיהוי, מוצגות למחשב (או לאדם המשתתף בניסוי) שתי תמונות שנבחרו מתוך המאגר. על המחשב לדווח עד כמה הוא "מאמין" כי התמונות הן תצלומים של אותו אדם.

 

ניסוי זה דומה לשימוש בפועל כאשר משווים תמונה של אדם בלתי ידוע למאגר תמונות של אנשים שזהותם ידועה, בתקווה למצוא התאמה של התמונה הראשונה לאחת הזהויות הידועות.

 

במבחנים כאלה נהוג למדוד את הסיכוי של שתי צורות שגיאה: הסוג הראשון הוא "קבלה שגויה" (false accept), כלומר מצב שבו המחשב יבצע זיהוי שגוי, וידווח כי שתי תמונות הן של אותו אדם אף שאין הדבר כך.

 

הסוג האחר הוא "דחייה שגויה" (false reject), כלומר מצב שבו המחשב אינו מצליח לגלות כי שתי התמונות שהוצגו לו הן של אותו אדם. בדיווחים רבים נדרשות תוכנות המחשב להגיע לרמת קבלה שגויה של כ-0.001: רק באלפית מהמקרים שבהם ידווח המחשב על זיהוי יתברר בסופו של דבר כי היה זה זיהוי שווא.

 

קל לשלוט בפרמטרים של התוכנה כך שהמחשב יגיע לרמת שגיאות נמוכה עד כדי כך, אך לשליטה זו יש מחיר: כאשר מורידים את הסיכוי של טעויות "קבלה שגויה", עולה הסיכוי לטעויות "דחייה שגויה". אילו היה המחשב אנושי, היינו מפרשים זאת כאילו המחשב הופך להיות זהיר והססן, ולכן חושש מטעות עד כדי כך שהוא נמנע במקרים רבים מלדווח על זיהוי אפשרי.

 

בעזרת מושגים אלה אפשר להשוות את התקדמות התוכנה בשני העשורים האחרונים, כאשר ההשוואה מתבצעת בכל מקרה עבור רמת קבלה שגויה של כ-0.001: ב-1993 הגיעו האלגוריתמים הטובים ביותר לתוצאה מאכזבת של 79% דחייה שגויה: המחשב לא זיהה ארבעה מכל חמישה "חשודים".

 

מטרה שאפתנית

לאלגוריתמים אלו היתה מגבלה נוספת: הם דרשו עזרה אנושית. עבור כל תמונה היה צורך באדם שיצביע בתוך התמונה על מיקומי שתי העיניים. ב-1997 כבר הופיעו אלגוריתמים אוטומטיים לחלוטין, שהגיעו לרמת דחייה שגויה של 54%. ב-2002 הושג שיפור נוסף, עד ל-20%. במאי 2004 הודיעה ממשלת ארצות-הברית על "האתגר הגדול של זיהוי הפנים" (FRGC – face Recognition Grand Challenge).

 

תכנית זו, שהסתיימה במרץ 2006, הופעלה כדי לקדם את טכנולוגיות זיהוי הפנים, והציבה מטרה שאפתנית: שיפור הביצועים בסדר גודל אחד. מטרה זו הושגה. במבחן של שנת 2006 הושגה תוצאה של 1%:

 

 99% מהזיהויים הנדרשים אכן בוצעו. תוצאה זו הושגה אמנם רק בתנאים הטובים ביותר, של הפרדה (רזולוציה) גבוהה ושל תנאי צילום מבוקרים, אך עדיין זוהי התקדמות מרשימה.

 

לשם השוואה, עבור תנאי צילום לא-מבוקרים (כמו אלו שמתקבלים ממצלמות אבטחה), ההישגים הטובים ביותר שדווחו היו 11% דחייה שגויה עבור רזולוציה גבוהה ביותר (שישה מיליון פיקסלים בצילום, שמכיוון שבוצע בתנאים לא-מבוקרים תפסו הפנים רק חלק קטן מתוכו, והמרחק הממוצע בין מרכזי שתי העיניים היה כ-190 פיקסלים) ו-13% עבור רזולוציה גבוהה (ארבעה מיליון פיקסלים בתמונה, 110 פיקסלים בין העיניים).

 

יש להניח כי גם עבור תנאים אלו ישתפרו התוצאות בזמן הקרוב. כדאי לשים לב כי מה שנקרא בניסוי "רזולוציה גבוהה ביותר" הוא כבר עכשיו הרזולוציה המקובלת במצלמות דיגיטליות רבות.

 

מי צריך זיהוי פנים?

באותו דו"ח מבחן מובאות גם תוצאות של שתי טכנולוגיות זיהוי אחרות: זיהוי לפי צילומי הקשתית (החלק הצבעוני של העין, המקיף את האישון), ולפי סריקת פנים תלת-ממדית (כיום קיימים מכשירים מסחריים המאפשרים סריקה כזו). טכנולוגיות אלו הגיעו להישגים דומים לאלו של זיהוי פנים לפי צילומים דו-ממדיים.

 

מדוע משקיעה ממשלת ארצות-הברית מאמץ ומשאבים כה רבים בטכנולוגיות זיהוי? רמז לתשובה נמצא בדף הראשון של דו"ח המבחן, ברשימת המממנים, הכוללת את ה-FBI, את ה-DNI (Director of National Intelligence – הממונה בממשלת ארצות-הברית על קהילת המודיעין) ואת מחלקת "ביטחון המולדת" (Homeland Security). קל לדמיין את האפשרויות. כיום מוצבות מצלמות המכסות חלקים רבים מהמרחבים הציבוריים בעולם: מצלמות אבטחה ממשלתיות ומשטרתיות, מצלמות למניעת גנבות ומצלמות שמפעילים גופי תיירות ואנשים פרטיים.

 

אם קהילת המודיעין האמריקנית תאגור תמונות של חשודים כטרוריסטים, היא תוכל, בעזרת טכנולוגיה זו, לסרוק תמונות ממקורות רבים אלו, ולקבל התרעות אמינות כאשר חשודים אלו יופיעו במקום כלשהו בעולם. כמה פיגועים אפשר למנוע כך?

 

כמה קרבנות אפשר להציל?

קל לחשוב על שימושים נוספים: ראינו כבר עד כמה חרדה האוכלוסייה כאשר אסיר מסוכן ברח, בגלל החשש שהוא יבצע מעשי אלימות נוספים. כאשר כל מקום שבו יעבור האסיר יהיה מכוסה במצלמות, והתמונות המצולמות בהן ייבדקו, דרכו חזרה אל הכלא תהיה מהירה יותר. הורים שילדם נעלם חלילה יכולים גם הם להיעזר ביכולתם הבלתי נלאית של מחשבים לסרוק תמונה אחר תמונה, מצלמה אחר מצלמה, עד שהבן האובד יימצא.

 

אפשר לבדוק לא רק תמונות שצולמו ברגע זה, אלא גם תמונות שצולמו ברגע כלשהו בעבר: יותר ויותר מצלמות מחוברות לאינטרנט, כך שבעלי המצלמות יכולים להחליט אם לתת את הגישה לכל דורש או רק למורשים לכך.

 

ברגע שיכולת הגישה מושגת (בדרכים חוקיות או אחרות), אפשר להקליט כל תמונה המתקבלת מכל מצלמות הווידיאו הנגישות. גם אם הילד האובד אינו נראה כרגע בשום מצלמה, אפשר לחפש אותו בתמונות מהעבר, וכך לנסות לפענח מה קרה לו ולאן נעלם.

 

דוגמה אחרת: אם המשטרה מנסה לקשר חשוד לפשע שבוצע במקום מסוים, היא יכולה לסרוק מצלמות באותו אזור סמוך לזמן שבו בוצע הפשע, בתקווה למצוא את החשוד. היא גם יכולה לנסות להתאים את ההקלטות למאגר תמונות העבריינים שברשותה.

 

חלק מהקוראים אולי חשים צמרמורת בנקודה זו: אותה טכנולוגיה עלולה לשמש כדי להגביל מאוד את חירויות הפרט. מה ימנע את המשטרה מלהשתמש במאגר התמונות מתעודות הזהות ורישיונות הנהיגה?

 

האם מעסיק יכול לחפש את פני עובדיו בין המשתתפים בהפגנה שאינו מסכים עם מטרותיה? האם הוא יכול לבדוק איפה נמצא באמת עובד שדיווח כי הוא חולה? שרת החינוך יולי תמיר מספרת כי כאשר למדה בתיכון, התחמקה מבית-הספר כדי להשתתף בצעדה, אך לרוע מזלה זיהה אותה מנהל בית-הספר בצילום שפורסם בעיתון ליד כתבה על אותה צעדה.

 

האם מנהלי בתי-הספר של מחר יקבלו לשולחנם בכל בוקר דיווח על אתרי הבילוי שבהם נצפו תלמידיהם? האם הורים צריכים להיות מעוניינים במעקב אחר מעשיהם של ילדיהם בני העשרה? (יש לזכור כי לא פחות סביר שאותם נערים ונערות, שהם הראשונים לאמץ חידושים טכנולוגיים, ימצאו את הדרך לעקוב אחר חבריהם, הוריהם ומוריהם).

 

ישראל בנימיני עובד בחברת ClickSoftware בפיתוח שיטות אופטימיזציה מתקדמות.

 

פורסם בגיליון אוגוסט של מגזין "גלילאו". בכתבה הבאה: לא רק ממשלות מתעניינות בזיהוי פנים.

 

לפנייה לכתב/ת
 תגובה חדשה
הצג:
אזהרה:
פעולה זו תמחק את התגובה שהתחלת להקליד
זיהוי פנים. יתרונות וחסרונות
מומלצים