שתף קטע נבחר

הקול הולך: איך אפשר לזייף בקלות את הקול שלכם

חשבתם מה היה קורה אם מישהו היה מזייף את הקול שלכם ומפרסם את ההקלטות? חוקרים באוניברסיטת אלבמה הצליחו להראות שהם זקוקים לדגימת קול של אדם במשך 3־5 דקות מסרטון יוטיוב, כדי ליצור קול מסונתז שלו שיכול להטעות אתכם בקלות

קבלו תרחיש דמיוני, אבל לא בהכרח מופרך: בוקר אחד מתפרסם בעמוד אנונימי בפייסבוק קטע קול קצר - הקלטת שיחה בין שני אנשים. עד מהרה, מתברר שמדובר ברעידת אדמה פוליטית ומשפטית של ממש: בהקלטה מתועד בבירור שר בממשלה שמציע שוחד לקצין בכיר במשטרה, בתמורה להפסקת חקירה נגדו. לכאורה, זהותם של השניים ברורה: הדוברים בהקלטה נשמעים בדיוק כמו השר והקצין, כולל הקול, האינטונציה, סגנון הדיבור ואפילו ה"מניירות" המזוהות עמם.

 

כך ניתן לזייף לכם את הקול:

 

 

ההקלטה צוברת תאוצה ומתפשטת ברשתות החברתיות כאש בשדה קוצים, ומשם לכותרות הראשיות בתקשורת. השר והקצין מכחישים נואשות שקיימו אי פעם שיחה כזו וטוענים שמדובר בזיוף, אך אף אחד לא מאמין להם. רק מאוחר יותר, אחרי סערה ציבורית נרחבת ונזק תדמיתי קשה מתבררת האמת: אכן מדובר בזיוף. הוא לא נעשה באמצעים טכנולוגיים מתקדמים על ידי מומחי קול ועריכה; אלא כמעשה קונדס של נער, שעשה זאת באמצעות תוכנה במחשב הביתי שלו.

  

זהו סיפור דמיוני לגמרי שמתאר אמנם תרחיש קיצוני למדי, אך למעשה אנחנו הולכים ומתקרבים לעידן שבו הוא יהיה אפשרי לגמרי, לפחות מבחינה טכנולוגית וטכנית. באמצעות בינה מלאכותית ותוכנות מתקדמות, יהיה ניתן בקרוב לשנות וליצור הקלטות קוליות המחקות במדויק את קולם של אנשים, וכך "לגרום" להם לומר בקולם שלהם מילים שהם מעולם לא אמרו.

 

בשנה שעברה חשפה חברת אדובי, העומדת מאחורי תוכנת "פוטושופ" המפורסמת, שהיא עובדת על פיתוח תוכנה חדשה בשם VOCO, שתוכל לשמש בתור "פוטושופ של קולות". הרעיון הוא שכפי שניתן לערוך תמונות באמצעות פוטושופ, כך אפשר לעשות אותו דבר לקטעי קול, דיבור וסאונד. באמצעות התוכנה ניתן לקחת קטע דיבור של אדם, להחסיר ממנו קטעים ואף להוסיף מילים שלא היו בו במקורי. התוכנה צריכה להאזין לדיבור של אותו אדם במשך 20 דקות בלבד, וכך היא לומדת את דפוסי הקול שלו ויודעת כיצד לחקות אותו. כעת לא נותר למשתמש אלא להקליד מילים בטקסט, והתוכנה תקריא אותו בקול ממוחשב שמחקה במדויק את הדובר המקורי.

 

אילוסטרציה (צילום: שאטרסטוק) (צילום: שאטרסטוק)
אילוסטרציה(צילום: שאטרסטוק)

 

אדובי לא לבד. חברת "דיפ-מיינד" הבריטית, שנרכשה בעבר על ידי גוגל ונחשבת לאחת המובילות בתחום הבינה המלאכותית, שוקדת על פיתוח בעל רעיון דומה בשם WaveNet. גם כאן, מדובר בתוכנה שמסוגלת לחקות במדויק קולו של אדם אחר ולגרום לדיבור המלאכותי להשמע טבעי מאי פעם. באופן דומה, חוקרים באוניברסיטת אלבמה הצליחו להראות שהם זקוקים לדגימת קול של אדם במשך 3־5 דקות מסרטון יוטיוב, כדי ליצור קול מסונתז שלו שיכול להטעות אתכם בקלות.

 

ואתם יכולים לנסות גם בעצמכם: סטארטאפ בשם Lyrebird פיתח טכנולוגיה דומה, ובאתר שלהם תוכלו ליצור לעצמכם "קול דיגיטלי". כדי לבנות משפטים חדשים לגמרי בקולכם, תידרשו להקליט 30 משפטים (התוצאה משכנעת - אך לא מושלמת, הקולות המתקבלים קצת מקוטעים ומתכתיים).

 

פרויקט של חוקרים באוניברסיטת וושינגטון הראה שאפשר לקחת את זה אפילו צעד קדימה, וליצור וידיאו מזויף של אדם מדבר. הם הראו שבאמצעות בינה מלאכותית, ניתן ליצור וידיאו של אדם שתנועות פניו ושפתיו זזים בהתאם למילים מסוימות - אף שהוא לא אמר אותן. הם אף הדגימו זאת בנאום של הנשיא לשעבר אובמה, והתוצאה הייתה ריאליסטית להפליא.

 

הטכנולוגיות הללו מבטיחות מאוד, והן בגדר חלום רטוב של כל אדם שעוסק בטלוויזיה, רדיו או תוכן משודר - מטכנאי סאונד ועד כתבי טלוויזיה. תארו לכם שדוברים בכתבות רדיו, טלוויזיה או בפודקאסטים, יוכלו לתקן טעויות קטנות, לבצע שינויים ולהוסיף משפטים, והכל בדיעבד, בלי צורך להקליט מחדש.

 

אמנם לא כל התכנות הללו עדיין לא זמינות לקהל הרחב, וייתכן שייקח עוד זמן עד שזה יקרה (למעשה באדובי עד עתה לא התחייבו שאכן ישיקו את VOCO כמוצר מסחרי). אך באופן לא מפתיע כל זה גורם גם לדאגות ולחששות רבות בקרב מומחים. החשש העיקרי הוא שאם ניתן יהיה לזייף בקלות הקלטות קוליות ואף קטעי וידיאו, יהיה אפשר בקלות לייצר "פייק ניוז" ויראלי בצורה אמינה ויעילה מאי פעם. בנוסף, יהיה אפשר לרמות עיתונאים שעובדים על תחקירים וראיות מוקלטות בבתי משפט עלולות להיות מוטלות בספק גדול.

 

"לקובץ קולי יש היום מעמד גבוה כראייה משפטית וגם מבחינת הנכונות שלנו להסתמך עליהם בחיינו", אומר עו"ד יורם הכהן, מנכ"ל איגוד האינטרנט הישראלי ומומחה בנושאי משפט וטכנולוגיה. "היו כבר אירועים בשנים האחרונות שבהם חקיינים הצליחו לעבוד על פוליטיקאים ועיתונאים, אך כאן הטכנולוגיה לוקחת אותנו צעד קדימה. אנחנו בהחלט עלולים לראות שימושים לרעה בטכנולוגיה כזו. הציבור ייאלץ ללמוד שהוא צריך לחשוד ולעשות בדיקה נוספת של מה שמשמיעים לו. יהיה קל להונות אנשים, ויהיה צריך להזהיר את הציבור. זו בעיה קשה - בעצם צריך להגיד לאנשים לא להאמין למה שהם שומעים".

 

לא בטוח שכל החששות מוצדקים בהכרח. למשל, הגיוני שניתן ליצור תוכנת מחשב שתזהה דפוסים ואלמנטים נסתרים בהקלטות וקטעי וידיאו, ואז תדע להבדיל בין חיקוי לבין דיבור אותנטי. בנוסף, באדובי רמזו כי הם מודעים לבעיות האפשריות ואמרו שיהיה אפשר להוסיף "סימנים מיוחדים" להקלטות, שיאפשרו לכל אחד לדעת אם אכן זויפו.

 

אבל הבעיה עלולה להחריף ככל שהטכנולוגיה תשתפר: "אם יכולת עריכת הסאונד תגיע לרמה כזו שתפיל בפח גם מחשבים ותוכנות, אנחנו נהיה בבעיה", מזהיר הכהן. "לא יהיה אפשר להסתמך כלל על שום הקלטה דיגיטלית, גם ברמה המשפטית".

 

בכל מקרה, ייתכן שזו רק ההתחלה. הכהן מזכיר שכבר היום יותר ויותר קשה להבדיל בין דיבור אנושי לבין דיבור קול ממוחשב-מלאכותי, למשל במוקדי שירות טלפוניים. גם המכונות עצמן הופכות לחכמות יותר, ואנחנו צועדים לעתיד שבו כמו בסרטי המדע הבדיוני רובוטים ומכונות יוכלו להתחזות באופן כמעט מושלם לבני אדם. בעתיד כזה, השאלה של מה אמיתי, מה מזויף ומה אנושי, תקבל ממד אחר לחלוטין.

 

הכתבה פורסמה במוסף "ממון" ב"ידיעות אחרונות"

 

לפנייה לכתב/ת
 תגובה חדשה
הצג:
אזהרה:
פעולה זו תמחק את התגובה שהתחלת להקליד
צילום: שאטרסטוק
אפשר לזייף גם את הקול. אילוסטרציה
צילום: שאטרסטוק
מומלצים