שתף קטע נבחר

החיפוש בווידיאו הולך להיות הרבה יותר קל

וידיאו אינדקסר, שירות שנולד במרכז המחקר והפיתוח של מיקרוסופט בישראל, חוסך נבירה אינסופית בחומרי וידיאו ויכול לזהות מיהם האנשים המצולמים, לקבוע אם הם שמחים או עצובים ואפילו לתרגם את הכתוביות. מי צריך את זה? מעורכי פרומואים של סדרות טלוויזיה פופולריות ועד לחברות ביטחוניות. בעתיד גם אתם תוכלו לבקש מה-VOD: תעביר כבר לסצנה עם הדרקונים

חיפוש של מידע ספציפי בתוך כמות גדולה של חומרי וידיאו יכול להיות משימה שלוקחת הרבה זמן: תארו לעצמכם שאתם עורכים סרט לחתונה או לבת מצווה של אחותכם, וצריכים לדלות פריימים שבהם היא מופיעה מתוך שעות ארוכות של סרטוני וידיאו משפחתיים.

מתברר שזה לא חייב להיות כל כך מסובך. קחו למשל את הפרומו החדש שערכה רשת Fox בארה"ב לקראת פרק הסיום של הסדרה גות'האם (Netflix, עונה 5 ואחרונה). השחקן דוד מזוז, שמגלם בסדרה את ברוס וויין, מוצג שם ב-100 תמונות שמתעדות את התבגרותו מהפרק הראשון של הסדרה, שבו היה בן 12, ועד גילו בסיומה, 17.

 


והינה הפואנטה: עורך וידיאו היה צריך לפנות לעצמו שבוע של עבודה, אולי יותר, כדי לעבור על כל הפרקים ולחפש בהם תמונות מוצלחות של מזוז. אבל בפוקס השתמשו בכלי חדש, מבוסס בינה מלאכותית (AI), שהשלים את המשימה בתוך דקות ספורות.

 

חוסכים עבודה לאח הגדול 

נא להכיר את Video Indexer, מערכת חיפוש וידיאו אינטליגנטית שפותחה במיקרוסופט ישראל מחקר ופיתוח, וכבר נמצאת בשימוש של חברות טלוויזיה וחברות הפקה בולטות בעולם כמו פוקס, האחים וורנר ועוד. מיקרוסופט, כמו חברות שירותי ענן גדולות אחרות, הבינה שכמויות הווידיאו העצומות שנצברות בשרתים מחייבות כלי חיפוש חכמים הרבה יותר. קחו למשל את חברת אנדמול-שיין, שמפיקה את תוכנית הריאליטי "האח הגדול" ברחבי העולם: את מקומם של עשרות עוזרי עריכה טרוטי עיניים, שעוברים על שעות של וידיאו מעשרות מצלמות כדי לדוג מהן את ההתרחשויות המעניינות לאורך היממה, הולכת ותופסת מערכת הווידיאו אינדקסר, שעושה את זה מהר יותר, טוב יותר ובלי להתעייף.

 

אוהד יאסין, ראש קבוצת Azure לבינה מלאכותית במדיה במיקרוסופט ישראל מחקר ופיתוח, אומר כי במערכת שולבו שלוש יכולות בינה מלאכותית: יכולת ניתוח ויזואלית, יכולת ניתוח אודיו ויכולת פענוח של טקסט (NLP). התוצאה היא מערכת שיכולה לזהות מיהם האנשים המופיעים בווידיאו, מהם הנושאים שבהם עוסק הווידיאו, אם מדובר בקטע שמח, עצוב, מרגש או מורט עצבים, ועל הדרך גם לתמלל את הכתוביות ולתרגם לכל שפה.

 

אמיליה קלארק, המגלמת את דאינריז טארגריין ב
תמצא לי סרט של אמיליה קלארק בבקשה(צילום: MCT)

 

מבחינת הצופים מדובר בבשורה מצוינת. במקום להסתמך על התיאורים המשמימים של הסרטים והתוכניות שמופיעים ב-VOD, בקרוב נוכל לחפש סרט אקשן קומי בכיכובה של אמיליה קלארק שמשתתף בו גם וודי הארלסון ושהופק בשנתיים האחרונות (יש אחד כזה). או למשל את כל הקטעים שבהם ג'ארד מ"סיליקון ואלי" מזיל דמעה, למי שזה מדבר אליו.

 

"היכולת להבין את התוכן בווידיאו משפיעה מאוד על שלוש חוויות קלאסיות", אומר יאסין. "הראשונה היא חוויית החיפוש - כדי למצוא בצורה חכמה ויעילה צריך להבין את התוכן, אחרת זה כמו לחפש משהו במחשב רק לפי שמות הקבצים. החוויה השנייה היא חוויית הצפייה - יש לפעמים דברים פחות מעניינים שאפשר להוריד אותם, כמו הקרדיטים בהתחלה או בסוף. החוויה השלישית היא חוויית העריכה - עורכי תוכן יכולים לסמן קטעים ולייצר תוצרים חדשים בקלות לעומת העריכה הקלאסית. למשל, בעימות טלוויזיוני אפשר לייצר אוטומטית קליפ שיציג את הדיון על נושא ההגירה בלבד".

 

מסייע גם לחברות ביטחוניות

מיקרוסופט תומכת בחברות סטארט-אפ שמפתחות טכנולוגיות וידיאו בתחומים נוספים. למשל WSC Sports הישראלית, שמאפשרת לגולשים לייצר סרטוני ספורט משידורים חיים לפי תחומי העניין שלהם: קבוצה מסוימת, שחקן מסוים, כל הקליעות של 3 נקודות במשחק, כל מה שקרה החל מהדקה ה-35 וכדומה. הטכנולוגיה של החברה נמצאת בשימוש של ליגות ובעלי זכויות שידור בולטים בעולם, והיא מבוססת על אז'ור, שירות הענן של מיקרוסופט.

 

הרעיון להקים מערכת בינה מלאכותית לווידיאו הוא יוזמה שנולדה במיקרוסופט ישראל מחקר ופיתוח, כמו סטארט-אפ במימון עצמי של מיקרוסופט, שהפך בהמשך הדרך לקבוצה בינלאומית עצמאית שמנוהלת מישראל. מה שהתחיל ככלי לחברות שידורי טלוויזיה הפך בהמשך לכלי בעל חשיבות רבה גם בחברות אחרות שמנהלות מאגרי וידיאו ואודיו (למשל הקלטת שיחות עם לקוחות) ובחברות ביטחוניות, למשל כאלה שצריכות לאתר אירועים חריגים באלפי שעות של וידיאו ממצלמות אבטחה.

 

 

שימוש נוסף של המערכת מכוון לאנשים עם מוגבלות, כאלה שיכולים להיעזר ביכולת של המערכת לא רק לתרגם או להקריא את הנאמר בווידיאו, אלא גם להוסיף תיאור של מי שמצולם בו ומה הוא עושה או מרגיש בכל רגע. המערכת החדשה הוצגה בשנה האחרונה בכנסים מקצועיים של עולם הטלוויזיה - כנס NAB בלאס וגאס, כנס הבידור והטכנולוגיה הגדול בעולם, וכנס IBC באמסטרדם, וזכתה בפרסי הצטיינות על טכנולוגיית ניהול התכנים וכ"מוצר השנה" בטכנולוגיית וידיאו.

 

מה שמאפשר את היכולות החדשות האלה הוא התפתחות מואצת בתחום הבינה המלאכותית שמתרחשת בשנים האחרונות, וחלק משמעותי ממנה בתחום ניתוח התמונה. "היכולות של המערכת מבוססות על למידת מכונה ומדע נתונים, תחומים שאנחנו מאוד משקיעים בהם במרכז הפיתוח בארץ", אומר יאסין. "חלק גדול מאנשי הקבוצה הם מדעני נתונים ואנשי למידת מכונה, שמפתחים בינה מלאכותית רב-ממדית המאפשרת את זיהוי הנושאים וההתרחשות בתוך הווידיאו".

 

כמה אנחנו רחוקים מהיום שבו תוסיפו קריינות מבוססת בינה מלאכותית ותייתרו את הצורך בעיתונאים?

 

"בסופו של דבר, בינה מלאכותית מאוד טובה בלעזור לאנשים לעשות את העבודה טוב יותר. אנחנו לא מנסים להחליף אף אחד אלא להפוך תהליכי עבודה סיזיפיים וחוזרים על עצמם לקלים יותר. אבל תמיד אני אמליץ שיהיה שם עורך תוכן מקצועי, שיוסיף זווית אמנותית או מקצועית. לא באנו להחליף אנשים אלא לעזור בעבודה שלהם".

 

 תגובה חדשה
הצג:
אזהרה:
פעולה זו תמחק את התגובה שהתחלת להקליד
מומלצים