הרגע שבו חברת OpenAI הציגה את סורה (Sora) לעולם היה רגע מכונן. הרעיון שאפשר לייצר ווידאו שנראה כל כך מציאותי, פשוט באמצעות הוראה (prompt), הדהים רבים. אם אפשר לייצר ככה באמצעות טקסט סרטונים באורך 20 שניות, למה לא סרט באורך שעתיים? והאם זה אומר שהוליווד צריכה לפטר שחקנים ותסריטאים ולגייס במקומם אומני פרומפט? ואולי אולפני הוליווד כולם יוחלפו על ידי חברות תוכנה?
אבל אז הגיע Voia, סטארט-אפ ישראלי-אמריקאי קטן שאומר להוליווד: אל דאגה, העתיד אינו text-2-video, ואת הגורם האנושי לא ניתן להחליף. הצופים לא יתחברו לחיקוי דיגיטלי של מריל סטריפ או של טימותי שאלאמה, אבל את מה שמקיף אותם אפשר לייצר בעזרת AI, וכך להפיק סרטים בשבריר מהעלויות הנוכחיות.
דור חדש של יצירת קולנוע
הטכנולוגיה של Voia היא למעשה דור חדש ומבוסס AI של CGI – טכנולוגיה המלווה את הוליווד מסוף שנות ה-80. הדינוזאורים ב"פארק היורה" והרגליים שנקטעו לקפטן דן ב"פורסט גאמפ" היו הדוגמאות הראשונות לשילוב גרפיקת מחשב בקולנוע, וזה הלך וגבר עד שבשנים האחרונות יצאו לא מעט סרטים שרובם עשויים ב-CGI.
ההפקה מתבצעת באמצעות תוכנות תלת-ממד כבדות ויקרות, סצנות מפרכות שמצולמות באמצעות לכידת תנועה (Motion capture), המון רקעים ירוקים ומאות אנימטורים ומפיקים. העלות, כידוע, יכולה להגיע למאות מיליוני דולר לסרט.
Voia מחליפה את כל זה במצלמות אייפון ובכמה פנסי תאורה, בלי רקעים ובלי ציוד יקר. השחקנית צועדת במשרדי החברה בעמק הסיליקון והבינה המלאכותית שותלת אותה בכל מקום שהתסריט מכתיב: רחוב לילי מוצף אורות בפריז, כביש מדברי צרוב שמש באריזונה או חוף הים באקפולקו מול השקיעה. העלות נמדדת באלפי דולר, כסף קטן עבור הוליווד.
הטכנולוגיה מבוססת על עיבוד הווידאו שקלט האייפון, ב"פוסט-פרודקשן" שלא היה אפשרי עד לפני כן. הווידאו משודרג לאיכות גבוהה, חיישני התנועה של האייפון מתורגמים לתנועות מצלמה ותנועה של המרחב הדיגיטלי מסביב.
אפשר להוסיף אלמנטים לתמונה, לתקן תסרוקת, לשנות את השעה ביום, את כיוון השמש, את גובה המצלמה - מפני הקרקע ועד הדמיית צילום מרחפן. את המרחב מייצרים עם מנוע Unreal, כמו במשחקי מחשב, בסיוע מודלי וידאו של AI, זאת כאשר המחשבים שמריצים את המערכת מבוססים על כרטיסים גרפיים של אנבידיה, ולא על שבבי AI יקרים.
״זווית שונה מאוד ממה שקורה בעמק הסיליקון״
"אנחנו חברה ישראלית קטנה שלקחה זווית מאוד שונה מכל מה שקורה היום בעמק הסיליקון", אומר בשיחה עם ynet אבנר ברוורמן, מנכ"ל החברה. "בנינו פתרון שממוקד בשחקן, בבן אדם. אנחנו לוקחים אותו מתוך הסביבה שהוא מצולם בה, בלי האולפנים והתקציב המטורף של הוליווד, ושמים אותו בסביבה תלת-ממדית מג'ונרטת".
אחד הפרויקטים האחרונים של החברה הוא סרטון פרסומת לחברה ישראלית גדולה, שמשכפלת את הנופים של הסרטון לעשרות מקומות בעולם. "זה הולך לשנות את כל חוקי המשחק בתעשייה", מתלהב ברוורמן.
אני חושב על הדוגמנית בסרטון ההדגמה של סורה, שכל מה שצריך זה לכתוב משפט כמו 'דוגמנית הולכת ברחוב גשום בטוקיו' ומקבלים משהו יפהפה. אתם לא הולכים נגד הזרם?
״נכון, אבל מה שאתה רואה שם זה רק כמה שניות של מישהי שהולכת ברחוב. אין שום דבר מעבר לזה, אין קונטקסט רגשי, אין דיאלוג, אין שם משחק. והוליווד אומרת – ׳בלי המשחק, בלי האנושי, בלי היצירתיות האנושית, אתה לא יכול באמת לספר סיפור כמו שצריך׳״.
לטענתו של ברוורמן, יש בעיה יסודית בדרך שבה יוצרים סרטוני וידאו לפי טקסט. ה-AI שואב את התמונות שלו מתוך סרטים שהוא אומן עליהם. הסרטים האלה הם תמיד תמונה חלקית של המציאות בה צולמו, של זוויות ומרחקים נתונים.
בני אדם רואים סרט ומשלימים את המרחב בדמיון, ה-AI לא יכול לעשות את זה. "אנחנו רואים איך המודלים האלה מפיקים דברים לא עקביים, הדמויות משתנות משוט לשוט, המרחב משתנה, כמעט בלתי אפשרי לספר סיפור".
אתם לא מאמינים ב"טקסט לווידאו" באופן עקרוני? או שאתם מציעים את זה במקביל?
״אנחנו לא מאמינים ב״טקסט לוידאו״ כדרך לייצר את התוצאה הסופית. בלי ההופעה האנושית זה אף פעם לא יקרה, בלי ההבנה התלת-ממדית של המרחב זה לא יקרה. לא רק אני אומר את זה - אנחנו מדברים עם אנשים בתעשייה, מאנשי דיסני ועד אחרוני מפיקי הפרסומות, שקיבלו גישה מוקדמת לסורה וטוענים שזה מוציא תוצאות יפות אבל לא ממש שימושיות. זה מה שאנחנו שומעים בכל שיחה עם כל איש מקצוע בתחום״.
אולי זה מצב זמני. אנחנו רואים שהבינה המלאכותית משתפרת כל הזמן
״לא מזמן בן אפלק נתן ראיון ל-CNBC ודיבר על AI והוליווד. והוא אמר שם משהו נורא יפה, שה-AI הוא כלי יצירה מטורף אם מנחים אותו ואומרים לו מה לעשות. ושאפשר לאמן AI שיכתוב תסריט של טרנטינו, אבל ״אף AI לא יהיה הטרנטינו הבא'".
מטוויטר לפיתוח AI
חברת Voia הוקמה בשנת 2022 על ידי קבוצה מעניינת של יזמים – חלקם אנשי טכנולוגיה ישראלים וחלקם אנשי הוליווד אמריקאים- שמגיעים כולם מקריירות קודמות מרשימות. אבנר ברוורמן, המשמש מנכ"ל, היה ממייסדי Reshuffle שנמכרה לטוויטר. חיים הלמן המשמש CTO היה ממייסדי Octarine שנמכרה ל-VMware וממייסדי XIV שנמכרה ל-IBM. נועם מללי המשמש כמנהל פיתוח ה-AI מגיע אחרי תפקידי פיתוח בשורה ארוכה של חברות בהן Nec, וורינט, אפספלייר ועוד.
מאוחר יותר הצטרף למייסדים אמיר שבט, שעסק בפיתוח קהילות המפתחים בשורת חברות בהן גוגל, סלאק וטוויץ'. ב-2021 נרכשה כאמור Reshuffle על ידי טוויטר, במה שהוגדר כ-"Acqui-hire" – רכישת חברה כדי להעסיק את עובדיה. ברוורמן ושבט נקלטו בתפקידים בכירים בטוויטר, רק כדי להיות מפוטרים ממנה כעבור שנה, כאשר זו נרכשה על ידי אילון מאסק.
נטפליקס, דיסני וסוני בעניין
כשהוקמה Voia לפני שלוש שנים, הכוונה הייתה לעשות משהו אחר לגמרי: להציע כלים ליוצרי תוכן ומשפיענים ברשתות חברתיות כדי לייצר סרטונים באיכות הוליוודית באמצעים דלים של אייפון ותאורה זולה. זה היה קצת לפני ש-ChatGPT הגיח לעולם וטלטל את החיים של כולנו.
"התחלנו מלכוון לווידאו באינסטגרם, אבל השוק פשוט משך אותנו חזק לעולם של ההפקות היותר מקצועיות", אומר ברוורמן, "היום אנחנו עובדים עם אולפנים בהוליווד שמפיקים סרטים באורך מלא ועם סוכנויות פרסום בארץ, שחלקן גם משקיעים שלנו חלקם שותפים שלנו, ואנחנו מדברים עם גורמים בנטפליקס, דיסני, יוניברסל וסוני״.
״זה נכון שתמיד יהיו סדרות כמו ׳שר הטבעות: טבעות הכוח׳ שמשקיעים בה 500 מיליון דולר, אבל לצד זה יש הרבה מאוד סדרות נוספות עם עלויות נמוכות יותר. פתאום כמות ההפקות גדלה בעשרות מונים ולך תפיק את כל התוכן הזה".
ב-2023 גייסה Voia הון ראשוני בהיקף 3 מיליון דולר, חלקו בבוטסטראפ וחלקו ממשקיעים אסטרטגיים. כעת החברה נערכת לסבב גיוס משמעותי שיקרה בחודשים הקרובים. במקביל ברוורמן מדווח על עסקאות ראשונות עם לקוחות בינוניים וגדולים, עסקה ראשונה של מיליון דולר וצפי הכנסות של כמה מיליוני דולר כבר ברבעון הנוכחי.
"כבר היינו בסרט של לגייס הרבה כסף בחברות קודמות. בחברה הזאת רציתי לדעת איפה אני נמצא. החזון היה, אבל איך אנחנו נכנסים לשוק? רציתי קודם כל להוכיח לעצמי שאני יודע לאן זה הולך ושאנחנו יודעים לבנות את הטכנולוגיה הזאת״.