פעם, לא ממש מזמן, עדיין האמינו שמחשב לא יוכל לעולם לנצח אדם בשחמט או ב"גו", בטריוויה או בפוקר. אחר כך - עדיין לא ממש מזמן - האמינו שמחשב לא יוכל אף פעם לספר סיפור או להלחין מוזיקה. כל זה כבר קרה, ומשנה לשנה (ולפעמים גם מחודש לחודש) מצליחה הבינה המלאכותית לחשוב ולהגדיר מחדש את גבולות הגזרה של הבינה האנושית - ואלה הולכים ומצטמצמים ככל שהמכונות והתוכנות משתלטות על עוד יכולות שנחשבו עד לא מזמן תבוניות.
כתבות נוספות למנויי +ynet:
בחודש האחרון היינו עדים לעוד קפיצה נחשונית בתחום הבינה המלאכותית. הפעם הגיע תורו של הציור להיות במוקד: שתי מערכות בינה מלאכותית חדשות ועוצמתיות ששוחררו בשבועות האחרונים מנסות - ונראה שבהחלט מצליחות - לחטוף את המכחולים והעפרונות מהידיים האנושיות ולהפיק דימויים (ציורים, תצלומים, איורים וכד') ברמה שלא נופלת מזו שלנו. קיימת אפשרות שהציור כפי שאנחנו מכירים אותו - ואנחנו מכירים אותו כבר מאות ואלפי שנים - עומד להשתנות מהקצה אל הקצה.
לא רוצים לפספס אף כתבה? הצטרפו לערוץ הטלגרם שלנו
דבר כזה באמת לא ראינו עדיין; מבחר מסחרר של דימויים מקוריים ומורכבים במגוון גדול של סגנונות, עשויים בטכניקה מרשימה, מלאי פרטים, הומור, דמיון ושאר מרכיבי הסלט המכונה "יצירתיות" - כולם נוצרו ללא מגע יד אדם בידי המערכות החדשות.
7 צפייה בגלריה
תמונה שנוצרה על ידי Imagen
תמונה שנוצרה על ידי Imagen
יעילות, מהירות ודיוק אבל ללא תת-מודע אנושי. תמונה שנוצרה על ידי Imagen
(צילום: גוגל)
הכירו, אם טרם הכרתם, את DALL E2 (השם הוא מחווה לצייר סלבדור דאלי ולרובוט הקולנועי וול-E) של חברת OpenAI, ואת Imagen (השם קצת דבילי) של גוגל. דאלי-2 שוחררה באפריל ובמשך כמה שבועות השתזפה בלעדית באור הזרקורים עד שבאמצע מאי הוציאה גוגל את אימג'ן וקצת גנבה לו את התהילה; נכון לעכשיו נראה שהבינה המלאכותית של גוגל עדיפה על פני זאת של OpenAI (שנוסדה, בין השאר, על ידי אילון מאסק, וכיום מיקרוסופט מושקעת בה ביותר ממיליארד דולר), אבל המרוץ רק בתחילתו.
בינתיים, כל מה ששתי הבינות המלאכותיות צריכות כדי לנפק יצירה חדשה ומקורית, או לערוך מניפולציה על תמונה קיימת, הוא משפט אנושי (בכל זאת עדיין אי-אפשר לגמרי בלעדינו) במילים ברורות. תוכן המשפט יכול לנוע מהקונקרטי אל הדמיוני. מ"שדכן משרדי בעיצוב חדשני", דרך "דובון רוכב על סקייטבורד בטיימס סקוור בסגנון שנות ה-80", ועד ל"ציור בסגנון קומיקס עתידני של עצלן לבוש בטוקסידו אוכל צ'יזבורגר כשהוא רוכב על תלת-אופן בעיר פוסט-אפוקליפטית" – הכל הולך.
לכל משפט יחזירו המערכות, בתוך זמן קצר, כמה איורים שונים ומשונים. כל הדימויים יכולים להגיע כצילום ריאליסטי, כגרפיטי, כרישום בעיפרון או כיצירה בסגנון המדויק של אחד מגדולי הציירים בהיסטוריה. רק תבקשו.
התגובה למפגש הראשון עם היצירות היא וואו מלא התפעמות. גם (אם כי לא תמיד) מהאיכות האמנותית של התוצאה, אבל בעיקר מהתחושה שדאלי-2 ואימג'ן מצליחות לעמוד בנוח במקום שבו כף רגלה של בינה מלאכותית טרם דרכה: הן נותנות את התחושה שהן מבינות, מבינות באמת, את כוונת האדם.
גם אם תזינו להן משפטים משונים כמו "רובוטים צפים בסירות פדלים בתוך גלריה מוצפת מים, צופים בציורים של קלוד מונה התלויים על הקירות", או "שתי סוריקטות יושבות זו לצד זו על ראש הר ומביטות בנוף הנפלא" - הן יצליחו לבטא תכונות אנושיות (שמחה או פחד, למשל) ויחסים משפחתיים וחברתיים (סבתא ונכדה מרכיבות פאזל, למשל). שנית, למרות שחלק מהמשפטים לא יכולים להתקיים בעולם האמיתי, התמונה שמתקבלת הגיונית לגמרי בעיניים אנושיות, ומוכיחה שהתוכנות מבינות את מערכות היחסים בין המילים והאובייקטים בעולם שלנו. לא הישג של מה בכך.
ולא רק ההדיוטות מתלהבים; גם קהילת הבינה המלאכותית כמרקחה. "למודלים האלה יש יכולות שלא היו בעבר", אומר פרופ' רועי רייכרט מהפקולטה להנדסת תעשייה וניהול בטכניון, מוביל קבוצת המחקר בעיבוד שפה טבעית ומי שעומד בראש קתדרת שמידט לבינה מלאכותית בטכניון.
7 צפייה בגלריה
"סבתא ונכדה מרכיבות פאזל"
"סבתא ונכדה מרכיבות פאזל"
''יש תחושה שהמודלים האלו רכשו יכולות יצירתיות משל עצמם''
(איור: מתוך האינסטגרם של openaidall, בתוכנת Dall e 2)
הם מסוגלים, לדבריו, לייצר תמונות של עצמים קונקרטיים לצד תמונות אבסטרקטיות, להגיב לבקשות ולהוראות מורכבות (כמו תמונה שמכילה רשימה של עצמים), לשמור אינפורמציה על העולם ולהכליל אותה באופן שייראה טבעי והגיוני (למשל, "דיונון חייזרי קורא עיתון בעודו עובר בשער ליקום אחר") ולהשלים את מה שלא נמצא בהוראות בדרכים מקוריות (בציור של הסוריקטות הוסיפה אימג'ן בלונים פורחים בשמיים. סתם כי התחשק לה).
"היכולות הללו", אומר רייכרט, "נותנות את התחושה שהמודלים החדשים לא רק שיננו מיליארדי מסמכים, תמונות ותיאורים, אלא רכשו יכולות יצירתיות משל עצמם".
בערך כאן מצטרף אל ההתפעמות וההתלהבות אותו חשש מוכר ומתגנב ללב האנושי: אז זהו? שואל האדם את עצמו בתוגה, עכשיו גם את הציור לקחו לנו? לאן זה הולך ואיפה זה ייגמר? מה יהיה על הציירים ומה יהא על האמנות? ומה יהא עליי ומה אעשה כשהבינה המלאכותית תגיע אליי ותעשה את מה שאני עושה, רק טוב ממני? מה מיוחד בי?
אל תדאג, אדם יקר וחסר ביטחון, עד סוף הכתבה הזו תקבל תשובה, ואולי אפילו נחמה.
מה קורה שם בפנים? בלי להיכנס לעומק הטכנולוגיה, נסביר ששתי הבינות החדשות עובדות פחות או יותר באותה שיטה, המכונה "דיפוזיה". הן מבוססות על מודלים שונים להבנת שפה טבעית שמתמודדים עם הקלט האנושי.
בנוסף, מערכות שאומנו על מיליארדי תיאורים מילוליים המצורפים לתמונות מהאינטרנט, למדו לזהות את האובייקטים בתמונה, לנתח את היחסים ביניהם ולהשלים חוסרים. בנוסף הוזנו למערכת כמויות אדירות של הקשרים ויזואליים ולשוניים ומי יודע כמה מאות מיליוני פרמטרים אחרים - מדובר במפלצות מידע ומחשוב בהיקפים שרק חברות ענק יכולות להרשות לעצמן.
לאחר שהמשפט האנושי "הובן" על ידי מודל השפה, הוא יוצר על פיו תמונה חדשה מתוך הרעש הלבן שיוצרות כל האפשרויות לכל התמונות שיכולות להתקיים בעולם. זה נשמע מוזר כי זה באמת קצת מוזר; אפשר לחשוב על זה כמו פַּסָּל הגואל פֶּסֶל אחד מתוך גוש שיש המכיל את הפוטנציאל לכל הפסלים בעולם. לבסוף, המודל בוחן ומעריך את אמינות התמונה אל מול ניתוח כל התמונות שכבר קיימות בעולם.
אחד מחברי הצוות שמאחורי דאלי-2 אמר למגזין WIRED ששמונה מתוך עשרה ניסיונות לקבל תמונות עם מילים כמו "מנהל" או "פרופסור" חזרו עם תמונות של גבר לבן, לעומת בקשות כמו "עוזר/ת אישי" שנענו בתמונות נשיות בלבד (שהוצגו לרוב בצורה מינית)
איך בדיוק זה מתרחש? לא ברור עד הסוף. האדם יצר את המודלים האלה, אבל אף אחד לא באמת יודע לומר מה בדיוק מתרחש בראש של בינה מלאכותית שלימדה את עצמה, ואיך ייראה הדבר הבא שהיא תעשה. ככל שמבינים יותר את המערכות ואת יכולותיהן, מבינים אותן פחות ומופתעים יותר. לא תמיד לטובה.
סימן האזהרה הבולט הראשון הוא ששתי התוכנות סגורות לקהל; אי-אפשר בינתיים להתנסות בהן בעצמנו. מה שמציגים לנו הוא תמונות בוטיק שנבחרו בקפידה. OpenAI מציעה להצטרף לרשימת המתנה עלומה להתנסות בדאלי-2, אבל גוגל כבר הצהירה שבעתיד הנראה לעין אין לה שום כוונה לפתוח את אימג'ן לקהל הרחב.
הסימן טורד המנוחה השני הוא התמונות עצמן: הן הרבה יותר מדי חמודות. מדובר במתקפה חמידוּת מרוכזת: חיות מקסימות עושות דברים משעשעים - ג'ירפה רוכבת על אופנוע ים, ארנבונים קוראים עיתון ליד האח, כלבלב מציץ ממלונה עשויה סושי. החיות עשויות לא פעם מירקות - כמו נחש ענק עשוי גרגירי תירס או קוף עשוי פירות טרופיים - והירקות והפירות לרוב חובשים משקפי שמש ומנגנים בגיטרה.
יש כמובן לא מעט רובוטים: הם צופים באמנות או מבלים בארוחת ערב רומנטית כשברקע מגדל אייפל. מדי פעם נתקלים ביציאות מרגשות ונוגעות ללב באמת, כמו ציור מרוחק של "אישה נועלת את חנות הקסמים שלה השוכנת בעננים, כדור פורח מצפה לקחת אותה לביתה לסוף השבוע", אבל הרוב המוחלט חמוד עד כדי כאב בטן וילדותי עד לרמה מעוררת חשד.
7 צפייה בגלריה
"כסא אבוקדו"
"כסא אבוקדו"
תמונות הרבה יותר מדי חמודות
(איור: מתוך האינסטגרם של openaidall, בתוכנת Dall e 2)
ואכן, תהיה זו תמימות לחשוב שענקיות הטכנולוגיה משקיעות מיליארדי דולרים כדי להתחרות ביניהן מי תצייר בצורה אמינה יותר פנדה לבושה במעיל אדום ששותה מרטיני בפתח ליקום אחר. ברור שיש להן אינטרסים שונים לגמרי, והרבה פחות חמודים ביצירת בינה מלאכותית שיכולה להבין ולתקשר עם בני אדם ברמה גבוהה כל כך.
החשד מתחזק ומתבסס עם הסימן השלישי, והוא לא מה שיש בתמונות – אלא דווקא מה שאין בהן: ביצירות של דאלי-2 ואימג'ן אין כמעט בני אדם או פנים אנושיות ברורות. אין גם דימויים המציגים פעילות אנושית כלשהי המבוצעת על ידי בני אדם.
יותר מזה: מתוך מאות ואלפי דימויים שנוצרו על ידי התוכנה אין ולו פריים אחד המציג את הצד הפחות חמוד של החיים: אין שום דבר מכוער, מעליב, פוגעני או סתם נבזי. בדימויים של אימג'ן ודאלי-2 אין סטריאוטיפים, גזענות, שנאה, מיזוגיניה או הומופוביה. אין אלימות, אין סקס, שלא לדבר על פורנו-פנדות. אין פוליטיקה, אין שיימינג - בקיצור, אין אף אחד מהחומרים שמהם מורכב האינטרנט ביום-יום - בדיוק המרחב שבו התאמנו והתנסו התוכנות.
מתוך הודעת גוגל: "במהלך אימון התוכנה השתמשנו במערך נתונים מהאינטרנט אשר ידוע כמכיל מגוון רחב של תוכן בלתי הולם, כולל תמונות פורנוגרפיות, השמצות גזעניות וסטריאוטיפים חברתיים מזיקים. קיים סיכון שאימג'ן ירשה את ההטיות"
זה לא במקרה, כמובן. מתברר שמאחורי הפנדות הפרוותיות, החתלתולים המחייכים והדובונים בחליפות חלל, יש לדאלי-2 ולאימג'ן גם צד אפל שהחברות עושות כל מאמץ לחסום ולהסתיר; קוראים לזה סוגיית ההטיה (bias) וזו הבעיה הקשה ביותר של הבינה המלאכותית.
אין דרך מנומסת לכתוב את זה: אימג'ן ודאלי-2 סובלות מכל הרעות החולות שהוזכרו לעיל: הן מערכות בינה מלאכותית מערביות, לבנות, סקסיסטיות, שוביניסטיות, גזעניות והומופוביות שמחקות ומחזקות פחות או יותר את כל הסטריאוטיפים הרעים המוכרים.
אחד מחברי הצוות שמאחורי דאלי-2 אמר למגזין WIRED (בעילום שם) ששמונה מתוך עשרה ניסיונות לקבל תמונות עם מילים כמו "מנהל" או "פרופסור" (באנגלית, כמובן, המילים פונות לנשים ולגברים) חזרו עם תמונות של גבר לבן, לעומת בקשות כמו "עוזר/ת אישי" שנענו בתמונות נשיות בלבד (שהוצגו לרוב בצורה מינית). בקשות כ"כועס" או "אסיר" הניבו תמונות של גברים שחורים והיספנים, וכך הלאה. לפי דיווחים אחרים, חוקרים רבים טענו כי התוכנות עדיין לא בשלות לצאת לעולם, אבל דעתם נדחתה.
7 צפייה בגלריה
"ג'ירפה רוכבת על אופנוע ים"
"ג'ירפה רוכבת על אופנוע ים"
מה מסתתר מאחורי הציור הלא מזיק?
(איור: מתוך האינסטגרם של openaidall, בתוכנת Dall e 2)
החברות אפילו לא מנסות להסתיר את הבעיה. המסמכים שבהם פורסמו ופורטו החסרונות והסיכונים האפשריים לשימוש בתוכנות ארוכים יותר מהמאמרים המפרטים את היכולות והיתרונות שלהן. OpenAI הודתה בפשטות: "תוכנות המאומנות באינטרנט מקבלות את ההטיות של האינטרנט".
לא עזרו שלל מחסומים ומסננים שהותקנו במערכות. "למרות ההגבלות והאימון", נכתב באתר החברה שמנמק מדוע המערכת נותרת בינתיים סגורה לשימוש ציבורי רחב, "לדאלי-2 נשמרה היכולת ליצור עירום ותוכן מיני, שנאה או אלימות, ולשימוש בדאלי-2 יש פוטנציאל לפגיעה ביחידים ובקבוצות על ידי חיזוק סטריאוטיפים, השפלה, זלזול וביטול".
מתוך אתר היצרנית: "לדאלי-2 נשמרה היכולת ליצור עירום ותוכן מיני, שנאה או אלימות, ולשימוש בדאלי-2 יש פוטנציאל לפגיעה ביחידים ובקבוצות על ידי חיזוק סטריאוטיפים, השפלה, זלזול וביטול"
גם באתר של אימג'ן נכתבו דברים דומים: "במהלך אימון התוכנה השתמשנו במערך נתונים מהאינטרנט אשר ידוע כמכיל מגוון רחב של תוכן בלתי הולם, כולל תמונות פורנוגרפיות, השמצות גזעניות וסטריאוטיפים חברתיים מזיקים. קיים סיכון שאימג'ן ירשה את ההטיות החברתיות וקידדה סטריאוטיפים וייצוגים מזיקים, מה שהנחה את ההחלטה לא לשחרר את אימג'ן לשימוש ציבורי".
מה שאנחנו רואים בתמונות שפורסמו, אם כן, הוא רק את הקצה החמוד של הקרחון, ומתחת למים, כלומר בשרתים המאובטחים של דאלי-2 ואימג'ן, נחבאים כל הכעס, השנאה, האלימות, הדעות הקדומות והגזענות שיש למין האנושי להציע. נותר רק לתהות כמה זמן יצליחו החברות לעמוד במילתן ולשמור על התוכנות סגורות.
הבעיה הגדולה של סוגיית ההטיה בבינה המלאכותית היא שככל הנראה אין לה פתרון - אחרי הכול, את כל מה שהיא למדה, היא למדה מאיתנו, או לפחות מהגרסה המקוונת שלנו.
"ודאי שהתוכנות האלה מוטות", אומר ד"ר רועי צזנה, עתידן בחברת SparkBeyond לבינה מלאכותית וחוקר במרכז בלווטניק באוניברסיטת תל-אביב. "המודל לומד ממה שיש באינטרנט ומשחזר את מה שלמד. אפשר לומר שהם מציבים מראה מול העיניים שלנו. הסכנה היא כמובן הנצחת הסטריאוטיפים, ואפשר להתמודד עם ההטיה בשתי דרכים: להגדיר לתוכנות שיציעו מגוון, ומצד שני 'לתרבת' את המשתמשים בכלים, שיבינו את ההטיות המבניות וידרשו מהמכונה לקבל גיוון.
"השאלה היא לא רק איך להגדיר את הערכים למערכת; השאלה האמיתית והגדולה היא מהם הערכים הנכונים, הרצויים, שיש להכניס פנימה? אלה ממש לא דברים מובנים מאליהם".
7 צפייה בגלריה
תמונה שנוצרה על ידי Imagen
תמונה שנוצרה על ידי Imagen
''המודלים מציבים מראה מול העיניים שלנו''. תמונה שנוצרה על ידי Imagen
(צילום: גוגל)
וייתכן שתמיד תידרש יד אדם כדי לתקן את ערכיה המעוותים של המכונה. "לא ברור אם יש אפשרות למצוא פתרון טכנולוגי מקיף לבעיית ההטיה", אומר פרופ' רייכרט, "גם כי יש צורך וקושי להחליט מהי הטיה וכיצד לתקן אותה, וגם כי מאוד קשה לדעת אילו מבין מיליארדי הפרמטרים הם שאחראים להטיות ואיך ניתן לערוך אותם החוצה. וגם אם נצליח למצוא ולהגדיר את ההטיות - המודלים כבדים מדי. קשה מאוד לערוך מחדש את מה שלמדו רשתות ענק בנות מיליארדי פרמטרים שאומנו על מיליארדי טקסטים ותמונות.
"כך שבמקום פתרון טכנולוגי, סביר להניח שכמו לבעיות אחרות של אתיקה, טכנולוגיה וצדק חברתי, יידרשו גם פה מאמצים מתמשכים, דיון ציבורי וחשיבה על האופן הנכון לשימוש בכלים כאלה".
השאלה היא כמובן אם תאגידי ענק מסוג גוגל ו-OpenAI הן הגופים שעליהם אתם רוצים לסמוך בדיונים בנושאי צדק חברתי. "תחשוב על מערכות בינה מלאכותית שיכולות לעשות כל כך הרבה דברים, והן נשלטות על ידי חברות כאלה עם הערכים שלהן", אומר צזנה. "מי שמאמן את הבינה המלאכותית קובע את הערכים שהיא משקפת, וכולנו כפופים לערכים האלה. לכן צריך לשאול שאלות לגבי מידת האחריות המוטלת על החברות".
ועד שרמת האחריות הזאת תוגדר ובעיית ההטייה תצומצם לדרגה שתאפשר לציבור הרחב להתחיל להשתמש במערכות החדשות - אנחנו נשארים עם בינה מלאכותית שמפליאה לצייר במגוון רחב של סגנונות, מה שמעלה את השאלה הבסיסית עוד יותר: מה ההשפעה שתהיה לתוכנות כאלה על הציור, על האמנים ועל האמנות, האם הציירים והמאיירים יישארו בלי עבודה, האם הציור והאיור יאבדו את מעמדם כאחד מהביטויים המובהקים של נפש האדם, ואולי כל זה כבר קרה?
רועי צזנה, חוקר בינה מלאכותית: "בעיניי זה דבר נפלא. יש פה דמוקרטיזציה של האמנות ויכולת ההבעה. תמיד רציתי להיות צייר, אבל יש לי ידיים גרועות - והנה, פתאום יש לי את היכולת. כל מה שאני צריך זה רעיון טוב. יש פה ביטול של ההגבלות שהטבע העיוור והאקראי הטיל עלינו"
נועם גל, דוקטור לתולדות האמנות באוניברסיטה העברית, חוקר צילום ואמנות עכשווית, מאשר את התחושה: "זה מזכיר את המצאת הצילום בשנות ה-30 של המאה ה-19. היו רבים וטובים - כולל שארל בודלר - שטענו בתוקף שהצילום יחסל את הדמיון ואת הרוח האנושית. זהו, אמר בודלר - כבר לא צריך לדמיין יותר שום דבר, רק ללחוץ על כפתור.
"כמובן שהצילום לא חיסל את האמנות ולא את הדמיון או את הרוח האנושית, והפך למדיום אמנותי בפני עצמו, אבל הדבר היותר מעניין שקרה זה שהמצאת הצילום פיתחה את הציור. עד הצילום, הציירים ציירו את העולם במטרה לשקף אותו. בזכות המצלמה הגיע דור חדש של אמנים שהמציאו סגנונות חדשים, כמו הקוביזם והסוריאליזם, שלא ניסו להעתיק את המציאות אלא לפרש ולשנות אותה".
אז סתם דאגתי. "הדחף ליצור, להתבטא, להביע את היופי ואת ההתנגדות - כל היצרים האלה עדיין בתוכנו ואני לא רואה תוכנה חדשה באה ומחסלת אותם. אמנים תמיד שאלו שאלות עמוקות על עצמם ועל העולם, והם ימשיכו לעשות את זה. קואלה שמשחקת כדורסל? חמוד, אבל זהו".
גם בחזית האמנים לא נרשמה בהלה גדולה מדי. "בפעם הראשונה שראיתי את התוצאות", אומר האמן והמאייר יזהר כהן, "נבהלתי. האינסטינקט הראשון היה לומר 'הפסדנו'. אפשר להרגיש את הכרסום המתמשך של המכונה והמחשוב מאיימים על ההגדרה העצמית שלי, על מהות הקיום. אבל אז אני נרגע, יורד מההליקופטר ואומר, אדם יצר את המכונה הזו, היא חלק מהיצירה האנושית. גם זה חלק מהאבולוציה; התחלתי לצייר בעיפרון, ציירתי שנים בצבעי מים. כשהגיעו הכלים הדיגיטליים הפנמתי אותם והיום הם חלק ממני, מהחוויה שלי. זה רק מחדד את היצירתיות האנושית. בשורה התחתונה אני מודה לתופעה הזו כי היא מאתגרת אותי ומכריחה אותי לשאול את עצמי שאלות".
יש גם פחד? "הפחד שלי הוא לא שהמקום שלי כאדם יוצר יתכרסם, אלא יותר המעבר מיצירה של דימויים שמייצגים את המציאות האנושית לסביבה רוויה בדימויים שהם תוצאות של רעיונות דו-ממדיים, דברים חסרי חיים. כמו שהים מזוהם מניילונים ויש חלקיקי מיקרו-פלסטיק בתוך הדגים, אני פוחד שהתודעה שלנו, שגם ככה מזוהמת, חושיה יקהו עוד יותר, עד שהיא כבר לא תדע מה זה אורגני".
מה זה יעשה לאמנות? "המכונה מציירת לפי פרמטרים של מכונה: יעילות, מהירות, דיוק. כאנושות אנחנו מזהים 'טוב יותר' עם יעילות, אבל בסביבה האמנותית, היעילות היא לפעמים בעוכרינו, מביאה אותנו לתוצאה שהיא נעימה לעין אבל כלי ריק. הדבר הכי חשוב בתהליך היצירה זה תהליכי עומק בתת-המודע שעולים ומוצאים את עצמם בדימוי שהאדם יוצר - ודווקא פה צריך לקחת את הזמן, לחכות, לחשוב על דברים אחרים לגמרי. קשה לי להאמין שלמכונה יש פרמטר כזה. דווקא שם - בצער, בעצב, באימפקט שיש לעולם שמחוץ ליצירה על האדם - נמצא קו ההגנה האחרון של שרידות היוצר בסביבה הדיגיטלית של בינה מלאכותית".
7 צפייה בגלריה
"ציור שמן של משפחה מתאחדת מחדש בשדה תעופה"
"ציור שמן של משפחה מתאחדת מחדש בשדה תעופה"
''היעילות עלולה להביא לתוצאה שהיא נעימה לעין אבל כלי ריק''
(איור: מתוך האינסטגרם של openaidall, בתוכנת Dall e 2)
אבל אחרים עשויים לראות במודלים הממוחשבים החדשים דווקא בשורה משמחת שתהפוך את הציור לנחלת הכלל. "בעיניי זה דבר נפלא", אומר העתידן צזנה. "יש פה דמוקרטיזציה של האמנות ויכולת ההבעה. תמיד רציתי להיות צייר, אבל יש לי ידיים גרועות - והנה, פתאום יש לי את היכולת. כל מה שאני צריך זה רעיון טוב. יש פה ביטול של ההגבלות שהטבע העיוור והאקראי הטיל עלינו. מגמת הירידה ברמת המיומנות הנדרשת כדי להפיק יצירת אמנות טובה היא דבר מרגש".
"דברים דומים אמרו גם על המוזיקה האלקטרונית", מזכיר בועז לביא, סופר, תסריטאי, מרצה על אלגוריתמים יצירתיים ומגיש הפודקאסט "עושים תוכנה". "חשבו שזו רק טכנאות שלא תוכל לבטא רגש, והיום ברור שמדובר באמנות. אנשים מצליחים לבטא את עצמם דרך מוזיקה אלקטרונית ודרך טכנולוגיה בכלל. זה יקרה גם בתחום הזה. גם בעולם הגרפיקה יש המון כלים שיצאו בעשורים האחרונים ושינו לגמרי את צורת העבודה - ועדיין צריך מעצבים, נכון? הציפייה מהם פשוט השתנתה. כבר לא רק טכניקה אלא יצירתיות. בעולם הקפיטליסטי שלנו תמיד מחפשים 'יותר' - וה'יותר' הזה, זה משהו שהאדם נותן, לא המכונה. ככה זה יהיה תמיד".
איזה יתרון עוד יש לנו על הבינה המלאכותית? "כל הזמן אומרים שמתקרבים לבינה מלאכותית - וכל הזמן התחושה היא שזה עוד לא זה, עוד לא הגענו, עוד מעט, עוד קצת… זו תהיה תנועה די נצחית לדעתי, אם כי בזמן האחרון הקצב שלה מתגבר".
לי, בכל אופן, הדברים מזכירים את האהוב אלן ווטס, שאמר שככל שהמיקרוסקופים שלנו משתכללים, החומר מתחלק לחלקיקים יותר ויותר קטנים, וככל שהטלסקופים שלנו מתחזקים, הגלקסיות מתרחקות מאיתנו יותר ויותר מהר. כלומר, היקום תמיד שומר על רמה של מסתורין, לא מגלה את סודותיו. ומה שטוב ליקום, ודאי טוב לרוח האדם: תמיד יישאר ממנה משהו שאי-אפשר יהיה לתכנת.
המאייר יזהר כהן: "המכונה מציירת לפי פרמטרים של מכונה: יעילות, מהירות, דיוק. אבל הדבר הכי חשוב בתהליך היצירה אלה תהליכי עומק בתת-המודע שעולים ומוצאים את עצמם בדימוי שהאדם יוצר - ודווקא פה צריך לקחת את הזמן. קשה לי להאמין שלמכונה יש פרמטר כזה"
ואולי הייחוד האנושי המבדיל את האדם מהמכונה הוא דווקא משהו הרבה פחות רוחני, מסתורי וחמקמק והרבה יותר מעשי. לד"ר צזנה יש רעיון שובה לב: "תוך כמה עשורים הבינה המלאכותית תוכל לעשות את כל מה שאנחנו עושים - וטוב יותר מאיתנו", הוא אומר, "כולל אמנות. יש רק דבר אחד שהבינה המלאכותית לא תוכל להחליף, וזה המאמץ האנושי. לדוגמה, אני רוצה לשמח את אשתי ליום הנישואים במתנה: ציור המתאר את היום שבו נפגשנו. אני יכול ללכת לבינה המלאכותית, לכתוב לה את הסיפור במשפט או שניים והיא תפיק תוך כמה שניות ציור נהדר של שנינו על המדשאה בטכניון.
"האפשרות השנייה היא שאני הולך ולומד ציור כמה חודשים, קונה צבעים וקנבס ומצייר ציור נוראי אבל התאמצתי נורא עליו. מה היא תאהב יותר? ברור שאת המאמץ שלי, את זה שהבאתי משהו ממני. הדבר היחיד שאי-אפשר להחליף זה את עצם העשייה האנושית".
איזו עוד עשייה אנושית למשל? "דיברנו על אמנות, וזה חשוב, אבל מתי תדבר איתי על האפשרות שהבינה המלאכותית תחליף את הפוליטיקאים? אני חושב שאם האנושות רוצה לשרוד, חייבים שזה יקרה. לא עכשיו, אנחנו עוד לא שם, אבל אפשר להתחיל לחשוב על זה ברצינות".
חשבנו: למה שלא נבקש מדאלי-2, הבינה המלאכותית שיודעת לאייר, שתאייר בעצמה את הכתבה העוסקת בבינה מלאכותית שיודעת לאייר? נטלי פיסטונוביץ׳, שגרירה של OpenAI ובעלת גישה לדאלי-2, נרתמה למשימה בשמחה.
לפני כשנתיים השיקה החברה את GPT-3, מערכת הבינה המלאכותית שכותבת ומתקשרת בשפה אנושית (ומהווה בסיס לדאלי-2) וחיפשה מתנדבים שיאמנו את התוכנה. פיסטונוביץ׳, בוגרת הטכניון, הייתה מהראשונים שנרשמו. אין לה חניה דיפלומטית, אבל יש לה גישה מיידית למערכות שנמצאות בחוד החנית של התחום, כולל כאלה שעוד לא שמענו עליהן. "אני מקווה להיות בחזית כשיגיע הזמן לתקשר עם הרובוטים", היא אומרת בשיחת זום מברלין.
כיף לחכות לתמונה שנטענת - פרק זמן שלוקח לא יותר מ-15 שניות מרגע הלחיצה על מקש האנטר ועד שדאלי מציעה עשר וריאציות לאימאג' שייצרה. מה קורה שם בפנים, שואלת נועה, המעצבת שלנו. "הכי נכון יהיה לומר שדאלי-2 חולמת", אומרת פיסטונוביץ'.
כשגרירה, מקיימת פיסטונוביץ' שעות קבלה שבמהלכן ניתן לקבל דרכה גישה לדאלי. תפקידה לנצל את היכרותה עם המערכת, יכולותיה ומגבלותיה כדי לעזור לפונים לממש בצורה המיטבית את הרעיון שהם מבקשים להפוך לציור. כלומר, לנסח את הקלט שיעזור לדאלי להפיק את התמונה הכי טובה. או לפחות הכי קרובה למה שרצינו.
מדובר במקצוע חדש: "הנדסת/עיצוב קלט" (Prompt Engineering/Design) - משלח יד שנולד לפני כשנתיים כחלק מההתקדמות בתחומי הבינה המלאכותית. במגזינים הטכנולוגיים הנחשבים הוא מוכתר כאחת מ"קריירות העתיד".
גם דרך מתווכת היה מרגש לפגוש את דאלי-2. הזכיר לנו קצת את הימים הראשונים של האינטרנט; הכל קצת מקרטע ומוגבל, אבל התחושה היא שאתה ניצב, נלהב וחושש, מול התחלה של משהו שלא היה קודם ואין לדעת לאן יגיע. על כל "איזה יופי" שצהלנו היה "איזה פחד" שלחשנו.
לא קל להוציא מדאלי-2 תוצאה מעניינת. היא מתקשה עם הוראות מופשטות, משחקי מילים, פנים ספציפיות, קלטים ארוכים. חלק מהציורים קצת מכוערים, לפעמים נדמה שהיא די סתומה ואין לה טיפת חוש הומור. אבל פה ושם יש לה יציאות ששומטות לך את הלסת.
אני מציע את המשפט "תוכנת בינה מלאכותית מציירת פורטרט עצמי ובו היא נראית מאיירת כתבת מגזין על תוכנות בינה מלאכותית שמציירות ציורים, בחלל".
"יש פה הרבה משפטים מופשטים", אומרת פיסטונוביץ' ומנסה לביים את הסצנה. "כשאתה חושב על בינה מלאכותית שמציירת בינה מלאכותית, איך זה נראה, כמו רובוט? והציור - שרטוט בעיפרון או אמנות דיגיטלית? ומה הרקע, ירוק-שחור של המטריקס או ענני פסטל?"
7 צפייה בגלריה
האיור של דאלי־2
האיור של דאלי־2
תוכנת בינה מלאכותית מציירת פורטרט עצמי ובו היא נראית מאיירת כתבת מגזין על תוכנות בינה מלאכותית שמציירות ציורים, בחלל. האיור של דאלי-2
(איור: מתוך האינסטגרם של openaidall, בתוכנת Dall e 2)
אנחנו מנסים כל מיני אפשרויות. כיף לחכות לתמונה שנטענת - פרק זמן שלוקח לא יותר מ-15 שניות מרגע הלחיצה על מקש האנטר ועד שדאלי מציעה עשר וריאציות לאימאג' שייצרה. מה קורה שם בפנים, שואלת נועה, המעצבת שלנו. "הכי נכון יהיה לומר שדאלי-2 חולמת", אומרת פיסטונוביץ'.
אנחנו עוברים בין סגנונות, מנסים קלטים שונים, מ"איור לכתבת מגזין על בינה מלאכותית בסגנון רטרו-עתידני", דרך "הולוגרמה של פנים במעבדה מלאה במחשבים" ועד "יד בממד אחר אוחזת במכחול ומציירת". דאלי-2 חולמת את המשפטים שלנו ומביאה תוצאות ברמות משתנות - אבל ככה זה גם בחלומות שלנו, לא?
אנחנו מנסים "אדם בשנות ה-50 יושב על ספה וקורא עיתון, בחלל, מאחוריו הולוגרמה". דאלי קצת התבלבלה בין אדם בן 50 לבין ציור של אדם בסגנון שנות ה-50, אבל התוצאה מעניינת מאוד. זה קצת משונה, אבל נדמה לי שגם דאלי-2 נהנית, לא רק אנחנו. וזו באמת רק ההתחלה.