בשבועות האחרונים נדמה שבכל יום צץ ברשת מודל בינה מלאכותית חדש שיודע ליצור תמונות על בסיס פקודות טקסטואליות. OpenAI הדהימה את העולם כשהשיקה את DALL-E2 באפריל האחרון ומאז זכינו להכיר את Imagen של גוגל, Make-A-Scene של מטא, Craiyon, Midjourney ואחרים. אפילו לטיקטוק יש מודל text-to-image שמאפשר למשתמשי הרשת החברתית להקליד משפט וליצור תמונה (לא מאוד מוצלחת) שמבוססת עליו.
עוד כתבות שיעניינו אתכם:
הכוכב החדש בסצינה הזאת הוא Stable Diffusion של סטארט-אפ הבינה המלאכותית Stabillity AI, שעלה לרשת לפני ימים ספורים. התוצרים שלו מזכירים מאוד את DALL-E2, אבל יש כמה הבדלים משמעותיים: הצנזורה של Stabillity AI מינימלית, ובניגוד ל-Open AI שאוסרת ליצור תמונות שבהן מופיעים אנשים אמיתיים, Stable Diffusion מאפשרת ליצור תמונות בכיכובם של פוליטיקאים כמו נשיא ארה"ב ג'ו ביידן, ראש הממשלה יאיר לפיד, ראש האופוזיציה בנימין נתניהו וכן של ידוענים למיניהם. באופן רשמי המערכת אוסרת על יצירה של תוכן אלים או מיני, אך היא לא מונעת זאת בפועל ולכן גם תמונות מהסוג הזה כבר מסתובבות באינטרנט.
"למי שעומד מאחורי המודל אין שום עכבות בעניין של להוציא אותו לחופשי ולתת לאנשים להשתמש בו בלי צנזורה", אומר מתי מריאנסקי, מומחה לבינה מלאכותית ומייסד קהילת "עליית המכונות" בפייסבוק. "אפשר בלי בעיות להוציא תמונות של היטלר או תמונות פורנו".
ההבדל המשמעותי השני הוא שמדובר בפרויקט קוד פתוח. זה אומר שמשתמשים יכולים להריץ אותו על המחשב הפרטי שלהם (בהנחה שהוא מספיק חזק) ושקהילת המפתחים יכולה לבנות על גביו יישומים נוספים. למעשה, זה כבר קורה: מפתחי תוכנת עריכת הווידאו Runway הציגו סרטון שבו מופיע שחקן טניס כאשר הרקע מאחוריו משתנה באמצעות פקודות טקסט - ממגרש טניס למגרש חול, לפני הירח, ליער מכושף ועוד ועוד.
מי שעומד מאחורי Stabillity AI הוא עימאד מוסטאק, בוגר תואר שני במתמטיקה ומדעי המחשב באוניברסיטת אוקספורד. אחרי שעבד כאנליסט בקרנות גידור, הוא יזם ב-2019 פרויקט בשם Symmitree שנועד להוזיל את הגישה לסמארטפונים ולאינטרנט בקהילות מוחלשות וב-2020 היה הארכיטקט הראשי של ארגון שנועד לסייע למקבלי ההחלטות להתמודד עם מגפת הקורונה באמצעות יישומי מחשב. את Stabillity AI הוא הקים לדבריו ב-2020 במטרה להשתמש בבינה המלאכותית באמצעות קהילת הקוד הפתוח באופן שישרת ויקדם את האנושות.
מוסטאק הבהיר לאתר הטכנולוגיה TechCrunch כי החברה שלו עצמאית לחלוטין. "לאף אחד אין זכות הצבעה חוץ מל-75 העובדים שלנו - לא למיליארדרים, לא לקרנות הגדולות, לא לממשלות ולא לאף אחד אחר". באותה שיחה הוא התייחס גם לחשש שאנשים ישתמשו במודל בשביל ליצור תוכן פוגעני ואמר כי הוא בונה על כך שהקהילה תבנה כלים שימנעו שימוש לרעה: "אחוז מסוים מהאנשים הם פשוט לא נחמדים ומוזרים, אבל זוהי האנושות. אנו מאמינים שהטכנולוגיה הזאת תהיה נפוצה, והגישה הפטרנליסטית והמתנשאת במידת מה של מומחים רבים לבינה המלאכותית היא מוטעית בכך שהיא לא סומכת על החברה האנושית".
רוצים לנסות את המודל בעצמכם? נכון לעכשיו הוא אינו פתוח למשתמשים חדשים, אך ניתן להצטרף לרשימת ההמתנה לגרסת הבטא בקישור הזה. עד אז, אתם יכולים ליהנות מיצירותיהם של משתמשים אחרים: