אחרי שהתרגלנו למחוללי תמונות וטקסטים כמו DALL-E2 ו-ChatGPT, העובדה שבינה מלאכותית יכולה לכתוב שירים בכוחות עצמה לא באמת צריכה להפתיע אותנו. חוקרים בגוגל הציגו בסוף השבוע תוספת חדשה לעולם הבינה המלאכותית היוצרת - MusicLM, כלי מבוסס AI שיכול ליצור קבצי מוזיקה על בסיס פקודות טקסטואליות.
1 צפייה בגלריה
רובוט מנגן בפסנתר
רובוט מנגן בפסנתר
גוגל הציגה מחולל מוזיקה - אבל היא לא רוצה שתשתמשו בו
(צילום: shutterstock)

עוד כתבות שיעניינו אתכם:

הכלי החדש פותח על ידי חוקרים מ-Google Research, זרוע המחקר של ענקית הטכנולוגיה, במטרה ליצור קבצי מוזיקה באיכות גבוהה באמצעות תיאורים טקסטואליים בסגנון "מנגינה מרגיעה שמנוגנת על ידי כינור בליווי ריף גיטרה עם דיסטורשן".
MusicLM אינו מחולל המוזיקה הראשון בעולם, אבל החוקרים שמאחוריו אומרים שהביצועים שלו טובים יותר בהשוואה למודלים קודמים, הן באיכות האודיו והן בנאמנות לתיאור הטקסטואלי. יתרון נוסף של MusicLM הוא שניתן להזין אליו קובץ עם זמזום או שריקה ולבקש ממנו ליצור קובץ חדש עם אותה מנגינה בסגנון אחר.
החוקרים פרסמו שורה של קבצי מוזיקה שנוצרו באמצעות MusicLM, והתוצאות מרשימות למדי אם לוקחים בחשבון את העובדה שמדובר במוזיקה שנוצרה על ידי בינה מלאכותית ללא מעורבות של מוזיקאים בשר ודם. אלה לא שירים קוהרנטיים לגמרי, אבל המערכת מבינה היטב כיצד אמור להישמע שיר ג'אז וכיצד הוא אמור להתפתח, או מהם סימני ההיכר של סגנון EDM. בסגנונות אחרים - למשל ראפ ודת' מטאל - התוצאות פחות משכנעות.

ג'יבריש במקום מילים

המודל יודע גם ליצור קבצי מוזיקה שמתפתחים על בסיס תיאורים טקסטואליים שונים שמוזנים אליו (למשל "שיר אלקטרוני במשחק מחשב" ולאחר מכן "שיר מדיטציה ליד נהר"), ולהבדיל בין "נגן מתחיל" לבין "נגן מתקדם". הוא אפילו יודע איזו מוזיקה אנחנו מצפים לשמוע בחדר כושר ואיזה סגנון השמיעו במועדונים בשנות ה-60 לעומת שנות ה-90. עם זאת, נקודת תורפה משמעותית היא המילים, שלרוב נשמעות כמו ג'יבריש.
האם מוזיקאים צריכים לחשוש מ-MusicLM? כרגע, לא ממש. התוצרים שלו אומנם מרשימים מאוד, אבל גם מאוד בסיסיים ומוגבלים. בכלל, האפשרות שמודל בינה מלאכותית יחליף אי פעם את המוזיקאים האהובים עלינו נראית מאוד לא סבירה. מצד שני, אפשר לדמיין איך תוך כמה שנים מערכות כאלה ישמשו ליצירת מוזיקה פונקציונלית שמשרתת מטרה מאוד ספציפית, למשל פסקולים של סרטוני וידאו ומשחקי מחשב, או מוזיקת רקע בבתי קפה.
מה זה בינה מלאכותית גנרטיבית?
בינתיים, בכל מקרה, גוגל בכלל לא מתכוונת לשחרר את MusicLM לציבור. החוקרים מסבירים כי הסיבות הן חשש מהטיה כלפי סגנונות שאינם מיוצגים מספיק בדאטה סט (מאגר המידע) שעליו המודל התאמן, לצד חשש מניכוס תרבותי. בנוסף, כ-1% מהתוצרים של המודל מזכירים שירים קיימים, מה שמעלה חשש להפרת זכויות יוצרים. לפי החוקרים, יש צורך בעבודה נוספת על מנת להתמודד עם הסיכונים הכרוכים ביצירת מוזיקה על ידי מכונה.