חברת מטא (לשעבר פייסבוק) מציגה היום (ד') את NNLB-200 - מודל בינה מלאכותית שיכול לתרגם 200 שפות שונות. זאת, בניגוד למודלים מסורתיים יותר שמסוגלים לתרגם משפה אחת לשפה אחת אחרת בלבד, ושדורשים מאגרי מידע של מיליוני משפטים מקבילים בשתי השפות כדי לקבל תרגום באיכות גבוהה. לפי החברה, המודל החדש זקוק לפחות דוגמאות ועדיין מספק תרגום מדויק ואיכותי יותר בכ-44% בממוצע לעומת מוצרים קודמים. שמו של המודל הוא ראשי תיבות של No Language Left Behind - פרויקט של מטא שמטרתו לפתח יכולות תרגום מבוססות מכונה עבור רוב השפות בעולם.

עוד בנושא:

בנוסף, יצרו בחברה מאגר בשם FLORES-200 שמטרתו לוודא כי התרגומים המתקבלים הם באיכות גבוהה, וסיננו ביטויים מסוימים בכל שפה כדי לפקח על המודל ולצמצם את האפשרות שהוא מייצר מידע שגוי או תכנים לא בטוחים במסגרת התרגומים.
2 צפייה בגלריה
NNLB-200, תמונת אילוסטרציה
NNLB-200, תמונת אילוסטרציה
NNLB-200, תמונת אילוסטרציה
(תמונה: מטא)
הטכניקות החדשות הללו וממצאי המחקר של חטיבת ה-AI במטא ייושמו בפלטפורמות המדיה החברתית שהיא מפעילה, בהן פייסבוק ואינסטגרם. לדברי החברה, הן יתמכו בכל יום במעל 25 מיליארד תרגומים. בנוסף, התרגומים יוכלו לסייע באיתור תכנים פוגעניים ודיסאינפורמציה בפלטפורמות. בהמשך הדרך, בחברה מעוניינים כי המודל יאפשר לאנשים לקחת חלק במטאברס העתידי, שהחברה משקיעה מאמצים רבים בהקמתו.
מודל התרגום, מודל ההערכה וטכנולוגיות קשורות נוספות יונגשו בקוד פתוח כדי לסייע לחוקרים אחרים. מטא גם תספק מענק של 200 אלף דולר לארגונים ללא מטרות רווח שיבנו יישומים למודל. בנוסף, בחברה משתפים פעולה עם קרן ויקימדיה, הארגון שמפעיל את ויקיפדיה, שפועלת ב-300 שפות אך ברובן יש היום פחות מאמרים לעומת ה-6 מיליון שמוצעים באנגלית. הטכנולוגיה החדשה נמצאת כעת בשימוש בכלי התרגום שמאפשר לעורכי ויקיפדיה לתרגם מאמרים במעל 20 שפות שאין בהן מאגרי מידע נרחבים שנדרשו לאימון מערכות AI, ומתוכן עשר שלא נתמכו לפני כן על ידי כלי תרגום מכונה כלל.
לפי הודעת החברה, עבור מיליארדי בני אדם, תכנים דיגיטליים אינם נגישים מאחר שכלי תרגום ברמה גבוהה לא קיימים בשפות רבות, ובעיקר כאלו המדוברות באפריקה ואסיה, ולכן נמנע מהם להשתתף בשיחות שונות וקהילות אונליין. בין היתר, במטא ציינו כי פחות מ-25 שפות אפריקאיות נתמכות על-ידי כלי התרגום שנמצאים בשימוש הנרחב ביותר היום, ובמקרים רבים איכות התרגום בהן נמוכה. לעומת זאת, הוצהר כי NLLB-200 תומך ב-55 שפות אפריקאיות באיכות גבוהה.
2 צפייה בגלריה
מארק צוקרברג
מארק צוקרברג
מארק צוקרברג
(צילום: GettyImages)
מארק צוקרברג, מייסד ומנכ"ל מטא, אמר כי "מדהים לראות עד כמה בינה מלאכותית משפרת את כל השירותים שלנו. הטכניקות והמודלים שאנחנו בונים במסגרת הפרויקט יסייעו לייצר תרגום איכותי לשפות שבהן מדברים מיליארדי אנשים ברחבי העולם. כדי לסבר את האוזן – המודל שלנו, שתומך כרגע ב-200 שפות, משתמש ביותר מ-50 מיליארד פרמטרים שונים. אימנו אותו באמצעות מחשב העל החדש שלנו, אחד ממחשבי העל המהירים והמתקדמים בעולם. אינטרקציה בין-אישית בשפות שונות היא כוח-על שכעת בינה מלאכותית תאפשר – ככל שנמשיך להשקיע בפיתוחי בינה מלאכותית, היא תוכל לשדרג כל דבר שאנחנו עושים, החל מהצגת תכנים מעניינים בפייסבוק ובאינסטגרם, דרך המלצות על המודעות הרלוונטיות ביותר, ועד לשמירה על ביטחון המשתמשים בפלטפורמות השונות".