אחרי חודשים של ציפייה, גוגל הכריזה היום (ד') על ג'מיני (Gemini, "מזל תאומים"), מודל הבינה המלאכותית המתקדם ביותר שיצרה אי פעם. מדובר במאמץ המשמעותי ביותר של ענקית הטכנולוגיה להשיב מלחמה למיקרוסופט ו-OpenAI שהפכו בשנה החולפת לכוח הדומיננטי ביותר בתחום הבינה המלאכותית היוצרת.
3 צפייה בגלריה
ג'מיני
ג'מיני
ג'מיני. מודל מולטי-מודאלי
(עיבוד תמונה. צילום: גוגל, shutterstock)
ג'מיני הוא מודל מולטי-מודאלי שיודע לעבד סוגים שונים של דאטה - טקסט, תמונות, וידאו וקוד. גוגל פרסמה טבלה שלפיה הביצועים של ג'מיני עולים על אלה של GPT-4 מבית OpenAI, שנחשב למודל הבינה המלאכותית המתקדם ביותר בשוק, בשורה של מדדים.
למעשה, ג'מיני הוא סדרה של מודלים בגדלים שונים שמיועדים למקרי שימוש שונים: אולטרה הוא המודל הגדול והמתוחכם ביותר שמיועד למשימות מורכבות; פרו הוא מודל ביניים שיכול לבצע משימות שונות בהיקפים גדולים; וננו הוא המודל הקטן ביותר שמיועד לביצוע משימות על מכשירי קצה, בניגוד למודלים הגדולים יותר שרצים על שרתים מרוחקים.
ריפרש
מי משבש את ה-GPS שלנו? / עם ד"ר הראל מנשרי
23:15
גוגל מתכננת לשלב את ג'מיני בשורה של מוצרים שונים. הראשון הוא הצ'אטבוט בארד שהחל מהיום יתבסס על ג'מיני פרו בשאילתות טקסטואליות בשפה האנגלית ביותר מ-170 מדינות, כולל ישראל. יכולות מולטי-מודאליות ותמיכה בשפות נוספות יתווספו בהמשך. לפי החברה, ג'מיני פרו משפר משמעותית את היכולות של בארד במגוון משימות כמו הבנה וסיכום, הסקת מסקנות, סיעור מוחות, כתיבה ותכנון.

צ'אטבוט משודרג

בשנה הבאה מתכוונת גוגל להשיק גרסה מתקדמת יותר של הצ'אטבוט, Bard Advanced, שתהיה מבוססת על המודל הגדול יותר, ג'מיני אולטרה. עדיין לא ברור אם גוגל תגבה תשלום על הגרסה המשוכללת יותר, בדומה ל-OpenAI שגובה 20 דולר בחודש על השימוש בגרסה מתקדמת של ChatGPT שמבוססת על GPT-4.
גרסת הננו של המודל מגיעה לסמארטפון הדגל של גוגל, פיקסל 8 פרו, והיא תאפשר לתמלל קבצי קול מאפליקציית הרשמקול ולשפר את ההצעות של פיצ'ר Smart Reply במקלדת הווירטואלית של גוגל, קודם כל בוואטסאפ ובהמשך באפליקציות נוספות. בשנה הבאה תגיע לפיקסל גרסה מתקדמת של הסייעת הקולית גוגל אסיסטנט, שתהיה מבוססת על ג'מיני ננו. העובדה שהמודל רץ על המכשיר עצמו ולא בענן מאפשרת לשמור על הפרטיות של המשתמשים, לקצר את זמן השיהוי ולהשתמש מיכולות AI מתקדמות גם ללא חיבור לאינטרנט.
החל מהשבוע הבא תאפשר גוגל ללקוחות שירות הענן שלה, גוגל קלאוד, להשתמש בג'מיני פרו על מנת לבנות באמצעותו יישומים. מפתחים יוכלו לבנות אפליקציות מובייל באמצעות ג'מיני ננו, תחילה עבור מכשירי פיקסל 8 פרו בלבד. מנכ"ל גוגל, סונדר פיצ'אי, אמר כי היכולות של ג'מיני הן פורצות דרך וכי הן "יקנו למפתחים וללקוחות ארגוניים דרכים חדשות לפתח ולצמוח באמצעות בינה מלאכותית".
ג'מיני צפוי להגיע בהמשך למוצרים נוספים של גוגל, בהם מנוע החיפוש, שירות המודעות, דפדפן כרום והעוזר החכם Duet AI. החברה הודיעה שהיא כבר "מתנסה" עם ג'מיני במסגרת SGE, חוויית החיפוש שמבוסס על בינה מלאכותית יוצרת וזמינה היום באופן מוגבל בלבד.
בגוגל אומרים כי גרסת הביניים, ג'מיני פרו, עוקפת את GPT-3.5, הדור הקודם של מודל השפה של OpenAI, בשישה מתוך שמונה מדדים, כולל MMLU (הבנת שפה רב-משימתית מסיבית). ג'מיני אולטרה, הגדול יותר, הוא הדגם הראשון שביצועיו עולים על אלה של מומחים אנושיים במדד MMLU. הוא קיבל ציון של 90.04% במדד זה, בבדיקה המשלבת 57 תחומים כגון מתמטיקה, פיזיקה, היסטוריה, משפטים, רפואה ואתיקה. הוא גם יודע להבין, להסביר וליצור קוד ברמה גבוהה בשפות התכנות הפופולריות בעולם כמו C++, Python, Java, ו-Go.
3 צפייה בגלריה
GPT-4
GPT-4
הנמסיס, GPT-4
(צילום: Tada Images / Shutterstock.com)
עם זאת, גרסת האולטרה תהיה זמינה לשימוש רק בשנה הבאה. בגוגל אומרים כי החברה מסיימת בימים אלה את בדיקות האמון והבטיחות של המודל וממשיכה לשפר אותו באמצעות משוב אנושי, טכניקה שנקראת Reinforcement Learning from Human Feedback, או RLHF.
בגוגל אומרים כי הקדישו תשומת לב רבה לתחום הבטיחות ונקטו פעולות כדי למנוע הטיות (bias) ורעילות (toxicity) בתוצרים של ג'מיני. המודל נבחן באמצעות טכניקות של הערכה לעומתית כדי לזהות בעיות בטיחות קריטיות שעלולות לצוץ, וגוגל משתפת פעולה עם מומחים ושותפים חיצוניים שמעמידים את המודל בפני בדיקות מחמירות במגוון נושאים. גוגל בנתה מסווגי בטיחות יעודיים על מנת לזהות, לתייג ולמיין תוכן בעייתי, שכולל בין היתר אלימות או סטריאוטיפים שליליים.

עדיין הוזה

בתדרוך לעיתונאים שנערך לקראת ההשקה אמר אלי קולינס, סגן נשיא לתחום המוצר בגוגל דיפמיינד, חטיבת ה-AI של ענקית הטכנולוגיה, כי החברה הצליחה לשפר את הדיוק העובדתי של ג'מיני בהשוואה למודלים קודמים, אך הודה כי תופעת ההזיות (hallucinations) - שבמסגרתה מודלים של בינה מלאכותית מספקים למשתמשים תגובות עם מידע שאינו נכון עובדתית - נותרה בלתי פתורה. מדובר באחת הבעיות המשמעותיות בתחום ה-AI, שמונעת אימוץ נרחב יותר של מודלי שפה.
(גוגל מדגימה את היכולות של ג'מיני)
גוגל אימנה את ג'מיני באמצעות TPUs (יחידות עיבוד מסוג טנזור) שהיא פיתחה בעצמה, ולא על GPUs (יחידות עיבוד גרפיות) של חברת אנבידיה, שהפכו בשנים האחרונות לפתרון הנפוץ ביותר לאימון והרצה של מודלי AI. בגוגל אומרים כי למרות שג'מיני גדול יותר ממודלים קודמים שפיתחה החברה, הוא מהיר ויעיל יותר מהם מבחינה אנרגטית כשהוא רץ על TPUs. לצד ההכרזה על ג'מיני השיקה גוגל שבב AI חדש בשם TPU v5p. בכך היא מצטרפת לאמזון ומיקרוסופט שהשיקו בשבועות האחרונים שבבי AI משלהן בניסיון להפחית את התלות באנבידיה.
3 צפייה בגלריה
חוות שרתים עם TPUs של גוגל
חוות שרתים עם TPUs של גוגל
חוות שרתים עם TPUs של גוגל
(צילום: גוגל)
גוגל משיקה את ג'מיני כמה ימים אחרי שב-OpenAI חגגו שנה ל-ChatGPT, הצ'אטבוט הפופולרי של החברה שהצית מרוץ חימוש בתחום הבינה המלאכותית והגיע לאחרונה ל-100 מיליון משתמשים שבועיים פעילים. גוגל היא מי שפיתחה ב-2017 את ארכטיקטורת טרנספורמר שעליה מבוססים ChatGPT ולמעשה כל מודלי השפה המודרניים, אך עד השנה היא היססה לשלב את הטכנולוגיה המתקדמת במוצרי הליבה שלה.
ההשקה של ChatGPT בסוף 2022 ושיתוף הפעולה המתהדק בין OpenAI לבין מיקרוסופט, שהשקיעה בסטארט-אפ הבינה המלאכותית 13 מיליארד דולר והטמיעה את המודלים שלו במוצרי הליבה שלה, הובילו לשינוי מפת הדרכים של גוגל. בשנה האחרונה השיקה גוגל שורת מוצרים מבוססי AI, בהם הצ'אטבוט בארד ו-SGE, חוויית חיפוש מבוססת בינה מלאכותית יוצרת שזמינה היום באופן מוגבל בלבד. ההשקה של ג'מיני, מודל בינה מלאכותית מתקדם שעליו תבסס גוגל את מוצרי ה-AI שלה, היא הניסיון המשמעותי ביותר של החברה להפוך את היוצרות ולחזור לעמדת ההובלה בתחום שמסתמן כחשוב ביותר בעולם הטכנולוגיה בימינו.