הסינים שוב העתיקו? מפתחת ChatGPT עולה למתקפה נגד דיפסיק

עליית הסטארט אפ הסיני העלום "דיפסיק" (DeepSeek) לכותרות בעקבות הצגתו לעולם של המודל R1, הפך, שוב, את הבינה המלאכותית (AI) לנושא החם ביותר בעולמות הטכנולוגיה והפיננסים. ההשפעה הייתה כה עוצמתית, עד כי אנבידיה, חברת השבבים ומי שהחזיקה בתואר "החברה הגדולה בעולם", איבדה בתחילת שבוע המסחר כ-17% משווי המניות שלה, או כ-600 מיליארד דולר. 
4 צפייה בגלריה 
דיפסיק - החברה הסינית שמטלטלת את עולם ה-AI
(shutterstock)
במקביל, OpenAI, מפתחת ChatGPT, יצאה אתמול (ג') למתקפה על החברה הסינית והאשימה אותה שהשתמשה בצ'אטבוט שלה כדי לאמן את המודל החדש R1 אותו הציגה כאמור לעולם בשבוע שעבר. מטא מצד שני אמנם נכנסה לנוהל חירום, אך גם החמיאה לדיפסיק וטענה שהבחירה של החברה, כמו גם של מטא עצמה, לפתח מודלי AI בקוד פתוח, התבררה כנכונה בסופו של דבר. במילים אחרות – עולם ה-AI כמרקחה. 
האם הסינים שוב פעם העתיקו טכנולוגיה מערבית?
עם זאת, ההכרזה של OpenAI היא זו שתפסה את עיקר הכותרות. לפי הטענה של החברה, היא מצאה ראיות לכך שדיפסיק השתמשה במודלים הקנייניים של OpenAI כדי לאמן את המודלים שלה, כאשר החשש הוא מפני הפרה פוטנציאלית של קניין רוחני. הטענה האחרונה קצת רוויה בחוסר מודעות עצמית יש לציין, שכן OpenAI עצמה מואשמת בהפרות דומות על ידי יצרני תוכן מהגדולים בעולם. 
מפתחת ChatGPT מסרה ל"פייננשל טיימס" כי ראתה ראיות מסוימות ל"זיקוק" (distillation), שלטענתה מקורו בדיפסיק. טכניקה זו משמשת מפתחים כדי להשיג ביצועים טובים יותר במודלים קטנים על ידי שימוש בתשובות ממודלים גדולים, ומאפשרת להם להשיג תוצאות דומות במשימות ספציפיות בעלות נמוכה בהרבה. 
4 צפייה בגלריה 
מנכ"ל OpenAI, סם אלטמן (ימין), מציג את o3. האם הסינים גנבו קניין רוחני של החברה?
(OpenAI)
במילים פשוטות – OpenAI טוענת שהחברה הסינית השתמשה ב-ChatGPT כדי לאמן את המודל שלה. זיקוק הוא אמנם נוהג נפוץ בתעשייה, אך החשש הוא שדיפסיק עשויה לעשות זאת כדי לבנות מודל יריב משלה, מה שמהווה הפרה של תנאי השירות של OpenAI. 
במקביל, מקור בעל ידע ישיר בנושא חשף כי OpenAI ושותפתה מיקרוסופט חקרו בשנה שעברה חשבונות שלפי החשד היו שייכים לדיפסיק והשתמשו בממשק תכנות האפליקציות (API) של OpenAI. בעקבות ממצאי החקירה, אותם חשבונות נחסמו בחשד להפעלת אותו "זיקוק" שהפר את תנאי השירות. 
"נוהג נפוץ מאוד, במיוחד בחברות קטנות"
לצד זאת, גורמים בתעשייה טוענים כי "זיקוק" הוא נוהג נפוץ עבור מעבדות בינה מלאכותית בסין, כמו גם בארה"ב, המשתמשות בתשובות מחברות כמו OpenAI כדי ללמד את המודלים שלהם להפיק תגובות "אנושיות" יותר. "שחקנים קטנים יותר לעתים קרובות 'רוכבים על הגב' של העבודה שהשקיעו החברות הגדולות", כך לטענתם. 
לצד זאת, בממשל החדש מודאגים מהאירוע ודייויד סאקס, "צאר" הבינה המלאכותית והקריפטו של הנשיא דונלד טראמפ, אף אמר כי "ייתכן" שגניבת קניין רוחני אכן התרחשה. "יש טכניקה בבינה מלאכותית שנקראת זיקוק, כאשר מודל אחד לומד ממודל אחר וסוג של שואב את הידע ממודל האב", טען סאקס בראיון ל"פוקס ניוז". 
"ישנן ראיות משמעותיות לכך שמה שדיפסיק עשתה הוא זיקוק של הידע ממודלים של OpenAI, ואני לא חושב ש-OpenAI מרוצה מכך", הוסיף סאקס, אם כי לא סיפק ראיות לטענות שלו, או של OpenAI לצורך העניין. 
4 צפייה בגלריה 
נתונים אותם מציגה דיפסיק המציגים את המודל לעומת המתחרים
(דיפסיק)
ויש גם את העניין ה"פעוט" של השבבים
במקביל, בזמן שדיפסיק טענה כי השתמשה רק ב-2,048 שבבי H800 של אנבידיה (גרסה פחות מתקדמת המותרת לייצוא לסין, ר"ק) והוציאה רק 5.6 מיליון דולר כדי לאמן את המודל V3 שלה, מומחים שונים טוענים כי הסינים לא אומרים אמת ולמעשה הצליחו לקבל גישה לכמות גדולה של שבבים מתקדמים שלא היו אמורים להגיע אליהם לפי החוק האמריקאי. 
בראיון ל-CNBC, טען מייסד ומנכ"ל חברת ScaleAI, אלכסנדר וונג, כי המודל R1 של דיפסיק הוא למעשה "אחד ממודלי הבינה המלאכותית המתקדמים בעולם, העומד לצד ואף מתעלה על מודלים כמו o1 של OpenAI". לדבריו, R1 אפילו התעלה עליהם במבחן ה-AI המאתגר ביותר הקיים אצלו בחברה.
ואז הטיל וואנג את הפצצה: להערכתו, דיפסיק משתמשת בארכיטקטורת "הופר" של אנבידיה ולמרות טענותיה, הצליחה לשים את ידה על לא פחות מ-50 אלף מעבדים גרפיים (GPU) מתקדמים מסוג H100 ו-H200 של חברת השבבים האמריקאית (למרות המגבלות שהוטלו על ידי ממשל ביידן כדי למנוע משבבי AI חזקים להגיע לסין, ר"ק). "יש להם יותר שבבי H100 ממה שאנשים חושבים או ציפו לו", טען.
4 צפייה בגלריה 
מנכ"ל אנבידיה, ג'נסן הואנג. הסינים הצליחו ככל הנראה לשים את ידם על השבבים המתקדמים ביותר של החברה 
(צילום: Chiang Ying-ying, AP)
אבל לא מדובר רק על שבבים - אנבידיה שולטת בשוק ה-AI גם דרך פלטפורמת פיתוח התוכנה שלה, וכפי שזה נראה, מהנדסי דיפסיק הצליחו לפתח את המודל שלהם על ידי כתיבת קוד שלא מסתמך על פלטפורמת Cuda של אנבידיה, אשר נתפסת באופן נרחב כשליטה בעולם פיתוח בינה מלאכותית.
גם דילן פאטל מחברת ייעוץ השבבים SemiAnalysis העריך כי לדיפסיק וקרן ההשקעות High-Flyer העומדת מאחוריה יש גישה לעשרות אלפי מעבדים גרפיים מתקדמים של אנבידיה, אשר שימשו לאימון קודמיו של R1. "דיפסיק הוציאה למעלה מ-500 מיליון דולר על שבבי AI במהלך ההיסטוריה של החברה", טען פאטל. 
כך או כך, התוצאה הסופית צריכה להדאיג יותר את ארה"ב מאשר את אנבידיה. למעשה, מתברר כעת כי לסינים יש גישה די קלה לשבבי האימון המתקדמים ביותר של אנבידיה, למרות שלא אמורה להיות להם. לצד זאת, את שבבי ההיסק המשמשים להפעלה של R1 מייצרת וואווי הסינית עם טכנולוגיה מקומית, ואלו נמצאים כשלוש שנים מאחורי המקבילים שלהם במערב.