הכירו את DeepSeek: הענק הסיני שמאיים לשבור את מונופול הבינה המלאכותית האמריקאי

עולמות הבינה המלאכותית (AI) הזדעזעו בשבועות האחרונים, והם רגילים לזעזועים בקצב יומיומי. מודל AI בשם DeepSeek V3, כלי AI שפותח בסין ומוצע בקוד פתוח, מתואר על ידי רבים כאחד מהמודלים החזקים ביותר הקיימים כיום ויכול להיות שהוא מטלטל עכשיו את עתיד ה-AI, עתיד שגם ככה מעורפל ומעורר תהיות. 
גלריה
דיפסיק V3 - מודל הבינה המלאכותית הסיני שמטריד את המערב
(צילום מסך)
V3 הוא תותח על. לא רק שהוא יודע לטפל בכל המשימות ש-ChatGPT ודומיו יודעים: כתיבת אימיילים, כתיבת קוד, תרגום, תקצור וכל השאר, אלא כשבודקים את היכולות שלו במבחני ההשוואה (benchmarks) הוא עושה את כל אלו מהר, יעיל ומדויק יותר ממתחריו, גם אלה שמוצעים בקוד פתוח וגם הכלים המסחריים. 
בתחרות כתיבת קוד שנערכה לאחרונה, ה-V3 עקף מודלים מתחרים רבי עוצמה כמו  Llama 3.1 405B של מטא, GPT-4o של OpenAI ו-Qwen 2.5 72B של עליבאבה. תוצאות דומות הושגו בתחרויות נוספות שבדקו יכולות בתחומים אחרים.
האם ה-"ChatGPT קילר" הגיע?
אז האם V3 הוא ה-"ChatGPT קילר", כמו שמכנים אותו ברחבי הרשת? בואו נבחן את הדברים – הוא מסוגל להפיק באופן מהיר תקצירים ושיפורי טקסט איכותיים ביותר בכל השפות, לקלוט עד 50 מסמכים בגודל 100 מגה-בייט, לפעול במוד DeepSync שמשפר את תהליך עיבוד הבעיה על ידו, ולעשות את כל זה בחינם, או בתשלום סמלי בשימוש עסקי. חסדי ChatGPT טוענים מנגד, שחלק גדול מהתשובות של המודל "מאופקות ולא מלהיבות".
לפי המידע שמסרה חברת Deepseek.AI, מודל V3 אומן על מערך נתונים עצום - 671 מיליארד פרמטרים ו-14.8 טריליון טוקנים. מדובר ביכולת לייצג מספר דמיוני כמעט של מילים וחלקי משפטים, שגדול ב-60% ממערך הנתונים של Llama 3.1 405B של מטא. 
נתונים של דיפסיק המציגים את המודל לעומת המתחרים
(דיפסיק)
V3 הוא יריב שקול אם כך לכלי ה-AI החזקים ביותר, למשלOpenAI 4o מבית OpenAI או קלוד  3.5 Sonnet מבית אנת'רופיק. אבל בעוד החברות האלו ודומותיהן השקיעו מאות מיליוני דולר בפיתוח ואימון המודלים שלהן, מיליארדים במקרה של OpenAI, חברת דיפסיק דיווחה שעלות האימון של V3 היתה 5.6 מיליון דולר בלבד.
העובדה הזו גרמה לאנדריי קרפתי, מנכ"ל Eureka Labs וממייסדי OpenAI, לקרוא לזה "בדיחה של תקציב" ו"תצוגה מרשימה מאוד של מחקר והנדסה תחת מגבלות משאבים משמעותיות". מארק צוקרברג, מנכ"ל מטא, הביע דאגה מדיפסיק בריאיון שלו בפודקסט של ג'ו רוגן לפני כשבועיים, לאחר שהודיע על ביטול הצנזורה בפלטפורמות של מטא. 
הוא התייחס למגבלות האתיות שמוטלות על מודלי AI אמריקאים והביא את הסינים כדוגמא הפוכה. הוא הודה שאמנם דיפסיק הוא "מאוד מתקדם", אבל ציין שלא ניתן לסמוך עליו בגלל שהוא מצונזר ולא דמוקרטי. אם אתה שואל אותו לדעתו על שי ג'ינפינג, "הוא לא יתן לך שום דבר" ואם אתה שואל אותו אם אירועי ככר טיאנאנמן התרחשו, "הוא יכחיש אותם".  וזה קצת מצחיק לשמוע מפי מנכ"ל החברה, שפחות או יותר התעלמה מהטבח ב-7 באוקטובר בעוטף עזה.
מארק צוקרברג בפודקאסט של ג'ו רוגן
(צילום: צילום מסך)
איך הם עושים את זה?
התשובה, לפי הפרשנים, היא זיקוק נתונים - טכנולוגיה שפותחה על ידי גוגל לפני כמה שנים. בשיטה הזו מלמדים את המודל לחזות רצפים של טקסט באמצעות למידה ממודל אחר, שכבר מכיל ידע מזוקק אחרי אימון קודם. 
חברות AI משתמשות בזיקוק נתונים ממודלים קודמים שלהן לתוך המודלים החדשים. לסינים, לעומתם, אין מודלים קודמים והם משתמשים במודלים אמריקאים כדי לזקק את המודלים שלהם. נכון האמרה שסינים מעתיקים מוצרים ומייצרים אותם בזול? אז הכירו את גרסת ה-AI של זה.
בזמן שבמערב מתלהבים מ-GPT-4o של OpenAI, הסינים כבר צמצמו את הפער ואף בדרך לעקוף אותו
(צילום מסך: יוטיוב)
אם V3 מוצע בחינם והוא חזק ומדויק יותר מהמתחרים, למה לטרוח ולשלם עבור ה-API של החברות האחרות? ובכן, יש כמה מחירים מסוג אחר שבאים יחד עם המודל הסיני, כמו למשל פגיעה בפרטיות. 
משתמשים דיווחו שתנאי ההסכמה לשימוש במודל כוללים מעקב אחרי פעילות המשתמש, שמירת הנתונים שלו ללא הגבלת זמן ואימון המודל על בסיס התוכן שהמשתמש מעלה, אשר קרוב לוודאי נמצא בשליטת הממשל הסיני. לא בדיוק ה-AI שתרצו להזין אליו את נתוני החברה שלכם או פרטים אישיים של העובדים.
בנוסף, נראה ש- V3 סובל כאמור מבעיות זיכרון מסוימות, ככל שהדברים קשורים לאירועים בסין. אם תשאלו אותו על אירועי כיכר טיאנאנמן (סדרת מחאות עממיות שהתרחשו בסין ב-1989 שהובילה להרג המוני של מפגינים על ידי הממשל הסיני, ט"ש) למשל, תגלו שהוא לא יודע במה מדובר. 
למעשה, הרגולציה הסינית מחייבת את החברות המקומיות להקפיד על כך שהתשובות של הצ'אטבוטים המקומיים ישקפו "ערכים סוציאליסטים בסיסיים" וכמובן ימנעו ממתיחת ביקורת על השלטונות. טכנולוגית אגב, זה לא שונה מרגולציה שמונעת פגיעה בערכי זכויות האדם ב-LLM מערבי. 
נשיא ארה"ב לשעבר ביידן ונשיא סין שי ג'ינפינג. האמריקאין מנסים לבלום את ההתקדמות הסינית. לא בטוח שהם התעוררו בזמן
(צילום: AP)
חשש במערב מפני המתחרה הסיני
עכשיו צריך להסתכל על התמונה הגדולה: OpenAI, אנתרופיק, x.AI של מאסק ואחרות, כולן שועטות במירוץ עתיר ממון וטאלנטים יקרים לכיוון קו הגמר: פיתוח בינה מלאכותית כוללת (AGI), שתהיה אינטליגנטית יותר מבני אדם, תקבל החלטות טובות יותר ותוכל להשפיע הרבה יותר על מהלכים מדיניים וכלכליים. 
עכשיו, כשלדבוקה המובילה בראש המרוץ מזדנב לפתע אצן סיני, עם חשש שהוא יעבור להובלה, העתיד נראה פחות מבטיח. עוד לא התגברנו על החשש מפני סכנות ה-AGI כשהיא בידיים אמריקאיות, והנה צצה סכנה כפולה ומכופלת כשהיא עלול להיות בידיים סיניות. 
יש הטוענים שזה ההסבר העיקרי למהלך של ממשל ביידן לאסור באופן גורף על יצוא שבבים לסין: החשש שאלו יפתחו AGI ראשונים. "זוהי מקרה קלאסי של 'שבור את הזכוכית במקרה חירום', ממשל ביידן זיהה מצב חירום בזמן שה-AGI נמצא כבר בהישג יד" אמר גרגורי אלן, מנהל מרכז Wadhwani לבינה מלאכותית לאתר Axios. 
לארי אליסון (במרכז), מלווה בנשיא טראמפ, סם אלטמן (מימין), ומנכ"ל סופטבנק מסיושי סון (שני מימין). הממשל החדש כבר הודיע על השקעת עתק בתשתיות AI מקומיות 
(צילום: Andrew Harnik / Getty Images North America)
האם האמריקאים התעוררו מאוחר מדי?
אך למרות הכל, לא מן הנמנע שהופעתו של דיפסיק V3 ממחישה שמקרה החירום כבר התרחש, ושבירת הזכוכית החמיצה את המועד שלה, זאת לאור העובדה שבחודש נובמבר דיפסיק הציגה את מודל DeepSeek R1, שהוא מעין גרסה סינית של מודל ההיסק o1 של OpenAI. 
מודל היסק כידוע הוא גרסה מתקדמת של AI, שמבצעת חשיבה עמוקה ואיטית יחסית אך מניבה תוצאות איכותיות יותר. מי שתומכת בדיפסיק במסע שלה היא קרן גידור סינית בשם High-Flyer, שמבססת את החלטות המסחר שלה על ניתוחי AI. הקרן הקימה מרכז נתונים לאימון המודלים של דיפסיק, שמכיל לפי הדיווחים 10,000 יחידות עיבוד AI מיושנות מסוג A100 של אנבידיה, עשירית או פחות ממרכזי ה-AI של החברות האמריקאיות. 
מודל V1 אומן כבר על שבבי H800 חדשים יותר של אנבידיה, אבל עדיין מדובר בגרסה מיושנת יותר. לא שהייתה לסינים ברירה, האיסור על ייצוא שבבי AI לסין החל עוד ב-2022 והוחמר מאז שוב ושוב. מנכ"ל דיפסיק, ליאנג ונפנג, אמר בשנה שעברה שהכסף לא היווה בעיה עבור החברה אלא מגבלות רכישת השבבים. ונפנג לא מסתיר את המטרה הסופית: לפתח בינת-על, AGI. 
סם אלטמן במהלך טקס השבעתו של טראמפ. "הקוד הסגור של OpenAI לא יעצור אחרים מליישר איתם קו"
(AP)
וככל שהאמריקאים מערימים קשיים, כך הסינים משקיעים מאמץ כביר יותר בשיפור הקוד עוד ועוד עד, שזה ייסחט יכולות מרביות מהמעבדים הפחות מתקדמים של אנבידיה. ובזכות השכר ה"עממי" של המפתחים הסינים – אפשר לעשות את זה בעלויות מופחתות. 
מדובר בלא פחות מאבסורד - בעוד שממשל ביידן מכריז על איסור מכירת שבבי AI מתקדמים לסין במטרה לעצור את הדהירה הסינית להגמוניה בעולמות ה-AI, בפועל הדבר מוביל לכך שהסינים משפרים את יכולתם לכתוב AI יעיל יותר, מהיר יותר ופתוח לכל, באמצעות כוח העיבוד שכבר יש להם. 
ונפנג אגב התייחס ל-OpenAI כמו אל מכשול שיש לעקפו: "הקוד הסגור שלהם הוא התחפרות זמנית", אמר בריאיון, "הוא לא יעצור אחרים מליישר איתם קו". ושיהיה לכולנו בהצלחה.