חברת לומינטי נטוורקס (Luminati Networks) הישראלית נכללה ברשימת גרטנר הבינלאומית של חברות שתרמו טכנולוגיות לסיוע לארגונים במאבק בקורונה, כך הכריזה החברה בחודש יוני האחרון. לומינטי, שמגדירה את עצמה "הרשת הגדולה בעולם לתמיכה באיסוף מידע", הציגה פרויקטים של איסוף מידע שעשתה בהתנדבות עבור בית החולים אסותא, רשת המרכולים הקנדית GrocerCheck ופרויקט ביג-דאטה אמריקאי בשם Tenfourwest. הבדיקה שלנו מעלה, שיתכן ויש בעיה עם הדרך בה היא אוספת מידע, שמבוססת על אפליקציות של חברות אחרות, שפוגעות בפרטיות המשתמשים כשהיא עושה שימוש במכשירים שלהם לצורך ריגול מסחרי.
תקשורת VPN ביג דאטהתקשורת VPN ביג דאטה
איסוף ביג דאטה. מקורות גלויים
(צילום: Shautterstock)
לומינטי הציעה לאסותא גישה לכל נתון דיגיטלי פומבי, כך פורסם. הפרויקט נערך בתחילת הקורונה, כשהחוקרים חיפשו דרכים יצירתיות לזהות חולי קורונה. ההשערה הייתה שרמה נמוכה של חמצן בדם יכולה לנבא שהאדם חולה. הפתרון המוצע היה לאתר את בעלי השעונים החכמים שמסוגלים למדוד רמת חמצן בדם. לומינטי נרתמה למשימה ואיתרה בתוך 24 שעות 110 דגמי סמארטפונים ו-165 דגמי שעונים וצמידים חכמים מתאימים. אמנם הנתונים הראו ששיעור המשתמשים במכשירים אלה נמוך מ-20 אחוזים מכלל המשתמשים אבל החוקרים העריכו שאפילו 10 אחוזים מהאוכלוסייה יהוו בסיס לפיתוח השיטה. מנכ"ל החברה אור לנצ'נר אמר: "אלו מספרים מצוינים ואני מקווה שיסייעו במאבק למגור התפשטות מגפת הקורונה".
בכלל, מה שמאפיין את לומינטי, זה הרבה שאר-רוח והתלהבות. החברה זכתה לחשיפה נאה בחודשים האחרונים, כשהיא נושאת את לפיד טכנולוגיות המידע, אתגרי איסוף הדאטה, רשת הנתונים החלופיים וביטויים מרשימים נוספים. בריאיון אחד הגדיר לנצ'ר את החברה כמי ש"מגינה על עתיד המסחר המקוון". במאמר שפירסם ב"גלובס" לנצ'נר תיאר את איסוף המידע כ"גלגל ההצלה של העולם בעידן חוסר הוודאות". ביולי השנה הוא פנה לשר החינוך יואב גלנט בהצעה להוסיף מקצוע חובה חדש לתוכנית הלימודים: התנהלות נכונה ואתית בעולם הדיגיטלי.
אור לנצ'נר, לומינטיאור לנצ'נר, לומינטי
אור לנצ'נר. "גלגל ההצלה של העולם"
(צילום: תמרה ברלסקי)
אפשר להתרשם בהחלט שהאתיקה מעסיקה מאוד את לומינטי. אולי זה בגלל אי-הנוחות, שמעוררות שיטות איסוף המידע שלה. כך למשל, באתר האינטרנט של לומינטי מתואר השירות שלה: "קצירת נתונים מאתרים בלי שיחסמו אותך או יוליכו אותך שולל". עבור הלקוחות הפוטנציאליים היא מגדירה את עצמה כ"רשת הפרוקסי העסקי הגדולה בעולם". פרוקסי הוא ביטוי המתאר גלישה, שאינה נעשית ישירות מכתובת האינטרנט (IP) שהקצה ספק האינטרנט. אפשר להשתמש בפרוקסי להאצת מהירות הגלישה אבל אפשר להשתמש בו גם כדי להסוות את זהותך.
באתר לומינטי מפרטת את השירותים שלה, כמו למשל בדיקה לאן מובילים הקישורים מהמודעות שלך, הצצה כיצד נראה האתר שלך מכל מקום בעולם, רכישה מאסיבית של מוצרים באתר קניות או איסוף נתונים על מועמד לעבודה. המשותף לכל היכולות האלה היא העובדה, שהאתרים מהם נשלף המידע לא היו מאפשרים זאת, לו היו יודעים מי מבקש את המידע.
סחר מקווןסחר מקוון
סחר מקוון
(צילום: shutterstock)
שוק "הנתונים החלופיים", כמו שמכנים זאת בלומינטי, הוא זירת קרב בין חברות סחר מקוון ומעורבות בו גם חברות השקעה, בנקים, חברות ביטוח, כולם רוצים גישה דווקא למידע שאינו זמין להם. אתרי סחר למשל, מעוניינים לדעת מה המחירים שמציעים המתחרים. כדי לעבור על כל המחירים באתר אמזון צריכים לגייס צבא של עובדים שלא נמים ולא ישנים. או להשתמש בתוכנה שאוספת את הנתונים, "קוצרת" הוא הביטוי המקצועי, מאתרי המתחרים, לפעמים גם מנתחת אותם ומציעה תמחיר מתחרה.

עונת הקציר

קציר נתונים אינו דבר מגונה בפני עצמו. גוגל למשל, קוצרת נתונים כדי לעדכן את האינדקס שלה, והאתרים מקדמים אותה בברכה בציפייה לשיפור מיקומם בחיפושים. חוקרי אקדמיה קוצרים נתונים לצורך מחקרים, עיתונאים קוצרים נתונים לצורך תחקירים. חברות גדולות קוצרות נתונים מאתרי המשווקים שלהן לוודא שהם עומדים בתנאי ההסכם עימן. המערכות שעושות את זה מפעילות בוטים, שפועלים כמו משתמשים רגילים ושולפים את המידע.
אבל פה מתחיל העסק להסתבך. אותן חנויות מקוונות שקוצרות נתוני מתחרים, מאוד לא מעוניינות שהמתחרים יקצרו את נתוניהן שלהן. כדי למנוע זאת הן משתמשות במערכות הגנה שמזהות את הבוטים החטטניים של המתחרים ומפילות אותם בפח, למשל מציגות מחירים אסטרונומיים כדי להטעות אותם. מתברר שזה די קל לזהות בוט: יש כתובות IP שמוכרות כמקור לבוטים, או שהמערכת מזהה מטח של פניות מכתובת IP אחת או משפחת כתובות זהה.
מי קונה באונליין?מי קונה באונליין?
מי קונה באונליין?
(צילום: shutterstock)
וכאן נכנסת לתמונה הטכנולוגיה של לומינטי. הפעילות שלה התחילה כחלק מחברת הולה (Hola), שהוקמה ב-2008 על ידי עופר וילנסקי ודרי שריבמן. לפי נתוני סטארט-אפ ניישן סנטרל החברה גייסה 34 מיליון דולר משבעה משקיעים והיא מעסיקה מעל 200 עובדים בישראל ובאוקראינה. ב-2014 הוקמה לומינטי נטוורקס על ידי אותם מייסדים. בשנת 2017 הופרדה לומינטי מהולה ונמכרה לקרן האחזקות הפרטיות הבריטית EMK Capital בסכום שנקבע מאוחר יותר ל-165 מיליון דולר. לומינטי מעסיקה כיום 200 עובדים בישראל ובארה"ב, ויש לה יותר מ-10,000 לקוחות. לפי הערכות שפירסמה, היקף השוק שבו היא פעילה מגיע ל-1.8 מיליארד דולר בשנה, כך שייתכן והיא בדרך לצמיחה גדולה.
"אנחנו חברה מובילה בשוק איסוף המידע מהרשת, מידע שזמין לציבור", אומר עומרי אורגד, מנהל לומינטי נטוורקס ארה"ב. "חברות מתקשרות עם לומינטי על מנת לאסוף מידע, שמאפשר להן לייצר יתרון תחרותי. חברת השקעות לדוגמה, יכולה לאסוף נתונים חיצוניים, מידע שנמצא מחוץ לדו"חות הפיננסיים של החברה". הוא מדגיש כי כל המידע הוא מידע פתוח, שכל גולש יכול להגיע אליו, ולומינטי פשוט מאפשרת לחברות לאסוף כמויות גדולות ממנו.
הטכנולוגיה של לומינטי מאפשרת לחברות להתגבר על חסימות והטעיה של אתרים באמצעות הסוואת הבוטים שלה ושימוש בכתובות IP של משתמשים פרטיים אותנטיים. כך היא יכולה להטעות את האתר ולגרום לו לחשוב שמדובר בקונה תמים, אפילו במי שגולש מסלולר.
איך עושים את זה? באמצעות כתובות IP של אנשים פרטיים, תמימים, שלפעמים לא מודעים לשימוש שנעשה בגישה שלהם לאינטנרט. הולה פיתחה שיטה שמעודדת, שלא לומר מפתה, את המשתמשים לחלוק את משאבי המחשב או הטלפון שלהם. כמו כולנו, אם הם לא קוראים את האותיות הקטנות, הם אפילו לא ידעו שזה קורה. מהתוצאה אפשר להתרשם באתר של לומינטי שמכריז: "נפח כתובות ה-IP שלנו מאפשר לנו למצות נתונים באופן סדיר מאתרים שחוסמים את הגישה באגרסיביות".
לומינטי אינה מסתירה את העובדה שהיא משיגה את המידע עבור הלקוחות באמצעות גלישה מכתובות IP פרטיות. במספר ראיונות ציינו מנהלי החברה, שיש ברשותה כתובות IP אמיתיות של עשרות מיליוני משתמשים, שבאמצעותם אתרי סחר מזהים את התנועה ממנה כגולשים אמיתיים ומספקים לה את הגישה. היא גם מתגאה שהיא אוספת "מידע נקי", מידע אמיתי שזמין ברשת לגולשים פרטיים, אבל לא לחברות. מה שלומינטי פחות מבליטה, שלא לומר מסתירה, היא הדרך בה היא משיגה את שיתוף הפעולה של הגולשים האלה.
לומינטי Luminatiלומינטי Luminati
הולה. פותחת אתרים
(צילום: יח"צ)

מישהו השתמש לי ברוחב הפס

והנה אנחנו חוזרים להולה, החברה שבה התחיל הכל. זו אפליקציית VPN פופולרית עם 50 מיליון הורדות באנדרואיד ומספר דומה באפסטור. שירות ה-VPN מאפשר למשתמשים להתחבר לרשת תוך שהם מסווים את המיקום ממנו הם גולשים. למשל אם הם רוצים להתחבר למוזיקה מ-Pandora שאינה פועלת בישראל, או נגיד לצפות בתכנים של נטפליקס שמוצעים רק בדנמרק. הולה המציאה את המונח "VPN מבוסס קהילה": החיבור לאינטנט נעשה באמצעות שיתוף חיבורים (Peer-to-peer), כמו כלי חיפוש קבצי טורנט. אבל את זה יודעים כולם. לא בטוח שהם יודעים את כל התמונה.
כשאתה מתחבר להולה, מופיע המידע הבא: "עם הלחיצה על 'הצטרפות' אתה מסכים שקראת והסכמת להסכם המשתמש של הולה ולהצהרת הפרטיות של הולה". מרבית המשתמשים ידלגו על קריאת המסמכים וילחצו על הצטרפות. אם הם היו טורחים להיכנס, היו מגלים שהם מתחייבים לעמוד בכללי "תוכנית ה-SDK" של לומינטי, שכוללים הסכמה לחלוק את החיבור שלך לאינטרנט עם "חברות שנבחרו בקפידה, ושחולקות איתך את אותם ערכים של שקיפות באינטרנט. החברות ינתבו תנועה מאובטחת דרך מכשירי המשתמשים מה שיאפשר להן לאסוף נתונים בצורה אתית ממקורות פתוחים". לא בטוח אם כל המשתמשים מבינים שמכבסת המילים הזאת אומרת שהמכשיר שלהם הופך חוליה ברשת ריגול האתרים של לומינטי. בכל מקרה, למשתמשים שמעדיפים שלא ישתמשו בחיבור שלהם, מוצע להצטרף לתוכנית הפרימיום שעולה 43 שקל בחודש.
תקשורת VPN ביג דאטהתקשורת VPN ביג דאטה
VPN מבוסס קהילה
(צילום: Shautterstock)
אבל רגע, הרי ב-2017 חלה הפרדה בין לומינטי והולה, לא? אז מה היא עושה בתוך האפליקציה של הולה? "לומינטי התחילה כספינאוף של הולה, כשהמייסדים הבינו שיש פה פוטנציאל", אומר אורגד. "היום אנחנו עובדים בנפרד, זו לא אותה חברה המון שנים. לומינטי עוסקת באיסוף מידע ברשת והולה מספקת שירותי VPN".
אז נתוני משתמשי הולה אינם משמשים את לומינטי?
"הטכנולוגיה של הולה עובדת בשיטת opt-in. המשתמש בהולה הוא חלק מה-SDK של לומינטי שעושה לו אינטגרציה, אבל המשתמשים מודעים לזה".
לומינטי Luminatiלומינטי Luminati
אפליקציית הולה. המשתמשים מודעים?
(צילום: יח"צ)
מעבר להולה, לומינטי פיתחה תוכנית שותפים, שמציעה למפתחי אפליקציות לכלול את השירות שלה, כך שהאפליקציה תוצע בחינם בתמורה לשיתוף הגלישה ובעל האפליקציה יהנה מתמלוגים. במקרים אחרים היא אפילו מציעה לגולשים תשלום חודשי עבור השימוש בגישה שלהם.
המשתמשים באפליקציות שקשורות בלומינטי "תורמים" את רוחב הפס שלהם (לא יותר מ-3 מגה בייט ליום ממכשירים ניידים ו-100 מגה בייט ממחשבים, כך מתחייבת החברה). אבל הם גם מקריבים את פרטיות המידע שלהם. תנאי ההצטרפות של הולה כוללים את הזכות של החברה לאסוף נתונים על זהות הגולש, מיקומו, האפליקציות שבהן הוא משתמש, וכל הפרטים הציבוריים שלו בפייסבוק או בפלטפורמות אחרות. בלומינטי טוענים שהמידע הזה אינו מגיע אליהם: "נתוני המשתמשים של הולה אינם משמשים את לומינטי. המשתמשים של הולה רק משמשים ככתובות IP לשירות הפרוקסי, אנחנו לא אוספים נתונים על בעלי המכשיר עצמם ויש לנו אפילו דו"ח בלתי תלוי שמראה את זה".
מעבר לפגיעה בפרטיות, משתמשי הולה מסתכנים שמישהו יעשה שימוש לא ראוי בחיבור שלהם לאינטרנט. זה קרה למשל ב-2015, כשהאקר אנונימי השתמש ברשת של הולה כדי לבצע מתקפת מניעת שירות מבוזרת (DDoS) על אתר בשם 8chan. במתקפה כזו משתמשים באלפי בוטים שמבקשים גישה באותו זמן לאתר הקורבן ומצליחים למוטט אותו. במקרה אחר השתמשו בכתובת IP של הולה כדי לגנוב סיסמאות מאתר ארנק אלקטרוני. כיום החברה זהירה יותר בקבלת לקוחות חדשים. לפי נתונים שמסרה לנו, בשנת 2020 החברה סירבה לבקשותיהם של 612 לקוחות פוטנציאליים, שלא עמדו בדרישות החברה. בין השאר מדובר בבקשות להשתמש במערכת לביצוע פעילויות מזויפות באתרי סחר לביצוע פעילות מזויפת בערוצי מדיה חברתית.
אומר אורגד: "החברה למדה את הלקח והיא בררנית יותר בלקוחות העסקיים שהיא מוכנה לקלוט. אנחנו עושים סקרינינג ללקוחות ויש אתרים שאנחנו לא מרשים לגשת אליהם. אלה לא חברות שיסכנו את לומינטי או את הלקוחות האחרים. יש לנו צוות שעוסק בזה יום יום. בשוק איסוף המידע עדיין אין רגולציה לעומק ולכן לומינטי עוסקת הרבה במבנה האתי של הרשת – מה אנחנו מרשים ומה לא מרשים. לומינטי מובילה בזה".
תקשורת VPN ביג דאטהתקשורת VPN ביג דאטה
תקשורת VPN
(צילום: Shautterstock)

פייסבוק כדוגמה

יכול להיות שהדגש הגדול שניתן בלומינטי לרגולציה ואתיקה נועד בכלל למנוע צרה אחרת. למשל אם חברה רב-לאומית גדולה תכעס כשתגלה שקוצרים את המידע שלה. דבר כזה קרה לאחרונה לחברה ישראלית אחרת, ברנדטוטאל (BrandTotal), שפיתחה מערכת מידע שמבוססת על נתונים מטורגטים למשתמשי פייסבוק. החברה נתבעה באוקטובר האחרון על ידי פייסבוק, בטענה כי קצרה נתוני משתמשים של פייסבוק ואינסטגרם בניגוד לתנאי השירות של פייסבוק.
המידע שלכם כולל מידע מרשתות חברתיות?
אורגד: "כשאתה מסתכל על רשתות חברתיות באופן כללי, יש הרבה דאטה-בייסים שמחזיקים מידע. זה לא משנה באיזה אתר. אנחנו מחזיקים רק במידע ציבורי, במה שמונגש לציבור".
חברות מתעניינות במה שמטורגט לקהל יעד מסוים
"קהל יעד מסוים זה לא בן אדם פרטי, זאת אומרת שיש הפרדה מאוד ברורה. אנחנו לא נרשה שום דבר שהוא התחזות. אם זו פרסומת שמונגשת לציבור, זה בסדר. אנחנו יודעים לעשות את תהליך ההתאמה לרגולציה והראייה היא שיש לנו לקוחות מרשימת הפורצ'ן 500 וגופים פיננסיים שבעצמם תחת רגולציה".
מתוך הסרט The Great Hackמתוך הסרט The Great Hack
פייסבוק וקיימברידג' אנליטיקה. מתוך הסרט The Great Hack
(צילום מסך)
החלק המשעשע הוא, שפייסבוק בעצמה הפעילה טכנולוגיית קצירת נתונים דומה באמצעות חברת אונבו (Onavo) הישראלית, אותה רכשה ב-2013. אבל אז נחשפה העובדה שאונבו עקבה אחר הרגלי הגלישה של המשתמשים, ריגלה אחרי מתחרי פייסבוק וגם אספה מידע על קטינים, ופייסבוק נאלצה להפסיק את פעולתה. לפני כחודש הגישה רשות הצרכנות האוסטרלית (ACCC) תביעה כנגד פייסבוק העולמית, פייסבוק ישראל ואונבו בטענה שהוליכו שולל את הלקוחות ואספו מידע אישי.
אז מצד אחד לומינטי פועלת בשוק בעל פוטנציאל עסקי ענק, מהצד האחר היא צועדת על הגבול הדק שבין עסקים לגיטימיים לבין פגיעה בעסקיהם של אחרים. נכון, היא לא לבד במשחק הזה, אבל יכול להיות שלצד הקפדה על כללי הרגולציה והאתיקה היא צריכה קצת יותר להקפיד שהגולשים ידעו על מה הם מוותרים, ומה הם מקבלים בתמורה.
תגובת לומינטי נטוורקס: "לומינטי נטוורקס משרתת את החברות והאירגונים הגדולים בעולם במגוון סקטורים, ומסייעת להם לאסוף מידע פומבי מהאינטרנט באופן שמאפשר לצרכני האינטרנט כולל קוראי כתבה זו, לרכוש מוצרים במחירים נמוכים יותר ולבקר באתרים באופן בטוח יותר.
"האינטרנט הוא מקור המידע הגדול ביותר בעולם אך כידוע אינו זמין לכולם באותה מידה. לומינטי מנגישה לחברות, ארגונים חברתיים ומוסדות אקדמאיים מידע מהאינטרנט - מידע שהוא פתוח ופומבי. משאב זה חיוני לתחרות שוק בריאה. נסו לדמיין עולם ללא נגישות למידע פומבי ותקבלו תמונת מצב עגומה ביותר.
"כחברה הפועלת מאז הקמתה בשקיפות מלאה, אנו זמינים לכל שאלה בכל עת, ומצרים על אי דיוקים בכתבה זו הנובעים מחוסר הבנה או בדיקה מעמיקה".