שתף קטע נבחר

Tech Talk: מה זה ביג דאטה?

בכל שבוע נצלול אל אחד מהמונחים המפוצצים של עולם הטכנולוגיה וננסה להסביר אותו מספיק טוב בשביל שיחת סלון. והפעם: ביג דאטה. מה אפשר להסיק ממאגרי מידע עצומים, מי מפיק מהם תועלת והאם הם מסוכנים?

 

 

אם המוצר או השירות ניתן בחינם - אז המוצר הוא אתם: זוהי כנראה אחת המנטרות היותר שגורות בשנים האחרונות בכל מה שקשור לשימושים ברשת, אבל מה זה בכלל אומר ואיך זה קשור לביג דאטה? בחמש השנים האחרונות, "נתוני עתק" - הגרסה המעוברתת של המושג הטכנולוגי, מקבלים מעמד מיוחד והרבה יותר תשומת לב מבעבר. מצד אחד, החשיבות של מאגרי נתונים מהסוג הזה הולכת וגוברת בעקבות כמויות המידע הדיגיטלי, ומצד שני - אין מספיק הון אנושי שיכול להתמודד בצורה טובה עם ביג דאטה, ולשלוף ממנו תובנות.

 

כמויות בלתי נתפשות של מידע דיגיטלי (אילוסטרציה: Shutterstock) (אילוסטרציה: Shutterstock)
כמויות בלתי נתפשות של מידע דיגיטלי(אילוסטרציה: Shutterstock)

 

אבל רגע לפני שצוללים אל האתגרים של ביג דאטה, כדאי להבין מה זה בעצם אומר: כמעט לכל פעולה שלנו היום, בין אם מדובר בפעולה מקוונת או בפעולה שנעשית אופליין, יש עקבות דיגיטליים מסוגים שונים: מיקומים שנאספים באמצעות GPS, שאלות במנוע החיפוש, מסרונים באפליקציות תקשורת, בחירות צפייה או האזנה בשירותי סטרימינג, לייקים ברשתות חברתיות, אבל גם רכישות בכרטיס אשראי, מרשמים אצל רופא המשפחה או צילום במצלמת אבטחה. מדובר בעצם בסוגים שונים של מידע - טקסט, תמונות בפורטים שונים, וידאו, קובצי קול, ורישומים מסוגים שונים. ביג דאטה נוגע למידע מבוזר - כזה שמגיע ממקורות שונים ובפורמטים שונים, והאתגר הגדול הוא איך מפיקים תועלת מכמויות כאלה של מידע?

 

מה עושים עם כל הדאטה הזה?

אחת הסטטיסטיקות היותר פופולריות בשנה וחצי האחרונות היא זו: בכל יום, אוכלוסיית העולם מייצרת 2.5 קווינטיליון בייטים של מידע. קווינטיליון הוא מספר בלתי נתפש, אחרי ה-1 מגיעים 18 אפסים. אם ממירים את זה לבייטים - אנחנו מייצרים כמעט שני אקסה בייטים ביום. עוד מונח בלתי נתפש, בעולם שרק מתחיל להתרגל לכמויות בפטה בייטים. למעשה, לפי מחקר של IBM מסוף שנת 2017, 90 אחוזים מכל המידע הזה יוצרו במהלך השנתיים וחצי האחרונות. יש כאן שלושה מרכיבים שבאים לידי ביטוי: גידול באוכלוסיית העולם, גידול בשימוש ברשת, וכמובן ריבוי של אפליקציות, שירותים ומוצרים שאוספים מידע.

 

כשכל כך קשה לתפוש את כמויות המידע הדיגיטלי המצטברות בכל יום בעולם, אין פלא שאחד האתגרים הגדולים של ביג דאטה - הוא הפקת תובנות, ובעצם תועלת מתוך הררי המידע. למעשה, רק חצי אחוז מהמידע הנאסף משמש בסופו של דבר בתהליכים של ניתוח והסקת מסקנות. עם כל היתר אנחנו עוד לא ממש יודעים מה לעשות. מה בעצם הבעיה במצבורי מידע גדולים כל כך?

 

לעשות סדר בבלאגן (אילוסטרציה: Shutterstock) (אילוסטרציה: Shutterstock)
לעשות סדר בבלאגן(אילוסטרציה: Shutterstock)

 

ראשית, המידע הוא מבוזר. מגיע ממקורות שונים, בצורות שונות, בגדלים שונים ובעל חשיבות משתנה. כדי להפיק תועלת ממידע כזה מוכרחים קודם כל לסרוק אותו במהירות, לקטלג ולארגן אותו, וזו פעולה כמעט בלתי אפשרית כשמדובר בפורמטים שונים. נסו לחשוב על זה: איך מוצאים היגיון בתוך ערימה מפוזרת וחסרת כל קשר לכאורה של מידע? איך סורקים מידע טקסטואלי ומידע ויזואלי באותם כלים ומנסים לדלות ממנו היגיון כלשהו? ואיך מחליטים מה בכלל חשוב ומה לא? מישהו חייב לעשות סדר בבלאגן.

 

ביג דאטה הוא קופסה שחורה

כיום, האתגר הגדול ביותר של ביג דאטה, הוא שהדבר הזה נתפש כמעין "קופסה שחורה". מאגר שמכיל כל כך הרבה פריטים מסוגים שונים, וכמעט בלתי אפשרי לדעת מה קורה בתוכו. הכלים האנליטיים שקיימים היום מהווים מעין מסננת, שומר סף שלא בהכרח מציג לנו תמונת מצב נכונה או רלוונטית. הפוטנציאל של ביג דאטה הוא ברור: הרי כמה שיותר מידע מאפשר תמונת מצב רחבה יותר, שמתוכה אפשר להפיק תובנות עמוקות ומעניינות יותר במגוון של תחומים. אלא שהרבה מהיישומים האלה קורים הלכה למעשה דווקא בסקטור הפרטי, ומיועדים עבור תאגידים ומפרסמים.

 

הדוגמה הקלה והמוכרת ביותר היא פייסבוק: חשבו על כמויות המידע שפייסבוק אוגרת על כל משתמש. הרשת החברתית יודעת איפה אנחנו נמצאים, פיזית, כמעט בכל רגע נתון. היא יודעת מי החברים שלנו, עם מי אנחנו מדברים (ועל מה), מה אנחנו אוהבים, מה מכעיס אותנו ומה משמח אותנו. היא מקבלת גישה בלתי מוגבלת לתמונות שלנו, לסרטונים, לשידורים חיים. אבל היא גם יודעת מה קורה לנו בוואטסאפ ובאינסטגרם, וצריכה איכשהו למתוח קו הגיוני בין כמויות המידע שהיא אוגרת - כדי לייצר ממנו תובנה. למשל: על סמך החיפוש האחרון שלי בפייסבוק, הקבוצה האחרונה שהצטרפתי אליה והלייקים שהענקתי היום, אפשר לפרסם לי מוצר כזה או אחר בצורה יעילה יותר.

 

הסכמה אוטומטית לאיסוף מידע (אילוסטרציה: Shutterstock) (אילוסטרציה: Shutterstock)
הסכמה אוטומטית לאיסוף מידע(אילוסטרציה: Shutterstock)

 

ויש כמובן גם פוטנציאל של תובנות עמוקות יותר מפרסומות מותאמות: חשבו על מידע פיזיולוגי שנאסף באמצעות צמידי כושר או שעונים חכמים, מידע רפואי שנצבר ויכול להציע תובנות בנוגע לסוגים שונים של מחלות ולהציע פתח למחקרים חדשים ולמציאת תרופות, מידע שנאסף ממקומות ציבוריים - כבישים, צמתים, מצלמות אבטחה - ויכול לשפר שירותים במגוון של תחומים. כל אלה מתאפשרים פוטנציאלית באמצעות ביג דאטה.

 

 תגובה חדשה
הצג:
אזהרה:
פעולה זו תמחק את התגובה שהתחלת להקליד
אילוסטרציה: Shutterstock
ביג דאטה
אילוסטרציה: Shutterstock
מומלצים