טים ברנרס-לי, "ממציא ה-Web", רצה לבנות פלטפורמת שיתוף מידע בין פיזיקאים העוסקים בחלקיקים אלמנטריים, מעין "קולקוויום" מקוון של חוקרים הקשורים למאיץ הגדול ב-CERN. מליוני צרכני המידע שהסתערו על הפלטפורמה אחרי שהרשת נפתחה לרבים התעניינו יותר בתמונות פפראצי של סלבריטאים ובהורדת מוזיקה ללא תשלום זכויות יוצרים. וכך נוצר הצורך ב-Web 2.0, תפיסה שוויונית יותר של המושג החלפת מידע. רשתות חבריות הן הסממן המוכר - והמושמץ - ביותר של הרשת בעשור הראשון של המאה החדשה, לצד חדירת הפשע המאורגן גם למדיום האליטיסטי הזה.
המושג Web 3.0 הוצמד לאחרונה למגמה עדכנית, אפילו מהפכנית, של שיתוף מידע - שוב בכיכובו של טים החרוץ. ברנרס-לי, העומד בראש מועצת W3C, הגוף המתקנן של ה-Web, מעדיף לדבר על "הרשת הסמנטית" (The Semantic Web). ברור שהקפדנות הסמנטית של טים לא אומרת הרבה לקהל הרחב, וכדי שההמונים יסתנוורו כראוי צריך היה להמציא "מותג" קליט יותר, Web 3.0.
ברשותכם, אני אנסה בטור הזה להאיר את הנושא באור פחות "אקדמי" ויותר משמעותי למי שמחפש תועלת עסקית או חברתית ברשת החדשה. "סמנטיקה" בטרמינולוגיה של טים ברנס-לי מתייחס למונח הבלשני, שניתן לתיאור מקורב בתיאור "המשמעות של מילים". מילים בשפת הדיבור הן סמלים מוסכמים להבעה של מושגים הקיימים מחוץ לשפה, ולכן הן מקבלות משמעות שונה בהתאם להקשרן התחבירי (באיזה משפט הן משובצות), החברתי (מי האומר ומי השומע) ובהתרחשות לפני, אחרי ובזמן הדיבור. לדוגמה, כשאני כותב את המלים "אני כותב" אתם מבינים ש"אני" זה האדם שכנראה אפילו לא פגשתם, הכתיבה היא פעולה שהתבצעה במדיום שונה ממסך המחשב שלפניכם, וזמן ההווה מתייחס לזמן הכתיבה, לא לזמן הקריאה שלכם.
ובכל זאת אתם מבינים את משמעות המילים שכתבתי משום שמשותפת לכולנו מערכת התייחסות אוניברסלית, יש אומרים מולדת (כלומר עם בסיס ביולוגי), להעתקה דו-כיוונית של מילים ומשמעויות. כשקורא לא מבין את כוונתי הרי זה משום שאחד משני הצדדים נכשל בתרגיל העתקה. או שאני השתמשתי במילים לא "נכונות" או שהקורא חלש ביכולת הנקראת "הבנת הנקרא". ל-Web הקיימת אין כל כישור בהבנת הנקרא. כאשר אתם מחפשים מידע על פי מילת מפתח כלשהי, מנוע החיפוש מתייחס למילה בתור מחרוזת אותיות סתמית.
תהליך החיפוש הוא מיון מילות אינדקס שמורות בטבלה על פי קרבתן הטקסטואלית למילת החיפוש. עבור מנוע חיפוש טקסטואלי ההבדל בין 'אני' ל'אתה' הוא כמו בין 10.50.1 ל-5.400.1 (ערכי הגימטריה של האותיות) ולא כמו בין המובנים הקוגניטיביים של "מדבר" ו"מאזין". פרויקט ה-Web הסמנטית הוא צעד ראשון לקראת התאמה טובה יותר בין צורת הטיפול במידע של המנועים ב-Web לבין הדרך בה אנשים חושבים. אפשר לקרוא לזה "הענקת אינטליגנציה מלאכותית למנועי טקסט דיגיטליים".
נקודת המוצא למהלך אינה מנועים טפשים לחלוטין, כפי שתיארתי לעיל, משום שהמאמץ הבלתי פוסק לשפר את הרלוונטיות של התוצאות כבר הפיק צעדים ראשונים בכיוון הנכון. לדוגמה, אם תכניסו שגיאת כתיב למילת חיפוש ידועה (מוכרת למנוע), תקבלו בתשובה את הניחוש שלו לגבי מה באמת התכוונתם לחפש. זו דרגה פשוטה של "הבנה", משום שהיא מתבססת על טבלאות פשוטות יחסית, שנוצרו ברובן אוטומטית על ידי תוכנה סטטיסטית לזיהוי תבניות. שגיאות כתיב שגורות יוצרות תבנית ועם מספר מספיק גדול של אירועים לצורך אנליזה, ניתן לנחש בדיוק רב איפה נפלה השגיאה.
חיפוש סמנטי אמיתי, לעומת זאת, מבין את המילים בהקשר הנכון ויודע, לדוגמה, שכאשר אני כותב 'אני' הכוונה היא ל'יהודה אלידע'. ולכן מנוע כזה יבין נכון את השאלה האמביוולנטית "באיזה מסמכים אני מוזכר?" הוא לא ישלוף את 100 מיליארד המסמכים ב-Web בהן מוזכרת המילה 'אני'. בחיפוש סמנטי מושלם אפשר יהיה לאתר מידע בקלות (קל למחפש. המחשב יצטרך לעבוד קשה, אבל עוד לא הגענו ליום בו הרובוטים יתארגנו בגופים מקצועיים למניעת ניצול) משום שאפשר יהיה "לדבר" עם המנוע בשפה "טבעית" ולקבל תשובות "אינטליגנטיות".
והוא לא רק ידע למצוא את כל המסמכים בהם יהודה אלידע מוזכר, הוא גם יוכל למיין את התשובות לפי פרמטרים "איכותיים", לא טקסטואליים, שיכולים לשמש פילטרים לסינון התוצאות. כמו: 'בניואנס שלילי', 'בהקשר פוליטי', 'בהתייחסות לנושאים מדעיים', או בהקשר 'משפחתי'. כאשר היכולת הסמנטית עומדת לרשות המחפש, כבר לא צריך לעבור על רשימה של אלפי תשובות לפני שמזהים את הרלוונטית ביותר לצרכינו.
ואותו מנוע סמנטי יכול באותה הזדמנות גם לתייג (להוסיף תגי מיון לטקסט) את כל המסמך ולסמן את כל מילות המפתח שעשויות לשרת אותי. לדוגמה, אם המסמך הנשלף הוא עסקי ומתייחס לטרנסאקציה כלשהי, המנוע ידע לזהות את התאריכים המשמעותיים (זמן החתימה, תוקף ההתחייבויות, תאריכי תשלום וכו') את הסכומים (מי משלם כמה, למי ומתי) ואת ההתניות השונות (התשלום האחרון מותנה בקבלת המפתח) המוטמעות בטקסט. במילים אחרות, ברשת הסמנטית אפשר להטיל על מנוע החיפוש לבצע מחקר שכולל, בנוסף לאיתור מסמכים, גם מיון, סיווג, סינון והפעלת תנאים לוגיים שמבוססים על "הבנה".
ברור שחיפוש סמנטי הוא תנאי מוקדם לאוטומציה של תהליכים הנזקקים לידע "לא מובנה". כלומר, לנתונים שלא סווגו מראש בזמן יצירתם ולא נשמרו בכפוף למילון הגדרות סטנדרטי שמעניק להן חד משמעותית. היום, טרנסאקציות בין מערכות ממוחשבות, לדוגמה בשרשרת האספקה, דורשות הסכמות מוקדמות על פורמט המסמך, כך שמיקום של מילה בתוך רצף הנתונים מעיד על משמעותה. כך, לדוגמה, ניתן למפות אוטומטית את "תעודת המשלוח" שהוציא הספק על "תעודת הכניסה למחסן" של הלקוח ולוודא זהות נתונים.
בוורטיקלים של סחר מקוון ושירותים סטנדרטיים (כמו בנקאות) אפשר לבנות בסיס ענפי תוך שימוש בדיאלקט המתאים של שפת XML. בחזון של טים ברנרס-לי, כל הדיאלקטים הופכים לנגזרות של שפה סטנדרטית, עשירה לא פחות משפת הדיבור הטבעית, שמאפשרת לבצע במערכות המידע כל תהליך שאדם רגיל, בעל כישורים סמנטיים "טבעיים" יכול לעשות אם רק יסבירו לו במילים פשוטות. וזו מהפכה שראויה למותג חזק יותר מ-Web 3.0.