ברוכים הבאים לרשת הסמנטית
על-אף שהיא אחד מסיפורי ההצלחה הגדולים בהיסטוריה, רשת האינטרנט רחוקה מלהיות חכמה. הרשת הסמנטית החדשה, המתגבשת בימים אלה, כוללת סוכנים חכמים שיפעלו מאחורי הקלעים ויאפשרו להגיע במהירות ודיוק למידע. המטרה: להפוך את האינטרנט למנוע חיפוש ענק שמבין מילים והקשרים
11 שנים לאחר שפותחה, ה-WORLD WIDE WEB היא סיפור הצלחה פנומנלי. פיתוח ה-WWW איפשר לאינטרנט, שנולד כבר ב-1969, להפוך בשנות ה-90 לאמצעי התקשורת בעל שיעור הצמיחה המהיר ביותר בהיסטוריה. קשה להאמין שמישהו, כולל טים ברנרס לי, שהמציא את ה-WWW יכול היה לצפות ב-1991, כי 11 שנים מאוחר יותר האינטרנט ייחשב ללהיט כה גדול הכולל כ-37.5 מיליון שרתי אינטרנט וכ-500 מיליון גולשים ביתיים.
הסוד - פשטות
סוד הצלחתה של הרשת הוא הפשטות. ברנרס לי העדיף לבנות מערכת שכל אחד יוכל להשתמש בה, ולא רשת מורכבת ועמוסה בתכונות. אלא שלצד היתרון טמון בה גם חיסרון: הרשת אינה חכמה במיוחד. האינטרנט יסייע לכם ביעילות אם אתם מחפשים מידע על אדם מסויים או על חברה מסחרית ספציפית, אך אם תבקשו לקבל את כל המידע שקיים באינטרנט בנושא מסויים - תיאלצו לחפש אותו במשך חודשים ארוכים.
מוגבלות האינדקסים במטא-דאטה
לרשות מחפשי המידע עומדים פורטלים כמו יאהו, שכוללים אינדקס של אתרים, אך האינדקסים האלה מוגבלים ביותר. הם כוללים רק חלק מזערי מאתרי האינטרנט הקיימים, ולעתים קרובות אינם עדכניים. מנועי חיפוש משוכללים כמו גוגל יעילים יותר בחיפוש מידע. הם נעזרים בכמה שיטות כדי לאתר עבור הגולש את המידע המבוקש. בין השאר, הם נעזרים במטא-דאטה - מידע-על, המוטבע בקוד של כל דף אינטרנט, ומגלה למנוע החיפוש פרטים על תוכן הדף.
אולם אפילו גוגל (שמסד הנתונים שלו מכיל כשני מיליארד דפי אינטרנט) מכסה רק כ-10% מדפי האינטרנט הקיימים. מנועי החיפוש פשוט מתקשים להדביק את קצב ההתוספות של מידע חדש לרשת. מידע רב, כגון מסמכים רפואיים והודעות דואר אלקטרוני, כלל אינו נגיש למנועי החיפוש.
להתחיל מחדש
במצב כזה, החלו יותר ויותר אנשים לתהות האם לא כדאי להתחיל את הכל מחדש. החזון ההולך ומתהווה בימים אלה, שאמור לשנות את פני האינטרנט כליל, מכונה הרשת הסמנטית. סמנטיקה היא ענף בבלשנות, העוסק במשמעות המילים. כיום, הבנת משמעות המילים על-פי הקשרן נדרשת מהגולשים בעצמם. הוספת יכולות סמנטיות לרשת, יאפשרו לה להבין מילים, תאפשר לה להיהפך ממדיום שרק מציג מידע, למדיום שגם מעבד ומפרש את המידע הזה, ומעדכן את תוכנו בהתאם לאנשים הצופים בו, או בהתאם לשעת הפירסום.
הגולש בעידן הרשת הסמנטית (פורטל הרשת הסמנטית) ייהנה מנגישות רבה יותר אל מאגרי המידע העצומים הכלולים בה. מיליוני מסדי נתונים, שמתקיימים כיום כאיים בודדים בסייבר-ספייס, יתמזגו למסד נתונים ענק, דינמי וחכם.
הסוכנים לשירותך
על-פי חזון הרשת הסמנטית, במקום להמתין לנצח עד שמנועי החיפוש ישתכללו ויסרקו עבורנו את כל דפי האינטרנט - ניעזר בסוכני תוכנה חכמים. הסוכנים הללו ישוטטו ברשת וירכזו את המידע הדרוש לנו מתוך כל הדפים והאתרים הרלוונטיים. כל גולש יקבל מידע על-פי צרכיו ורצונותיו. עבור מעסיקים תוכל הרשת לשלוף בעצמה קורות-חיים של עובדים פוטנציאליים; עבור קונים, היא תאתר פריטים במכירה פומבית; ועבור מדענים, היא תציג ידיעות חדשותיות מרעישות שרלוונטיות עבורם.
לשם כך יוכלו הסוכנים לאסוף מידע מכל יישום באינטרנט (למשל, מסמכי וורד או פאואר-פוינט) ולזהות את הקשרו וכותבו, גם אם אינו מותקן במחשב של הגולש, או שהמידע כתוב בשפה זרה למשתמש.
הכל בהקשה אחת
כאשר גולש מבקש כיום להירשם לכנס באתר אינטרנט, הוא עשוי לבצע את הפעולות הבאות: להירשם באתר הכנס, לבדוק בתוכנת היומן שלו האם הוא פנוי להשתתף בכנס, לעדכן בתוכנת היומן את פרטי הנופש, להודיע לעמיתיו בדואר האלקטרוני על דחיית פגישות שתוכננו, להזמין טיסה ומלון באמצעות אתר תיירות או סוכן נסיעות, ולקינוח - לחפש מידע על היעד שאליו הוא אמור להגיע.
בעידן הרשת הסמנטית, במקום לבצע את כל שורת המטלות המייגעת הזו, המשתמש יידרש להקיש רק פעם אחת. סוכן התוכנה החכם יזמין עבורו טיסה ומקום במלון, ישלח דואר אלקטרוני המודיע על יציאה לחופש, ישלוף מהרשת את כל המידע הרלוונטי על יעד הטיסה, כולל מזג-אוויר, חדשות ואטרקציות והמלצות של גולשים שביקרו במקום - היישר לשולחן העבודה של המשתמש.
ניקח לדוגמא שני אחים, המבקשים למצוא רופא להוריהם, מסביר דב וינר, חבר הנהלת איגוד האינטרנט. כל אחד מהם יבקש מ'סוכן התוכנה' החכם שלו לסרוק מידע על מרפאות ולקבוע תור במרפאה הקרובה במועד הנוח ביותר. כל אחד מהאחים יודיע ל'סוכן התוכנה' שהוא יכול 'לסמוך' על הסוכן האחר: אם יבקש לקבוע פגישה, הוא יוכל לבדוק ביומן של האח השני כדי לבדוק אם הוא פנוי. ה'סוכנים' יקבעו פגישה ויעדכנו אותה בתוכנת היומן - והכל בהתערבות מינימלית של האחים.
השלד של הרשת
ובכן, כיצד תפעל הרשת הסמנטית? בבסיסו של כל דף אינטרנט יש כיום תגיות HTML, הכוללות מידע בסיסי על עיצוב הדף ואופן הצגת הטקסט שבו. עם זאת, התגיות אינן מאפשרות לרשת, למשל, להבין האם המונח חלונות המופיע בדף האינטרנט מתייחס למערכת ההפעלה או לזגוגיות שבבניינים. ברשת הסמנטית זה כבר ייראה אחרת. שפת התיכנות שתניע את הרשת הזו,RDF, תומכת בתגיות מטא-דאטה מבוססות -XML, שפה המאפשרת לכל מעצב אתר ליצור תגיות מטא מותאמות אישית.
משמעות ה-RDF
RDF אמורה לעזור למפתחי אתרים לקטלג כל מידע חדש שהם מוסיפים לרשת, בדומה לשיטה שבה משתמשים ספרנים כדי לסדר ספרים חדשים. כל פריט מידע ילווה בתגית מטא יחודית, שתאפשר לכל גולש למצוא אותו בקלות. תגיות המטא הללו יקושרו למסמכים ברשת בשם אונטולוגיות, שיגדירו את הקשרים שביניהן. כך, למשל, מפתח אתר, שיבנה דף אינטרנט של בית-ספר, המציין את שמות חברי מועצת התלמידים, יצמיד תגיות מטא-דאטה לכל שם. התגיות יזהו את נשיא מועצת התלמידים, סגן-הנשיא וחברי ועדת קישוט.