האם גוגל משחית את הרשת?
חברות השולטות במספר רב של אתרים יוצרות מניפולציות כדי לשפר את מעמדן בגוגל. התוצאה: דפים חסרי ייחוד וערך מוסף מטפסים לראש התוצאות
גוגל חזק מדי. אני יודע שאלה דברי כפירה בעיקר עבורכם, לפחות רובכם, שהתרגלתם להתחיל כל חיפוש במנוע הפופולרי ביותר באינטרנט. אולי אתם חושבים רק דברים טובים על גוגל, אך שימו לב לכך שלנוכח היקף ההשפעה הנוכחי של האתר בכל מה שקשור בחיפוש מידע באינטרנט, הוא כבר לא מבטא את הפופולריות של האתרים אלא קובע אותה.
כך טוען דניאל ברנט, נשיא העמותה Public Information Research, שלקח על עצמו את תפקיד כלב-השמירה של הדמוקרטיה ב-Web. האתר שלו הוא נקודת מפגש לכל מי שרוצה להבין איך פועל מנוע החיפוש, ומה הן הסכנות הנובעות מכוחו המתגבר. נכון שברגע הראשון הפחד מגוגל נראה כמו פרנויה טהורה - מעט אתרי אינטרנט הצליחו לעטות על עצמם הילה צחה ואלטרואיסטית יותר כמו גוגל - ובכל זאת כדאי לשמוע את מה שיש לדניאל ברנט להגיד.
איך גוגל פועל
כדי להבין את הטיעון צריך לדעת איך גוגל פועל, או יותר נכון, לחקור איך פועל אלגוריתם PageRank באמצעותו מסדר מנוע החיפוש את תוצאות החיפוש לפי הרלוונטיות לכאורה של העמודים. האלגוריתם הזה מתחשב במספר פרמטרים "אובייקטיביים", כפי שעשו מנועי החיפוש מאז ימי AltaVista, אך למתכון הרגיל הוסיפו מעצבי גוגל מרכיב חדש וקריטי מבחינת ההצלחה שלו.
PageRank מודד את החשיבות של עמוד Web לפי מספר הדפים האחרים שמקשרים לדף הנדון. ככל שיש יותר עמודים המתייחסים לקיומו כך הוא עולה בדרגתו. האלגוריתם מבטא את ההערכה הפשוטה, שאין כמו האנשים שתורמים בפועל תכנים ל-Web כדי לשפוט את ערכו של תוכן קיים.
כמו שיטת הניקוד
החשיבה הזאת די מזכירה את "שיטת הניקוד" של מאמרים מדעיים, שערכם נמדד לפי מספר המאמרים המאוחרים יותר שמציינים אותם כאחד המקורות. השיטה הזאת עובדת להפליא כאשר המערכת אכן פועלת באופן חופשי והיושרה האינטלקטואלית של העוסקים בענף מבטיחה כי הם באמת מעריכים את עבודתם של אחרים בלי משוא פנים וללא אינטרסים נעלמים מעין המתבונן.
זה היה המצב ב-Web בזמן שגוגל התחיל לפעול, לפני שהמציאו את מרבית המושגים של "סחר אלקטרוני", והקפיטליסטים לא התחילו למדוד את העמודים בקנה מידה כספי על פי מספר ההורדות. ואכן, בראשית דרכו הצליח גוגל להפתיע גם את המחפשים המנוסים ביותר באיכות רשימת התוצאות שהוא הציג.
קלע למטרה
באותם ימים תמימים הענקנו לו את "בחירת העורכים", לא בגלל שהוא סרק יותר עמודים מאחרים או שהוא הגיב מהר יותר (כל אלה הן תכונות שהגיעו בעקבות ההצלחה והן מבטאות את היכולת של האתר הבוגר להשקיע יותר בתשתיות), אלא משום שהוא אכן קלע למטרה בהענקת ציוני רלוונטיות בדיוק נדיר. הבעיה עם השיטה התחילה כאשר גוגל הפך לפופולרי מאין כמוהו ובעלי העניין העסקי בתוצאות החיפושים התחילו לחשוב איך מנצלים את מנגנון PageRank לטובתם.
כתוצאה מהמניפולציות שלהם, אתרים גדולים, במיוחד אם הם שייכים לקבוצות מדיה-חזקות השולטות במספר גדול של אתרים, זוכים לציון PageRank גבוה מעל לערכם האובייקטיבי. זה קורה משום שהם מקושרים באופן מלאכותי להרבה עמודים אחרים של אותם בעלי עניין. זו אינה מקריות, אלא חלק ממדיניות מתוחכמת שמטרתה לטפס גבוה ומהר בסולם הפופולריות של גוגל.
פופולריות יוצרת פופולריות
וכמו בכל מנגנון עם היזון-חוזר חיובי, פופולריות יוצרת פופולריות ודחיפה קלה בהתחלה יכולה להביא אתר חסר-ייחוד וערך-מוסף לראש מצעד הפופולריות. אומנם גוגל עושה מאמצים לא מבוטלים למנוע מניפולציות של מנגנון PageRank, אבל מי שיודע איך הוא עובד יכול לעקוף בקלות את כל מנגנוני הסינון האוטומטיים. כדי לסלק את האתרים שמשביחים את עצמם על ידי הצלבת קישורים מלאכותית יש צורך בביקורת אנושית - ואת זו קשה ליישם כאשר מספר העמודים באינדקס מגיע ליותר מ-3 טריליון.
לדניאל ברנט יש עוד טענות נגד Google, שאי אפשר להתעלם מהן. כמו הדרך בה האתר עוקב אחרי המשתמשים כדי למדוד את הרלוונטיות על פי הקשר בין השאילתה לאתרים שבחרתם להקליט מתוך רשימת התשובה. או הניקוד הגבוה במיוחד שמוענק לבלוגרים, משום שבכל פעם שהקשקשנים האלה מוסיפים הגיג ליומן האישי שלהם נוצרת טבלת תוכן חדשה והניקוד שלהם במדד PageRank גדל אוטומטית - המנגנון פשוט מעניק נקודות זכות לאתרים מתחדשים ולא חשוב מה הערך הסגולי של התוכן.
ברור לי - ואני מניח שגם לדניאל ברנט - שמאחורי הפגמים של גוגל לא נמצאת יד זדונית מכוונת, אך אין בכך לבטל את התוצאות השליליות. מנהלי Google צריכים להתייחס ברצינות לבעיות ולמצוא להן פתרונות - אחרת גם הפופולריות של גוגל עצמו תעמוד בסכנה.