שתף קטע נבחר

המשורר האלקטרוני - סיפור קצר

סיפור קצר על עיבוד שפה טבעית (NLP - natural language processing) בכיכוב מערכת התגובות של ynet. הדרך מתגובה מספר 34 לפרס ספיר

בשבוע השני לתפקידי החדש כמובטלת הייטק הצטרפתי לקהילת הטוקבקיסטים הגדולה של ynet.

 

התחלתי בקטן, תגובה לדיווח פוליטי על שר (או שר לשעבר) שאמר (או לא אמר) משהו. הידיעה הבנלית הזו, שעניינה אותי כשלג דאשתקד, גררה כשלושים תגובות. "הכתבה הכי מרתקת שקראתי היום", כתבתי בתוך חלון התגובה. הזדהיתי כ"מובטלת הייטק", איזור מגורים: לשכת תעסוקה. הרגשתי מאוד מתוחכמת.

 

"תודה, קיבלנו את תגובתך ונשתדל לפרסמה בקרוב, בכפוף לשיקולי המערכת", ynet ענה לי במענה לקוני.

 

נדרכתי. אולי התגובה שלי לא מתאימה לשיקולי המערכת?

 

ניתוח סטטיסטי מהיר של שאר התגובות לאותה כתבה גילה כי 37% מהתגובות כללו לפחות שגיעת קתיב אחת, 80% היוו תגובה לאחד המגיבים הקודמים, ואף אחת מהן לא הייתה רהוטה כתגובתי. חששתי שהשיקולים ישאירו אותי בחוץ, אבל "מובטלת הייטק" הייתה מגיב מספר 34.

 

אושר צרוף. אני מופיעה באינטרנט. מרוב שמחה פצחתי בריקוד ניצחון קטן.

 

"אני על המפה"

 

"אני על המפה" דיווחתי לתמיר בעלי במבטא אמריקני, וכדי להישאר על המפה מיד שלחתי כמה "נפלא ומענג", "משובח במיוחד", ובשביל שיקולי המערכת הוספתי גם: "15# אתה מגוכח ופסיחי", ו-"48# תחפס לך חיים מחוץ לאינטרטנט!". הטוקבק התגלה כממכר במיוחד. מהר מאוד עברתי מהתמכרות קלה (תגובה בת שורה אחת פה ושם), להתמכרות קשה (ניצול מספר התווים המרבי, ותגובות לכל הכתבות בעמוד הראשי).

 

"תגידי, אני צריך לכתוב כתבה בווי-נט בשביל לקבל ממך קצת תשומי?" תמיר התלונן ערב אחד. הרגשתי מטופשת למדי עם ההתמכרות המוזרה שלי. אבל תאוות הפרסום השתלטה עלי.

 

"מה את עושה עכשיו?" תמיר רטן מאחורי גבי בשלוש לפנות בוקר, "למה את לא באה לישון?". "המגיב האולטימטיבי" מלמלתי. הייתי שקועה בקרבי רוטינת רקורסיה מסובכת. גם תמיר הוא איש מחשבים. נאחז בציפורניים במקום העבודה החרא שלו, שורד גלי פיטורין כמו שפרס שורד בפוליטיקה.

 

"תסבירי".

 

"אני כותבת רובוט שייצר תגובות. מין מנוע שינתח את תוכן הכתבה ויזרוק תגובה מתוך מאגר משפטים"

 

"תרגיל נחמד". תמיר הביא כיסא והצטרף אלי. למחרת בבוקר הצעצוע היה מוכן למבחן.

 

בחרתי בכתבה אזוטרית על חוג חדש לשזירת פרחים שנפתח ברמת השרון, ונתתי לרובוט להשתולל. תוך דקות ספורות התווספו שלושים ואחת תגובות לכתבה, בכפוף לשיקולי המערכת, כמובן.

 

"הצילו את החתולים והקלבים"

 

מגוון התגובות כלל את: "היי אמא! זה דני", "הצילו את החתולים והקלבים", ואפילו איזה יוסי שריד אחד שטען בתוקף "שמאלנים נמאסתם!!!!! (לת)"

 

סתם בשביל הכיף הוספתי ידנית גם תגובה ארכנית שכללה ניתוח המוטיבים האסתטיים בתהליך שזירת הפרחים והשפעתם על התרבות היפנית.

 

בערב, תמיר ואני פיתחנו את האינטליגנציה של הרובוט, ואחר כך:

 

- "היי אמא! זה דני" עלה בגורל עבור כל כתבה שעסקה בסקס במפורש או במרומז, והעלה תמיהות בקרב המגיבים האחרים ששאלו מי זה הדני הזה שנתקע בכל חור.

 

- ביבי נתניהו צעק "הכיבוש משחית!!!" כתגובה לכל כתבה שכתובה בה המילה "כיבוש". (אפילו אם זו כתבת ספורט שמתארת בפרוטרוט את השער שכבשה נבחרת ישראל בכדורגל).

 

- "מי בא איתי ברכבת לילה לקהיר?" הפך למשפט פופולרי במדור התחבורה.

 

- "אני מלך הפלאפל!" זכה לקריאות בוז אצל מבקרי המסעדות ואוכלי הסושי למיניהם. וכולי וכולי, הכל כתוב, ובר קריאה ב-ynet.

 

מוכנים לאתגר חדש

 

לאחר שבוע של שעשועים, היינו מוכנים לאתגר חדש. האסימון נפל כששמעתי שיר חדש ברדיו. אחד מהשירים האלה שנשמעים כמו גיבוב של מילים, כאילו הכותב פתח מילון ובחר מילים אקראיות והופה! יש שיר חדש.

 

בבוקר תכננתי, בערב קידדנו. לניסיון הראשון הגדרנו שני כללים ברורים – המילה מצוייצת חייבת להופיע בשיר, והשיר חייב להיות בין ארבע שורות. התוצאה הייתה השיר: "עינייך אפפוני".

 

עינייך אפפוני

בכחול של חיוך

על גלי אהבתך אני צף

בתוך אדווה מצויצת

 

שלחנו אותו כתגובה לכמה כתבות במדור תרבות, בשם "המשורר האלקטרוני". "המשורר" זכה במבול של תגובות. איש לא נשאר אדיש ליצירה. עדיין לא הבנו את הפוטנציאל שיש לנו ביד, והמשכנו להשתעשע.

 

- "המוסך של האימא של אחותך" שפורסם כתגובה לכתבה במדור חדשות הרכב, זכה לחמישים תגובות, ביניהן "מדהים", "ראשוני ומקורי", "פאתוס מלא רגש", ו- "משורר תעשה לי ילד".

 

- "דג שתום עין" כיכב במדורי האוכל במשך חמישה ימים ברציפות, ו"ירח אגס אדמדם" הפך כל כך פופולרי, שהפך לאימייל שרשרת ומסתובב בארץ כמו מגיפה.

 

שלמה ארצי פונה

 

בלילות הרחבנו את לקסיקון המילים של הרובוט, בעיקר בהטיות לא ברורות של מילים בעלות משמעות כפולה, והתחלנו לפתח מודול שיאפשר לו ללמוד מילים חדשות תוך כדי תנועה. תמיר התפטר כשהגיעה הבקשה משלמה ארצי, אחרי שיחה טלפונית שבה הזמר אישר שהוא מעוניין להשתמש בחומרים של "המשורר האלקטרוני" לדיסק החדש שלו.

 

תמיר התחיל למכור שירים בסיטונות. אבל לחיות על תמלוגים מפזמונאות זה קצת בעייתי. ניסינו להעלות את הרף, והרשינו לרובוט לכתוב כמה סיפורים קצרים. הוא זכה בכמה תחרויות כתיבה, אבל זה עדיין לא מספיק בשביל לחיות. עכשיו תמיר ואני כותבים תוכנית עסקית כדי שנוכל לגייס משקיע, והרובוט כותב רומן.

 

אנחנו בונים על פרס ספיר.


פורסם לראשונה 17/08/2004 00:06

 

חגית אורון היא מהנדסת אלקטרוניקה ולומדת לתואר שני בכתיבה יוצרת
לפנייה לכתב/ת
 תגובה חדשה
הצג:
אזהרה:
פעולה זו תמחק את התגובה שהתחלת להקליד
מ-ynet לפרס ספיר
צילום: פי סי מגזין
מומלצים