מגדל השן של "יבמ"
בשנות הדוט-קום העליזות, כשהכול התלהבו מהסטארט-אפים, רשמו חוקרי מעבדות "יבמ" בחיפה כמה עשרות פטנטים חדשים. בין הפיתוחים האחרונים: מערכות זיהוי קול בעברית, כולל הכתבה למחשב ומנוע חיפוש מדוייק ומהיר לכל מכשיר
בשנות הזוהר של "הכלכלה החדשה", כשהמוני חברות סטארט אפ הולידו מיליוני דולרים של משקיעים וכתבות ארוכות בעיתונים, המשיכו חברות ההי -טק הוותיקות לעשות את שלהן בשקט, תחת התדמית האפרורית שדבקה בהן. עתה, לאחר ששנות הדוט קום העליזות מאחורינו, תשומת הלב חוזרת לחברות הישנות. הכסף שמושקע בחממות המחקר והפיתוח שלהן יקבע, במידה רבה, את דמותה של הטכנולוגיה בעתיד.
בחיפה פועלות כבר למעלה משלושים שנה מעבדות המחקר והפיתוח של יבמ, שהן המעבדות הגדולות ביותר של החברה מחוץ לארה"ב. מועסקים בהן יותר מ-500 עובדים, ובהם 121 סטודנטים. זאת, נוסף על כ-1,500 עובדי "יבמ" שאינם עובדי המעבדות. בכל העולם, אגב, מעסיקה "יבמ" כ-320 אלף עובדים (בחודשים האחרונים החלה "יבמ" בפיטורי כ-7,000 מעובדיה).
למרות שהמשבר לא פסח על "יבמ", בשנת 2001 לבדה רשמו חוקרי המעבדה בחיפה יותר מ-60 פטנטים ובאחרונה נחנך בקמפוס אוניברסיטת חיפה הבניין החדש של מעבדות "יבמ" בהזדמנות זו, ולרגל 30 שנה לייסוד המעבדות בחיפה, חושפת "יבמ" כמה מהחידושים הטכנולוגיים שלה.
RECOVC - מבינים את הקול
המחקר המדעי ברחבי העולם בתחום זיהוי הדיבור נמשך כבר יותר מ-30 שנה. אם בשנות השבעים קיוו המומחים כי בתוך שנים ספורות המחשבים יבינו אותנו ויענו מיידית כשנבקש מהם להכין לנו כוס קפה או לקחת אותנו לנמל התעופה, הרי שכיום השאיפות צנועות בהרבה.
היישומים האפשריים של הדיבור הקולי הם רבים: מפקודות קוליות שיאפשרו לנו לגשת לבנק באמצעות הטלפון הסלולרי (למשל, בדיקת מצב החשבון בבנק), דרך בקשות למידע קולי מבוסס מיקום (ניסיון לברר את מזג-האוויר במקום שבו נמצא המשתמש), וכלה ב"דיבור" אל אתרי אינטרנט (כאשר הגולש יבקש בקולו לקרוא את הכתבה העדכנית ביותר באתר חדשות).
טכנולוגיית זיהוי הדיבור אינה מוגבלת לבקשת מידע וכוללת גם הזנת מידע: למשל, הכתבת מכתב בקולו של המשתמש או מילוי טופס בקול באתר מס הכנסה. היתרון של כל היישומים האלה ברור למדי: הם חוסכים מהמשתמש את ההקלדה ומאפשרים לו לדבר אל המחשב באופן טבעי.
אבל איך ניתן לבצע זיהוי דיבור בטלפון הסלולרי? רון חורי, חוקר טכנולוגיות דיבור במעבדת "יבמ" בחיפה, מסביר כי אחת השיטות המקובלות היא זיהוי דיבור מבוסס רשת: כל המידע הקולי מועבר מהטלפון הסלולרי לשרת שבו מותקנת תוכנה לזיהוי דיבור.
התוכנה הזו מזהה את הדיבור ואף ממירה אותו לטקסט. החיסרון של השיטה הזו הוא צורך בפס רחב, מסביר חורי. בנוסף, טכנולוגיית דחיסת הקול של המכשירים הסלולריים הקיימים בשוק, אינה מאפשרת לתוכנה שמותקנת בשרת לזהות את הדיבור באופן אפקטיבי.
על פי גישה אחרת, זיהוי הדיבור מבוצע באמצעות תוכנה שמותקנת במכשיר הסלולרי, הממירה את הדיבור לטקסט ושולחת את המידע לשרת. החיסרון: חורי מסביר כי פעולה זו מחייבת יכולת עיבוד רבה, שאינה קיימת בהתקנים הניידים הקיימים, ובנוסף, לא ניתן לשחזר דברים שאמר הדובר בקולו לאחר שאלו הומרו לטקסט. הפתרון שמצאו חוקרי "יבמ" בחיפה הוא טכנולוגיית RECOVC.
העיקרון שעומד מאחורי הטכנולוגיה הזו, הוא חלוקת הנטל של זיהוי הדיבור בין המכשיר הסלולרי לשרת. השלב הראשון של פעולת הזיהוי מתבצע במכשיר הסלולרי. בשלב זה, המערכת ממירה את קולו של הדובר לנתוני קוד (DATA) באופן שניתן יהיה לשחזר את הקול, ושולחת את המידע בערוץ הנתונים לשרת.
"כל פעולת זיהוי הדיבור בסלולר משתפרת משמעותית מאחר ששולחים בערוץ הנתונים גם קול (בצורת נתונים) וגם נתונים נוספים שדרושים לפעולת הזיהוי", מסביר חורי.
VIA VOICE - הכתבה למחשב
VIA VOICE היא תוכנת זיהוי דיבור של "יבמ", הנחשבת מהמובילות מסוגה בעולם וניתנת לרכישה בכל חנות מחשבים בחו"ל. התוכנה תומכת באנגלית (בריטית ואמריקנית), ספרדית, גרמנית, יפאנית, סינית וערבית. חוקרי מעבדות "יבמ" בחיפה מפתחים כעת תמיכה בעברית.
למעשה, מדובר במיזם ראשון מסוגו בתחום זיהוי הדיבור בעברית, כשמדובר בזיהוי מילים מתוך אוצר מילים נרחב ובדיבור קולח (כלומר, כאשר אין צורך להקריא פקודות שנקבעו מראש או להקריא מילים לאט כדי שהמערכת תבין).
"העברית מציבה לנו אתגרים ייחודיים", מסביר זוהר סיוון, מנהל קבוצת מערכות טלקומוניקציה ומולטימדיה ב"יבמ" בחיפה. "זו שפה שמכילה הרבה מאוד הטיות. למשל, המלה 'וכשיקום' - באנגלית מלה כזו היא משפט שלם".
"אם נכניס כל מילה דומה למאגר המילים, על מנת שמערכת זיהוי הדיבור 'תכיר'' אותה, הדבר יחייב אותנו להשתמש באוצר מילים בהיקף עצום. בנוסף, עברית היא שפה רב משמעותית. למשל, המילה ספר: היא עשויה להיות מבוטאת כארבע מילים שונות - סֵפֶר, סַפָּר, סָפַר או סְפָר.
בעיית ריבוי המבטאים
סיוון מציין, כי בעיה מורכבת נוספת היא ריבוי המבטאים בישראל. מערכת זיהוי דיבור מתקשה לעתים "להבין" מבטאים של עולים חדשים, אשר העברית אינה שפת אמם. חורי מסביר, כי מערכת מתפקדת ושלמה של זיהוי דיבור כוללת רכיב אקוסטי - הקלטה של 1,000 אנשים שאומרים חצי מיליון משפטים ורכיב "אימון", שמאפשר לכל משתמש להתאים אישית את המערכת, על פי צרכיו, באמצעות הקראת 100 משפטים בקולו למערכת. אוצר המילים הנדרש ממערכת כזו עומד על כ-200 עד 300 אלף מילים.
חוקרי "יבמ" בחיפה החלו לפתח את מערכת זיהוי הדיבור בעברית לפני כשנה וחצי. החוקרים פיתחו אב טיפוס בסיסי ביותר של המערכת, המבוסס על 50 אלף משפטים ואוצר של כ-20 אלף מילים. זוהר וחורי טוענים כי תחת המגבלות הללו, המערכת פועלת די טוב.
אולם, המשך הפיתוח תלוי ביכולת של "יבמ ישראל" לפתח מודל עסקי שיאפשר לחברה להפיק רווחים מהמערכת. "התחלנו בפיתוח בעקבות פניות שהגיעו אלינו, אך עם הזמן הבנו כי מבחינה עסקית המצב יותר מסובך מכפי שחשבנו", מודה סיוון.
ג'ורו - אלוף העולם בחיפוש
נקודת המפנה של מנוע החיפוש "ג'ורו", שפותח כולו במעבדת "יבמ" בחיפה, היתה בנובמבר 2001, בתחרות היוקרתית למנועי חיפוש, שעורך מדי שנה המכון הלאומי לתקנים ולטכנולוגיה (NIST). גורו' זכה בתחרות זו בתואר "מנוע החיפוש המדויק ביותר", תוך שהוא מביס מנועי חיפוש רבים של מוסדות מחקר מרחבי העולם.
ד"ר יואל מארק, שאחראית על מחלקת ניהול הידע של המעבדות, מסבירה כי "ג'ורו" מבוסס כולו על סביבת ג'אווה. המשמעות: ניתן להסב את הטכנולוגיה בקלות לפעולה בסביבות הפעלה שונות והתקנים מגוונים, ולהגדיר אותה בקלות לחיפוש בפורמטים שונים של מסמכים, על-פי הצורך. זאת, בניגוד למנועי חיפוש רבים, שמוגבלים לחיפוש מסמכי HTML בלבד.
לדברי מארק, "ג'ורו" מתאים במיוחד לחיפוש במאגרי מידע קטנים ובינוניים של חברות מסחריות וארגונים, שבהם נדרש חיפוש ברמת דיוק גבוהה. ב"יבמ" משוכנעים שבחיפוש מסוג זה, "ג'ורו" עולה על "גוגל", מנוע החיפוש הפופולרי ברשת. "'גוגל''" יעיל בחיפוש במאגרי מידע ענקים, דוגמת האינטרנט,׃ אומרת מארק, "אך מה שטוב לרשת הרחבה אינו מספיק טוב למאגר מידע של מרכז תמיכה ללקוחות או לרשת הארגונית, שבהם התוצאות שעולות בחיפוש חייבות להיות מדוייקות".
עם זאת, יבמ׃" אינה מתכוונת להשתמש ב"ג'ורו" כדי להתחרות ב"גוגל". המשמעות: "ג'ורו" לא יהיה פתוח לציבור הרחב באינטרנט. "יבמ" החלה לשלב את טכנולוגיית החיפוש במוצרים שונים שהיא משווקת, ובהם מנוע החיפוש לפורטל הארגוני (היקר) ש"יבמ" העולמית מוכרת לחברות וארגונים ((WEBSPHERE SERVER PORTAL). הבשורה למשתמשים בארץ: החל מהחודש ג'ורו" תומך גם בחיפוש בעברית.
פיראט - חיפוש מתקדם ב"פאלם"
אחד היישומים הראשונים של טכנולוגיית החיפוש הייחודית שפותחה בחיפה, היא תוכנת חיפוש המכונה "פיראט", המיועדת למחשבי כף יד המבוססים על מערכת ההפעלה של פאלם. "עד כה, משתמשי 'פאלם' שביקשו לחפש מידע במכשיריהם, נאלצו להסתפק בחיפוש ה'סטרינגים' (מחרוזות המידע) הפשוט,׃ אומרת ד"ר מארק.
הסיבה לכך היא פשוטה: מנועי החיפוש הרגילים מבצעים ניתוח סטטיסטי של כל הנתונים במערכת, בונים מסד נתונים וזה משמש לצורך חיפוש מידע. מחשב כף יד אינו חזק דיו כדי לתמוך ביכולות העיבוד של מנועי החיפוש הללו. כדי להתגבר על הבעיה, הסתמכו חוקרי "יבמ" על תופעה מוכרת: כמעט כל משתמשי "פאלם" מבצעים סנכרון של מחשב כף היד עם המחשב האישי - בין השאר, כדי לגבות את הנתונים שב"פאלם".
החוקרים ביקשו לנצל את יכולות העיבוד של המחשב האישי כדי לבצע ניתוח סטטיסטי של כל הנתונים השמורים ב"פאלם" בזמן הסנכרון, ולבנות מסד נתונים זעיר על בסיס הנתונים האלה. את מסד הנתונים הזעיר הזה מעביר המחשב האישי ל-"פאלם". התוצאה: תוכנת חיפוש קטנה, הקרויה PIRATE, וניתן להוריד אותה מהרשת בחינם.
"ריצ'אאוט"׃ גם פורום וגם צ'ט
נתקלתם פעם בבעיה טכנית במהלך גלישה באינטרנט? אם כן, אתם בטח מכירים היטב את תחושת הייאוש: במוקד התמיכה הטלפוני מבטיחים ש"נחזור אליך בהמשך הערב" ותוקעים אתכם בבית, ומשלוח דואר אלקטרוני או פרסום הודעה בפורום התמיכה באינטרנט דומה לקריאה לאמבולנס באמצעות מכתב רשום.
במעבדות "יבמ" בחיפה מציעים פתרון לבעיה הזו בדמות ריצ'אאוט (REACHOUT), תוכנה שפועלת במחשב האישי ומשלבת בין תוכנת מסרים מידיים, צ'ט מקוון ופורום תמיכה.
הגולשים שמתחברים לתוכנה יכולים לבחור בין קטגוריות תמיכה שונות (למשל, "תמיכה בתקלה במחשב האישי", "תמיכה בתקלה בחבילת האופיס" ו"תמיכה בגלישה באינטרנט"). לאחר שנכנסים לאחת הקטגוריות הללו, מתבקשים הגולשים להקליד את השאלה שלהם והיא תנותב לאחד התומכים שנמצא און-ליין באותו רגע.
אם מדובר בשאלה נפוצה, שהפתרון עבורה מצוי בארכיון המערכת, יידע מנוע החיפוש של "ריצ'אאוט" לאתר ולשלוח אותה למשתמש. אמנון ריבק, מנהל פרויקט "ריצ'אאוט", מסביר כי בנוסף יכולים המשתמשים ליצור קהילות מבוססות ידע, שבהן ירוכזו התשובות שקיבלו לשימושם של משתמשים אחרים.
אם התומכים שמחוברים למערכת אינם יודעים את התשובה לשאלה, היא תפורסם במערכת ותמתין לתשובה של גורם מוסמך, שיפרסם את התשובה בפורמט המזכיר פורום באתר אינטרנט.
בכל שלב מספקת המערכת מידע עדכני למנהלי התמיכה, על מצב הטיפול בשאלות שהתקבלו. "ריצ'אאוט" מסוגלת לענות לכם לא רק על שאלות בנושאי מחשב, אלא גם על שלל שאלות נוספות - מתחום ההכוונה ("איך מגיעים לרחוב הרצל"), הלימוד האלקטרוני (E-Learning) או הייעוץ הבריאותי.
ריצ'אאוט׃" היא יישום מבוסס ג'אווה שפועל בסביבת SAMETIME, יישום המסרים המיידיים של "במ".עם זאת, אין טעם לחפש את "ריצ'אאוט" באתרי ההורדות ברשת. ב"יבמ" מתכוונים לשווק את התוכנה לארגונים ולחברות, כמו מוקדי תמיכה והדרכה.