שתף קטע נבחר

מוקד טלפוני: הדור הבא

המוקד הטלפוני הממוחשב עומד להיעלם מחיינו, ויוחלף על ידי מחשב שיודע להקשיב, להבין ולהגיב על דיבור חופשי - גם אם זה כולל מבטא ושגיאות. ישראל הפכה אמנם למרכז עולמי בתחום זיהוי הדיבור, אבל בכל הנוגע להכתבה למחשב, עברית עדיין קשה שפה

"לשירות לקוחות הקש 1, למכירות הקש 2, למחסן הקש 3, למרכזנית הקש אפס או המתן". המונולוג הזה מוכר היטב לכל מי שנאלץ לבזבז דקות ארוכות ויקרות בהאזנה מתסכלת למענה הקולי של אירגון כלשהו.

 

הרעיון היה מוצלח במקורו: מוקדן ממוחשב, שעוזר לנו לבצע את כל הפעולות באמצעות הטלפון. אלא שמערכות המענה הקולי התגלו כמסורבלות והעבודה עמן הפכה לסיוט. לעיתים נדרש זמן רב יותר להקיש על כפתורים שונים מאשר להמתין למרכזנית, שתואיל להעביר סוף סוף שיחה.

 

לא מדובר רק בעולם העסקים: כל מי שניסה להזמין כרטיסים לסרט בטלפון יודע מה צריך לעבור בשביל זה. אבל המציאות הולכת ומשתנה. מערכות המענה הקולי בעולם מקבלות את התוספת שהיתה חסרה להן: קול.

 

באמצעות פקודות קוליות וטכנולוגיות חכמות של זיהוי מילים, יכולים המתקשרים לנתב עצמם מבלי להסתבך עם תפריטים אינסופיים. מערכות מתוחכמות יבינו מיד במה מדובר. כשנתקשר ל-144 כדי לברר מספר, הוא יופיע ברגע שנבטא את שם הנמען. גם המחשב של הבנק יזהה אותנו, ויספק את המידע.

 

החברות הישראליות העוסקות בתחום ממוקמות היטב על המפה. באופן מפתיע, הישראלים, הידועים ביכולת הדיבור שלהם, הם שגילו לעולם את הטכנולוגיות שמסוגלות גם להקשיב.

 

סיפור הצלחה ישראלי

 

100 מיליון דולר - זה הסכום שהשקיעה חברת ScanSoft האמריקנית בשתי חברות ישראליות, פונטיק סיסמטס וארט טכנולוגיות, העוסקות בזיהוי דיבור. ScanSoft עצמה נחשבת לאחת הענקיות בתחום ומציעה פתרונות בכל תחומי זיהוי הדיבור - החל ממערכות למוקדי שירות, תוכנות למחשב, ועד זיהוי דיבור לטלפונים סלולריים.

 

הסכום הזה לא הושקע ממניעים ציוניים, כמובן. שתי החברות הישראליות מחזיקות בטכנולוגיות פורצות דרך ברמה עולמית. ScanSoft לא הצליחה לפתח טכנולוגיות כאלה לבדה, ולכן החליטה לבצע את הרכישה. פונטיק סיסטמס קיימת כבר כעשור, אך את פריצת הדרך הגדולה שלה השיגה רק לפני מספר שנים.

 

"פתרנו בעיה מאוד קשה", מסביר יואל זנגר, מנהל הפיתוח העסקי של החברה. "כדי ליצור ספר טלפונים ממוחשב למוקד כמו 144, יש צורך במיליוני רשומות. בנוסף, המערכת צריכה לפענח את מה שאומר המטלפן ולהחזיר לו את השם הנכון. "פונטיק" הצליחה ליצור מערכת, המסוגלת לעבוד על בסיס נתונים גדול במיוחד, שמכיל מיליוני רשומות, ולספק תשובות בזמן אמת".

 

ההצלחה לא איחרה לבוא. מערכות זיהוי הקול שלה נרכשו על ידי תאגידים כמו מיקרוסופט, קוקה קולה ו-AT&T. "בשנה האחרונה זה הפך לבעיה", מספר זנגר. "בארה"ב הוצאו שישה מכרזים לניהול מערכות 144 אצל חברות טלפון, ובאופן בלתי צפוי זכינו בכולם. לא ציפינו לכזה ביקוש".

 

מערכות של החברה משמשות גם בישראל: הן מסייעות ללקוחות פלאפון המבקשים לקבל שירותי מידע כמו שערי מניות, חדשות ותוצאות ספורט. המנוע של פונטיק משמש גם כבסיס למערכות מסובכות יותר במוקדי שירות ממוחשבים ברחבי העולם.

 

המחשב מדבר אליך

 

ScanSoft רכשה גם את ארט, שעוסקת בזיהוי דיבור ובזיהוי כתב יד. בעוד שחברות אחרות בעולם פיתחו תוכנות זיהוי דיבור הדורשות עוצמת מיחשוב גדולה יחסית, ארט פנתה לטלפונים סלולריים. החברה הצליחה ליצור פתרון זיהוי דיבור משלה, הכולל זיהוי מילים ואפשרות לתת לטלפון הסלולרי פקודות כמו "חייג למשה", או "מספר 5551234".

 

הפתרון נדחס לזכרון בנפח 300 קילובייט בלבד, מה שמאפשר לשלבו בסלולריים בעלי נפח זיכרון קטנטן. הפתרון שלה משמש כיום 30 חברות סלולר ומיושם ב-40 מיליון מכשירים. בין היתר הוא פועל גם במכשירי ה"ספיריט" הישראליים של מוטורולה, המיועדים לכלי רכב, ואמורים לחסוך לנהג את הטיפול הידני בטלפון.

 

ניר בן דור, מנהל המכירות הטכני בחברה, מספר על החידוש האחרון: "הצלחנו ליצור מערכת, המסוגלת לא רק לזהות את הפקודות אלא גם להקריא אותן בחזרה ובקול אנושי סביר. מערכת כזו יכולה לאפשר לנהג לבצע שיחה מבלי להסיר את העיניים מהכביש ואת הידיים מההגה".

 

חידוש נוסף שהציגה החברה הוא העברת הטלפון למצב "הקשבה" קבוע. "באמצעות מילה אחת ניתן 'להעיר' אותו ולתת לו פקודות", מסביר בן דור. בארט מבטיחים, שבתוך שנה ניתן יהיה לשמוע בסלולרי גם SMS ודואר אלקטרוני. בעתיד הרחוק יותר, מקווים לפתח ערכות זיהוי דיבור חכמות, שיאפשרו להכתיב הודעת טקסט שלמה ולשגרה מבלי לגעת בטלפון.

 

בן דור צופה, כי בעתיד נראה גם אוזניות בלוטות' המשלבות יכולת זיהוי הדיבור: "נוכל לחייג מבלי לראות את הטלפון כלל. נצטרך רק לומר את השם המבוקש לאוזניה".

 

מדריך בכספומט

 

כדי להגיע למערכת כוללת יש צורך ביישומים ידידותיים הנבנים על גבי המנוע הקולי של פונטיק סיסטמס. יישום אחד כזה הוא של חברת טקטיקס, שבנתה מערכות למספר ארגונים (למשל, אגרסקו). נשיא טקטיקס, רפי נשיא, מאמין שאנחנו נמצאים בשלב מתקדם. "מאז שפונטיקס השיקה את הפלטפורמה העברית, זה סלל את הדרך ליישומים רבים", אמר.

 

המפתח הראשי של "טקטיקס", תומר אופיר, מציג שני פיתוחים שיהפכו את מערכת זיהוי הקול ליותר מאשר מענה אוטומטי מתוחכם. הפיתוח הראשון "מעצב" את הפרופיל של המענה הקולי: מרכזנית, שעונה לטלפון במבטא עסקי ומנומס - או דווקא כזו שהיא בעלת מבטא עממי וצבעוני יותר.

 

השני הוא אפשרות לשילוב וידאו בממשק. כך אפשר להציג ללקוח דמויות מוכרות, ולהפוך את האינטראקציה עם המערכת לנעימה בהרבה. לדוגמה: כספומט של בנק הפועלים, שמציג את דמותו של יאיר לפיד המככב במסעות הפירסום של הבנק. באמצעות קטעי וידאו מוקלטים, לפיד יברך וידריך את הלקוחות בביצוע הוראות שונות.

 

עברית קשה שפה

 

הטכנולוגיות שפותחו בישראל אכן מרשימות, אך שפת הקודש עדיין מתקשה בזיהוי דיבור חופשי. מערכות כאלה, שמסוגלות להקשיב למילים הנאמרות ולהמיר אותן לטקסט כתוב נמצאות זה שנים בשימוש בארה"ב. הן מועילות לא רק לאנשי עסקים, הזקוקים לכתבנית מהירה, אלא גם לאנשים עם מוגבלויות שמתקשים להקיש על המקלדת.

 

עם זאת, טכנולוגיות הפועלות בעברית עדיין לא קיימות בשוק. מה שקיים בשפות רבות בעולם כמערכות שנתנות לרכישה חופשית במחיר של 100 דולר, לא קיים בעברית. מעבדת המחקר של IBM בחיפה פיתחה כבר לפני שנתיים מערכת הכתבה מושלמת בעברית על בסיס תוכנת זיהוי הקול האנגלית של החברה - אך העדר כדאיות כלכלית מנעה את הפצתה.

 

זוהר סיוון, המנהל את קבוצת טכנולוגיות מדיה ושירותים במעבדת המחקר, מסביר, שנחוצה השקעה של מיליון דולר לכל היותר כדי שמערכת הכתבה בעברית תהיה נגישה. הבעיה אינה נוגעת לתוכנה, שפותחה והותאמה לעברית, אלא לצורך בדגימת קולות מכל שכבות האוכלוסיה בישראל.

 

ב-IBM ניסו לשלב את המערכת בפרוייקט בית המשפט העתידי, שם תחסוך את הצורך בקלדניות ותייצר פרוטוקולים בצורה אוטומטית, אבל קיצוץ בתקציב משרד המשפטים חיסל את החזון. יואל זנגר מפונטיק סיסטמס משוכנע שההשקעה הגדולה של ScanSoft תשנה את המציאות הזו.

 

"אחת המטרות שלי היא להביא חלק מהכלים של ScanSoft העולמית לישראל ולעברת אותם. נתחיל בטכנולוגיות להקראת טקסטים, ונמשיך למערכות ההכתבה. אני מאמין שתוך שנה נוכל לראות הרבה מהמוצרים של ScanSoft גם כאן".

 

לשמוע ולהבין

 

זיהוי הדיבור הוא רק שלב אחד בתהליך. חברת אינטליגייט עובדת כבר על השלב הבא, שבו המחשב יפענח משפטים מורכבים ויבין אותם. דוגמאות לא חסרות. במקום להגיד למוקד הבנקאי בטלפון שם של מניה ולקבל את השער האחרון שלה, תוכלו לומר "קח לי אלף מהעו"ש ותפקיד לי אותם בפיקדון יומי".

 

מערכת טקסטואלית דומה נמצאת באתר של שירותי בריאות כללית, שם יכולים הגולשים להקליד שאלה, ולקבל רשימת רופאים שעובדים קרוב לבית ומתמחים בטיפול בבעיה. מערכת טקסטואלית כזו נמצאת כיום בשימוש נמל התעופה בן גוריון, שם היא מספקת מידע על נחיתות והמראות באמצעות הודעות SMS.

 

"להפתעתנו, גילינו שהישראלים מנומסים", מספרת בחיוך מיכל לוצקי, מנכ"ל אינטליגייט. "הם מחזירים למערכת הודעות 'תודה' או פותחים ב'שבוע טוב'. הם לא מעכלים שמערכת ממוחשבת עומדת מאחורי התשובות". לדבריה, בשלב הבא תנהל המערכת שיחה שלמה, שבמהלכה תבין את המשפטים גם אם יהיו מקושרים למשפטים קודמים.

 

כך, למשל, המוקד הבנקאי שממנו ביקשתם להפקיד אלף שקל בפיקדון יומי, יתייחס אליכם בהבנה, אם פתאום תשנו את דעתכם ותאמרו: "יודע מה? תבטל את ההעברה מהעו"ש ותיקח את הכסף מהפיקדון שייפרע לי מחר". לאן הלאה? מערכות זיהוי דיבור צפויות להופיע בכל מקום שבו יש גישה של בני אדם לטלפון ולמערכות אוטומטיות. וזה יקרה מהר מהצפוי, גם בישראל.

 

לפנייה לכתב/ת
 תגובה חדשה
הצג:
אזהרה:
פעולה זו תמחק את התגובה שהתחלת להקליד
מערכת זיהוי לרכב של ארט טכנולוגיות
פונטיק סיסמטס. מערכת פופולרית גם בעולם
מומלצים