חברת "פונטיק סיסטמס" (Phonetic Systems) הישראלית השיקה אתמול (א') את הגירסה העברית למערכת הזיהוי הקוליVoice Search Engine, המזהה את דברי האנשים המטלפנים למוקדי שירות טלפוניים ומטפלת בשאלות ובקשות שונות לקבלת מידע.
"פונטיק סיסטמס" מפתחת מערכות לאחזור מידע מתוך מסדי נתונים גדולים באמצעות זיהוי קולי בטלפונים קוויים וסלולריים. הטכנולוגיה פועלת בצד השרת ובעלת יישומים שונים בתחום הבריאות, הביטחון והתקשורת. יישומים אלה מאפשרים למתקשר "לשוחח" עם המערכת במקום עם מוקדן אנושי, ולקבל מידע רלוונטי או לבצע פעולות עסקיות באופן אוטומטי. מערכות אוטומטיות דומות מאפשרות לחברות לחסוך בהוצאות כוח אדם, לשפר את איכות השירות ללקוח ולאתר במהירות מידע מתוך מסדי נתונים שמכילים עשרות מיליוני רשומות, באמצעות שאילתות קוליות.
למשל, מערכת 144 אוטומטית, בה המשתמש מדבר ישירות עם המערכת ומבקש את האדם או שם העסק ומקבל את מספר הטלפון הדרוש או מערכת המנתבת שיחות נכנסות לארגון על ידי אמירת שמו של העובד או המחלקה המבוקשת. כך, יכול אדם המתקשר מחוץ לארגון ליצור קשר מיידי עם הטלפון הקווי או הסלולרי של עובד במקום להמתין זמן רב למענה אנושי.
המערכת שפיתחה "פונטיק סיסטמס" אף מסוגלת לאמת את זהות המתקשר באמצעות טביעת קולו - אחד מיישומי המערכת מאפשר למשתמש לשלוח דואר אלקטרוני באמצעות קולו - תוך כדי נהיגה, למשל.
האגוז הקשה של יוצאי אתיופיה
המערכת "דוברת" אנגלית-אמריקאית, אנגלית-בריטית, צרפתית ,גרמנית, צרפתית-קנדית, סינית וכעת גם עברית. לצורך פיתוח הגירסה העברית אספה החברה דגימות קול של למעלה מ-1700 דוברים בכל הארץ, המהווים חתך מייצג של האוכלוסייה מבחינת מבטאים, מין, גיל וכו'. דגימות אלה שימשו את החברה להפעלת תהליך "אימון" אוטומטי שבו למדה המערכת את אוסף הצלילים האופייני לשפה העברית.
"דגמנו קבוצות אתניות על פי חלקן באוכלוסיה – יוצאי אתיופיה, אשכנזים, מזרחים, יוצאי חבר המדינות ועוד", אומר עצמון גילאי, אחד ממייסדי "פונטיק סיסטמס", המשמש היום כסמנכ"ל מחקר ופיתוח החברה. מבין כל קבוצות הישראלים שקולותיהם נדגמו לצורך המערכת, יוצאי אתיופיה - קבוצה קטנה עם מבטא מאוד ייחודי היוו האגוז הקשה מכולן אך גם אותם מבינה המערכת כיום. אוכלוסיות אחרות לא נכללו בדגימות. למשל, המערכת תתקשה להבין עולה חדש מסין וגם לא תענה לצרכים המיוחדים של אוכלוסיית לקויי הדיבור, מודה גילאי.
איך זה עובד?
הטכנולוגיה של "פונטיק סיסטמס" מתמודדת עם תהליך זיהוי דיבורו של המשוחח האנושי בכמה שלבים: בתחילה, המערכת מאזינה לצלילים בקולו של הדובר ומנסה לפרקם לגורמים ולפענחם על פי המצלול וללא תלות בשפה. בשלב שני, המערכת משווה בין המצלול למלים השמורות במסד הנתונים. רכיב "מנהל השיחה" של המערכת מחליט בכל שלב בשיחה כיצד להגיב לדברי המשתמש ומנסה לצפות את בקשותיו.
הסבת המערכת לשפה העברית הציבה כמה בעיות ייחודיות עבור המפתחים, מציין גילאי, העברית המודרנית אינה מנוקדת. למשל, האם אורי הוא אוֹרי או אוּרי, האם ניר הוא נִיר או נייר? גילאי: "שמות של אנשים הם בעייתיים במיוחד בגלל שהמערכת אינה יודעת כיצד יבטא הדובר את השם. לפיכך, מנוע פירוש הצלילים שלנו מתרגם את המלה לייצוגים פונטיים ומחשב מתוכם את האפשרות הסבירה ביותר במסד הנתונים, לה מתכוון הדובר, על פי מאפיינים הסטטיסטיים ובלשנות חישובית".
וכיצד תדע המערכת כיצד לבטא את השמות המופיעים במסד הנתונים? לשם כך הקליט קריין (גבר) 30,000 שמות פופולריים, 2,000 ישובים בישראל ומשפטים קבועים בעברית. אם השם המבוקש אינו קיים במאגר ההקלטות מערכת טקסט לדיבור (Text To Speech) אומרת את השם בקול מתכתי. ב"פונטיק סיסטמס" מתכוונים להרחיב את מאגר המלים המוקלטות.
לטענת גילאי, אחוז ההצלחה של המערכת בפענוח עברית דומה לשיעור הפענוח בשפה האנגלית - 95-96 אחוז. המערכת כבר נוסתה בהצלחה ונבחנת בימים אלו להפעלה מסחרית על ידי מספר ארגונים גדולים בישראל.
"פונטיק סיסטמס" והמתחרות
"פונטיק סיסטמס" הוקמה ב-1994 על-ידי חזי רזניקוב וגילאי והיא מונה 65 עובדים, מחציתם בפתח תקווה ומחציתם בארה"ב. היקף המכירות של החברה עומד על 5-6 מיליון דולר והיא קרובה לאיזון, על פי המייסדים. החברה מתחרה בשוק העולמי עם חברות גדולות ומצליחות יותר המפתחות מנועי זיהוי דיבור אוטומטיים (ASR), בהן Speechworks ו-Nuance.
בסיס לקוחותיה מונה למעלה מ-150 חברות, בהן מיקרוסופט ומוטורולה, ומערכות החברה מטפלות מדי שנה באופן אוטומטי בלמעלה מ-200 מיליון שיחות.
גילאי מציין כי אחד היישומים הפופולריים בעקבות ה-11 בספטמבר הן מערכות מסג'ינג בזמן חירום – מפעיל המערכת נוקב בשם של קבוצה המוגדרת מראש, והודעה המודיעה לחברי הקבוצה כי עליהם לפנות את הבניין מייד משוגרת לכל מכשירי הטלפון שלהם.
מדוע לחברה לפתח גירסה בעברית עבור השוק הישראלי המצומצם בהיקפו? גילאי אומר ש"פונטיק סיסטמס" זיהתה הזדמנות בתחום המתפתח של המוקדים הטלפוניים (CALL CENTERS). מול "פונטיק סיסטמס" פועלות בישראל חברות מעטות פועלות בתחום הזיהוי הקולי בעברית, בהן ART, NSC ו-IBM, אך תחום פעילותן אינו חופף. טכנולוגיות הזיהוי הקולי בעברית שפיתחה ART, למשל, אינן מבוססות על שרתים אלא מוטבעות בטלפונים סלולריים, מחשבי כף יד והתקנים דיגיטליים. מערכות אלה תומכות באוצר מלים קטן יחסית ואינן מתחרות במערכות של "פונטיק סיסטמס" באופן ישיר.
עמי מויאל, מנכ"ל NSC מציין כי מנוע זיהוי הדיבור של החברה תומך בעברית כבר כשנה וחצי. החברה פיתחה מנוע זיהוי דיבור בסיסי המשמש ליישומים שונים. למשל, הפורטל הקולי של החברה מאפשר למטלפן לקבוע פגישות אישיות באמצעות קולו.
עיקר המכירות של החברה מיועדות לשוק תוכנות המענה האוטומטי (IVR) – לדוגמה, מענה קולי המאפשר לאדם להזמין כרטיס קולנוע לסרט מסוים בקולו במקום לדפדף בכל האפשרויות עד שהמענה האוטומטי יגיע לסרט הרצוי. חברת סלקום מטמיעה בימים אלה שירותים שונים המבוססים על הטכנולוגיה של החברה ובין השאר יאפשרו לעובדים בארגונים לחייג לכל עובד אחר באמצעות אמירת שמו.