שתף קטע נבחר

התשמע קולי (סוף סוף)?

המחשב יאזין בסבלנות להוראות, הטלפון יקשיב יפה ויחייג. המקלדת והעכבר אאוט

הפעלה קולית, עולם בלי מקלדות ועכברים, משאת הנפש של משתמשים ומתכנתים כבר כמה שנים. אבל עד כה רווחה ההפעלה הקולית הזו בעיקר בסרטים. במציאות היא הציגה ביצועים מאכזבים.
חברת מחקרי השוק האמריקנית כאהנרס אין סטארט פירסמה בשבוע שעבר נתונים חדשים, הצופים כי שוק תוכנות זיהוי הקול יגדל מ-200 מיליון דולר כיום ל-2.7 מיליארד דולר בשנת 2005. תוכנות זיהוי הקול, לטענתה, יכולות לחסוך כסף רב לחברות: הן יפחיתו את מספר האנשים הבאים במגע עם הלקוחות באמצעות הטלפון. זיהוי קולי, למשל, יכול להחליף מוקדנים יקרים.
לפי המחקר, שיעור הגידול המהיר ביותר של טכנולוגיית זיהוי קול צפוי בתחום הטלפונים הסלולריים. כך, למשל, משתמש בטלפון סלולרי יוכל להתקשר למוקד מסויים ולבקש - בקולו ובשפה חופשית - ששערי המניות יועברו היישר למכשיר הנייד שלו; נציג מכירות יוכל לקבל מחירי מוצרים ישירות לסייען הדיגיטלי. פורטלים קוליים יכולים לאפשר גישה קלה למידע - דואר אלקטרוני למשל - לאנשי מכירות, לעובדים מן הבית, לאנשי עסקים העושים חלק גדול מזמנם בנסיעות ולעובדים ניידים אחרים, גם אם אין להם גישה למחשב או לאינטרנט.
שירותי מידע המבוססים על זיהוי קול מאפשרים למעשה לכל אדם לדלות מידע באמצעות הטלפון, תוך שימוש בקולו בלבד. אין צורך במחשב וגם אין צורך במכשיר גישה לאינטרנט. הם מבינים את ההוראה שנתנו בקולנו, ולא אחת גם מספקים את המידע שנדרש בהשמעה קולית.
אולם הכל מסכימים כי הגידול בדרישה לשירותים קוליים והעברת דואר אלקטרוני ודואר קולי מכל טלפון תלויים לחלוטין באיכותן של תוכנות זיהוי הקול. בעשור האחרון נעשתה התקדמות משמעותית בתחום, שנהנית גם מהשיפור בעוצמתם של מעבדי המחשב, ובשנתיים הקרובות צפויה התקדמות משמעותית עוד יותר.

לדבר עם האופיס

שורה של מחסומים טכנולוגיים עמדו עד כה בדרכה של מערכת הזיהוי הקולי אל הצרכנים. ראשית, מערכות הזיהוי הראשונות הבינו רק שפה אחת (אנגלית, בדרך כלל) עם הגבלות על המבטא. היה צורך ללמד את המכשיר לזהות את הקול המסויים שלנו, את המבטא המיוחד לנו ולשייך מילים לפקודות. כך, עבור כל משתמש ומשתמש צריך לאמן את המערכת בנפרד. עצם הצורך לבצע אימון כזה הרתיע רבים, שהחליטו לוותר על השירות.
באחרונה הופיעו פיתוחים חדשים של תוכנות, שאינן תלויות בשפה ומסוגלות ללמוד מלים חדשות בלי הגבלה, כשהדגש הוא אכן על דיבור רציף, טבעי, בכל שפה ובכל מבטא.
וכרגיל, כל פיתוח וכל חידוש טכנולוגי המופיע בשוק, משיק משום מה למגמות שמכתיבה חברת מיקרוסופט. בקרוב מאוד עומד ענק התוכנה מרדמונד להוציא לאור מימשק של דיבור ישיר אל המחשב, במסגרת חבילת התוכנות אופיס XP. וכשמיקרוסופט מתייצבת מאחורי הטכנולוגיה הזו, זהו איתות ראשוני לשורה נוספת של בתי תוכנה שכדאי ללכת לכיוון המימשק הקולי, הן במחשבים אישיים והן בהפעלת טלפונים סלולריים.
אופיס XP, שתושק בארה"ב בתוך חודש (ובארץ בתוך חודשיים), אמורה לכלול, בין היתר, יכולת זיהוי דיבור. היא תאפשר למעשה לבעל המחשב לשלוט על כל התפריטים באמצעות פקודות קוליות. את המקלדת והעכבר יחליף מיקרופון המקושר לכרטיס הקול במחשב.
בישראל נצטרך לחכות קצת, כי לעת עתה תשולב התכונה רק באנגלית, סינית ויפאנית. מיקרוסופט דווקא חשפה כבר את הקוד למפתחים, כדי שיוכלו לפתח את המימשק הקולי גם בשפות נוספות. נראה מי ירים את הכפפה לגבי העברית. הסניף הישראלי של החברה עדיין לא מצא מועמד.

לדבר עם הטלפון

מועמדת מצויינת לג'וב הזה היא חברת ART הישראלית, הפועלת מרמת אביב. ART היא אחת החלוצות העולמיות בתחום. בעבר פעלה בעיקר בתחום הזיהוי הקולי למחשבים, אולם היום היא ממקדת את מאמציה בפיתוח ובשידרוג מערכת זיהוי קולי למכשירי טלפון סלולרי, הקרויה סמארט ספיק.
ART נמצאת בשוק הזיהוי הקולי כבר עשר שנים. המערכות שפיתחה למחשב האישי לא הצליחו מסחרית. אולם בשוק הסלולרי קיימת כיום דרישה גבוהה למערכות כאלו, כדי לשחרר את הידיים ולאפשר הפעלה של הטלפון בזמן נהיגה, וגם כשהטלפון ממוזער ואינו כולל מקשים.
אבות-טיפוס של טלפונים כאלה, המופעלים ללא מקשים אלא בפקודות קוליות בלבד, הוצגו באחרונה על-ידי סמסונג, מוטורולה וסימנס. מי שמחזיק טלפון מדגמי 411 ו-611 של סמסונג, למשל, יכול לבצע בהם חיוג קולי באמצעות גירסה ישנה של התוכנה, שנמכרה לסמסונג בשנת 1995. אולם בדיקה של סאני, נציגת סמסונג בארץ, הראתה שמעטים מאוד מבעלי הטלפונים משתמשים באפשרות החיוג הקולי. הסיבה פשוטה: ההפעלה מסורבלת והתוכנה מתקשה לזהות את הפקודות - אתה מבקש מהטלפון להשיג את אמא ומקבל את החותנת.
אגב, בטלפונים החדשים מתוצרת סמסונג המופצים בארץ הפונקציה אינה קיימת עוד. "השיקול שלנו היה לפנות את הזיכרון להאצת הגלישה באינטרנט, במקום להקדיש משאב כל כך חשוב לפונקציה שאיש אינו משתמש בה", מסביר יו"ר סאני, אילן בן-דב.
אולם בשש השנים שחלפו מאז חלו התפתחויות מפליגות בתחום. הדגש היום הוא על זיהוי של דיבור רציף וטבעי והמערכות אמינות יותר. וכך, בתוכנה העכשווית של ART ניתן לבצע חיוג באמצעות הקראת שם או מספר טלפון, כשההקראה מתבצעת בקול רם וברצף, בשפה טבעית לחלוטין. המכשיר יתחיל לחייג ברגע שירגיש בהפסקה של כמה שניות, שתעיד על תום ההקראה.
הטלפונים החכמים החדשים יוכלו אף לקבל עידכון דרך האוויר, בכל פעם שיופיעו שדרוג לתוכנת זיהוי הקול. התוכנה של ART גם אינה כבדה מבחינת משאבי מיחשוב. הבעיה היחידה היא, שיש לשלבה במכשיר הטלפון עוד בשלב הייצור - לא ניתן להוסיפה לאחר מכן.
אגב, ART ניסתה לעניין גם את פאלם, יצרנית פאלם פיילוט, בתוכנת הזיהוי הקולי שלה. אבל רק באחרונה, לאחר שמערכות ההפעלה המתחרות, כמו פוקט פיסי וסימביאן, החלו לזנב בה בחידושים משלהן, החלה החברה להתעניין בשילוב המימשק הקולי בדור הבא של מכשיריה.

בלי רעשי רקע

בעיה מרכזית הקשורה לזיהוי הקולי היא ההפרדה בין הקול האנושי, שאותו נדרש המכשיר להבין, לבין רעשי הרקע, שבדרך כלל מאפילים על המסר העיקרי. דוגמה טובה לכך היא דיבור בתוך רכב נוסע.
את רעשי הרקע הללו מצליח פיתוח ישראלי אחר להפחית למינימום, ובחלק מהמקרים להעלים כליל.
מדובר במיקרופון אופטי מתוצרת חברת פון אור מאור-יהודה. פון אור מפתחת פתרונות שמע, תוך שימוש בטכנולוגיות אופטיות. הרגישות הגבוהה של המערכות שלה מאפשרת להן לפעול גם בסביבה רועשת במיוחד, כאשר המיקרופון מעביר אל המחשב רק את הפקודות ומסנן החוצה את הרעשים המיותרים.
פון אור מתמקדת כיום בתכנון ובייצור של מיקרופונים לדיבוריות ברכב. בשנת 2002 היא תתמקד בתחום המיקרופונים למכשירי הסלולר וברבעון הראשון של 2002 תשיק לראשונה מיקרופונים אופטיים למחשבים אישיים. בינתיים היא עוברת השנה גידול מואץ, בעקבות הסכם שחתמה עם מוטורולה העולמית לשילוב המיקרופונים שלה בשוק הרכב האמריקני.
הפתרון של פון אור, המסלק את הרעשים, הסיר מכשול גדול שעמד בפני מפתחי היישומים של זיהוי קולי. רמת הדיוק של המידע שמבין המכשיר עלתה מ-85 אחוז ל-98. בתנאים הקשים ביותר, כמו נסיעה ברכב במהירות 100 קמ"ש, עם מזגן בתפוקה מקסימלית, הדיוק עלה מ-49 אחוז ל-80. יכולת זו משאירה מאחור את מערכות המתחרה העיקרית של פון אור, המיוצרות על ידי תאגיד פיליפס.

לפנייה לכתב/ת
 תגובה חדשה
הצג:
אזהרה:
פעולה זו תמחק את התגובה שהתחלת להקליד
מומלצים