שתף קטע נבחר

חדש מ-IBM: מערכת קולית לניווט ברכב

הונדה ומעבדות הפיתוח של IBM בחיפה פיתחו מערכת זיהוי דיבור, שמאפשרת לנהג לנווט במיליוני רחובות בערי ארה"ב, לקבל הנחיות נסיעה לתחנות דלק או כספומטים ולהאזין לביקורת מסעדות ישירות ממערכת האודיו במכונית - כל זאת ללא מגע ובאמצעים קוליים בלבד

IBM והונדה הכריזו כי פיתחו מערכת זיהוי דיבור המאפשרת ניווט ואיתור כתובות בעת נהיגה, שאינה דורשת התערבות או הפעלה ידנית מצד הנוסעים. שיתוף הפעולה בין החברות החל ב-2003 ובמסגרתו שולבו בדגמים חדשים של הונדה תוכנת ViaVoice embedded של IBM, אשר הוסיפה להם טכנולוגיות מתקדמות לזיהוי דיבור ולסינתוז דיבור.

 

בפיתוח המערכת נטלה חלק משמעותי מעבדת המחקר והפיתוח של IBM בחיפה, שהיתה אחראית על בניית מסד הנתונים עליו מתבססת המערכת. באמצעות המערכת 

הונדה Odyssey מערכת זיהוי דיבור

יכול הנהג "לשוחח" עם רכבו, ולבקש בקולו מפת דרכים או הנחיות ניווט, המושמעות עבורו במהלך הנהיגה.

 

המערכת, שזמינה בשלב זה בארה"ב וקנדה בלבד, משולבת כסטנדרט בכל דגמי Acura RL של הונדה משנת הדגם 2005, וניתנת לרכישה גם עבור דגמי Acura MDX והמיני ואן Odyssey.

 

כרגע רק בארה"ב

 

בשלב זה, כוללת המערכת מידע לגבי 1.7 מיליון רחובות בארה"ב, ומסוגלת לעבד מאות הנחיות הניתנות בדיבור רגיל. אוצר המילים והפקודות שלה כולל כ-700 מונחים ופקודות באנגלית, והיא מסוגלת להבין ולזהות טווח רחב של מבטאים.

 

"נושאי השפה מפותחים בהתאם לצרכים הספציפיים", הסביר ל-ynet זוהר סיוון, מנהל קבוצת השירותים והטכנולוגיות בתחום המדיה במעבדת IBM בחיפה. "מסד הנתונים שקיים כרגע בתוכנה זמין רק לגבי מקומות בארה"ב, ובאנגלית אמריקנית, כי כך הונדה ביקשה. מבחינה עקרונית וטכנולוגית, אין מניעה להתאים אותו לכל מדינה אחרת", אמר.

 

כדי להיעזר בהכוונה קולית, הנהג לוחץ על כפתור "דיבור", שממוקם על גבי ההגה, כאשר המערכת מזהה גם פקודות כלליות יותר, כגון "מצא את תחנת הדלק הקרובה ביותר", "מצא מכשיר בנק אוטומטי", או "מצא מסעדה איטלקית", בשלב הבא, היא מספקת לנהג הוראות נסיעה אל כל כתובת מוגדרת וממנה.

 

לצד ההנחיות ניתן גם להאזין לרשימת המסעדות הקרובות, ולשמוע קטעי ביקורת של מסעדות ממדריכי המסעדות של זאגט, כאשר מיקום הרכב מתקבל באמצעות מערכת GPS. "מדריך המסעדות זמין ב-DVD ומוזן למערכת השמע של המכונית. זאת, לעומת נתוני הרחובות, שמובנים במערכת, ולכן לא ניתן לבצע בהם שינוי או החלפת שפה על ידי המשתמש", הסביר סיוון.

 

סיוון מסביר, כי הקול שבו מדברת המערכת אל הנהג נבחר בקפידה על ידי הונדה, למרות שבאופן תיאורטי הנהג יכול להקליט את קולו באופן עצמאי. את מערכת זיהוי הקול משלים מסך מגע, שגודלו שבעה אינץ', ובעזרתו ניתן לגשת לתפריטים שונים, לאיית מילה או כתובת לצורך שימוש נייח, וכן מצורף ג'ויסטיק לניווט.

 

התאמה לסביבה רועשת

 

התהליך כולו נעשה ללא צורך להסיר את הידיים מעל ההגה או להסיט את המבט מהדרך, ואין צורך בהקלדה, בנגיעה במסך מגע או חיוג טלפוני. מאחר וטכנולוגיית זיהוי הדיבור והפקת הקול המסונתז של IBM משולבת במערכת האודיו של המכונית, הוראות הנסיעה מושמעות ברמקולים הרגילים, ומקושרות במקביל  למערכת בקרת האקלים של הרכב, אשר גם בה ניתן לשלוט באמצעות פקודות קוליות.

 

"הטכנולוגיה דומה לתוכנת ViaVoice שמוכרת ממחשבים אישיים", אמר סיוון, אך הוסיף כי במקרה זה, נעשתה התאמה למחשבים ניידים המשולבים בכלי רכב

וכן לסביבת הרכב, אשר לרוב רועשת למדי, בגלל גורמים שונים כמו נוסעים, מכוניות אחרות ורעשי רקע.

 

על מנת לבצע את ההמרה מטקסט לקול, עיבדו צוותי הפיתוח של שתי החברות מאות שעות הקלטה, ובמקביל, הפיקו וניתחו מאות שעות הקלטה נוספות. זאת, על מנת להפיק משפטים המדמים את זרימת הדיבור האנושית, ולתת למערכת אפשרות להטעמה והדגשה של חלקי משפט, כמקובל בשיחה בין בני אדם.

 

טכנולוגיה שפותחה בחיפה

 

המערכת מבוססת על טכנולוגיית עיבוד ממוחשב של טקסט לדיבור eCTTS, שפותחה במעבדות המחקר של IBM בחיפה, ומהווה סוג חדש של מערכת סינתזת דיבור המספקת מאפיינים אנושיים לקול שבוקע ממנה.

 

"eCTTS משתמשת בהקלטות של קול המחולק למקטעים מאוד קטנים של דיבור, ובכל פעם בוחרת ממסד הנתונים, על פי הצורך, את המקטעים המתאימים ליצירת משפט טבעי, חלק ואיכותי", אמר סיוון.

 

  תגובה חדשה
הצג:
אזהרה:
פעולה זו תמחק את התגובה שהתחלת להקליד
זוהר סיוון. "מערכת ייחודית בעולם"
זוהר סיוון. "מערכת ייחודית בעולם"
IBM. מסד נתונים מזערי
IBM. מסד נתונים מזערי
הונדה. המערכת משולבת בדגמי Acura RL
הונדה. המערכת משולבת בדגמי Acura RL
מומלצים