מדיבור לטקסט ובחזרה
מסתבר שהטכנולוגיה של היום יודעת לשמוע, ולא רק זה, היא גם יודעת להמיר את הקול למלים כתובות ולהיפך
האם קיים סורק-עט היכול להציג הגדרות של מילים ואף להגות אותם?
רוב סורקי-העט מחברות כגון C Technologies, קבוצת I.R.I.S Group , ו-WizCom Technologies הישראלית, מיועדים לקליטת נתונים. הם מסוגלים לייבא אותיות וספרות סרוקות אל יישומים באמצעות טכנולוגיית OCR (זיהוי תווים אופטי). ניתן לטעון מילונים אל רבים מהסורקים האלה, וכך לספק הגדרות עבור מילים סרוקות. אחדים אפילו מתרגמים מילים משפה אחת לשפות אחרות. חברת C Technologies מציעה מגוון מילונים כאלה ב-15 שפות שונות. ואם אתה מעוניין בסורק המבטא מילים, חברת WizCom מוכרת את Reading Pen II (במחיר 279$) שאינו מסתפק בהגדרת מילים, אלא אף מרחיק לכת ומסוגל לסנטז קולות ולהגותם.
אני מנהל ראיונות ומקליט אותם. האם קיימת תוכנה שיכולה לתמלל את ההקלטות לטקסט קריא?
באופן תיאורטי ניתן לעשות כן. תקוותך היחידה היא לרכוש מערכת זיהוי קולי כגון ViaVoice מבית IBM או Dragon NaturallySpeaking מבית ScanSoft, ולנסות להזין אותה באודיו הבוקע ממכשיר ההקלטה שלך. קיים סיכוי קלוש בלבד שהיא תצליח להפוך את הראיונות לטקסט קריא. בין אם אתה מחבר את מוצא האודיו ממכשיר ההקלטה ישירות אל כרטיס הקול במחשב, או פשוט מחזיק אותו סמוך למיקרופון המחשב - אפילו מערכת הזיהוי הקולי הטובה ביותר תהפוך את החומר המוקלט שלך לג'יבריש. לאחר ניסוי שתי שיטות אלה עם מכשיר הקלטה של חברת Panasonic ותוכנת ViaVoice לא הצלחנו לקבל ולו מילה אחת מתורגמת כראוי. הבעיה טמונה בכך, שתוכנות כגון אלו אינן פועלות היטב, אלא אם אומנו בהאזנה לקולו של הדובר המסוים, וכן למדו להתגבר על רעשי הרקע בסביבת ההקלטה הספציפית. המהנדסים עובדים על זה אך עדיין אין פתרון שעובד ואפשר להמליץ עליו ליישום שלך.
כיצד אני יכול לשלוט על סביבת Windows באמצעות קולי?
פשוט מאד, תוכנת ה-ViaVoice מבית IBM (במחיר התחלתי של 29$) היא מערכת זיהוי קולי באמצעותה ניתן לנווט בקלות בתוך Windows תוך שימוש בפקודות קוליות, אך יש להשקיע 30-45 דקות בהתקנת התוכנה ואימונה. לאחר ההתקנה תוכל לנווט בתפריט "התחל" של מערכת ההפעלה, להפעיל יישומים, לבחור פקודות מסרגל הכלים ועוד. הפקודה "Surf the Web”, למשל, תשגר את דפדפן הרשת שלך. התוכנה אינה יודעת לתפעל את כל יישומי Windows עם התקנתה, ולכן יש להקליט תסריטי מאקרו לביצוע משימות מבוקשות. אם אתה מעוניין בחלופות, אפשר לנסות את Dragon NaturallySpeaking מבית ScanSoft, המציעה גם היא פיקוד ובקרה קוליים. נציין גם כי חלק מיכולות אלה משולבות ב-Windows XP.