שתף קטע נבחר

חדר הפגישות של מיקרוסופט

זה נראה כמו חלום, אבל זה כמעט מוכן לשיווק - חדר פגישות וידאו שאינו עולה עשרות אלפי דולרים.

חדר הפגישות מפותח במיקרוסופט ומדרך הטבע הוא מבוסס על הרבה תוכנה ומעט חומרה זולה. הנריק מלבר, החוקר הראשי בתוכנית הפיתוח, בנה את יחידת החומרה המרכזית RingCam מרכיבים סטנדרטיים, שמחירם כ-500 דולר בלבד. המתקן דמוי הפטריה כולל 5 מצלמות Web ו-8 מיקרופונים מסודרים במעגל. מתקינים אותו במרכז שולחן הדיונים, כך שלמצלמות כיסוי פנורמי של כל החדר. המספר הגדול של הרמקולים נדרש על מנת לזהות את הכיוון ממנו מגיעים הקולות. התוכנה עוקבת אחרי הקלט של כל מיקרופון, משווה את העוצמה והמופע של גלי הקול וממקדת את שידור הוידאו במצלמה שמכסה את הדובר. בנוסף להקלטת קול ותמונת וידאו, המערכת מזהה את "הלוח הלבן" ועוקבת אחרי מה שקורה עליו. גם הלוח הלבן ממומש בתוכנה בלבד (יש כמובן לוח פשוט עליו כותבים, אבל הוא פסיבי לחלוטין. המידע נקלט במצלמות ה-Web ומשודר כתמונה).

עם חומרה בסיסית כל כך, ברור שהאתגר האמיתי הוא בליטוש התוכנה. כבר רמזנו על מרכיב קריטי אחד, הזיהוי של מקור הקול והמיקוד האוטומטי על הדובר. מרכיב קריטי אחר הוא הגדרת הלוח הלבן. אחרי שסימנתם בתמונת הפנורמה של החדר את מיקום הלוח, התוכנה עוקבת אחריו באופן אוטומטי. הצילום עובר המרה לפורמט גרפי, שמאפשר לראות בצורה ברורה מה מצוייר על הלוח ולקרוא טקסט שנכתב ביד חופשית. אבל החלק החשוב ביותר בתוכנה הוא ניהול רישום הפרוטוקול האלקטרוני. התוכנה יודעת למיין כל פיסת מידע על פי הדובר ולעקוב אחר רצף השיחה בצורה מובנית כמו באתר דיונים אינטרנטי. למשל, אפשר לקחת הקלטה של דיון רב משתתפים, לעקוב אחרי השתלשלות הדברים ולשלוף ממנו רק את התרומה של חלק מהנוכחים תוך דילוג על הקטעים בהם אחרים לקחו את זכות הדיבור. בצורה דומה, אפשר להריץ את המלל במהירות מוגברת, לראות רק את תמונות הלוח הלבן, להתמקד בהבעת הפנים של משתתף מסוים כאשר אחרים מדברים, וכדומה.

 

רושם הפרוטוקולים האינטליגנטי

 

צוות הפיתוח עובד עכשיו על הוספת זיהוי דיבור לתוכנה, כך שתוכלו לחפש לא רק לפי הדוברים אלא גם על פי התכנים המילוליים. את הפורמט הגרפי של הלוח הלבן מנסים להתאים כקלט לתוכנה גרפית סטנדרטית, למשל Visio לתרשימים עסקיים. בעתיד היותר רחוק המערכת אמורה לכלול זיהוי כתב-יד וממשק לתוכנות עיבוד תמלילים, דוגמת Word. בשלב הנוכחי RingCam מצלמת וידאו בקצב של 15 תמונות לשניה בלבד, אך הבעיה אינה בחומרת חדר הדיונים אלא במגבלות רוחב הפס של התקשורת. אם מוותרים על העברת השידור בקו טלפוני לאתר מרוחק, אפשר לשדרג את המערכת ולשפר את האבחנה וקצב התמונות. מאחר והתוכנה רצה על שרת PC סטנדרטי (2 גיגהרץ, 2 מעבדים, 512 מגהבייט), המפתחים לא מודאגים מהמחיר של תשתית מושבחת. זה לא יהיה מעצור ליישם המוני. ארכיטקטורת המערכת מאפשרת ללקוחות, אלא שרוצים לראות את הדיון מרחוק בזמן אמת, או מהקלטה לאחר שהוא נגמר, להסתפק ב-PC מינימליסטי ובדפדפן.

מיקרוסופט לא מתכוננת ליצר את החומרה ל-RingCam, אלא לאפשר לאחרים להתחרות בצורה חופשית בצד הזה, כשהיא מספקת רק ממשק יישומים (API) סטנדרטי. הנריק מלבר וחבריו רואים את משימתם בבניית פלטפורמה לניהול דיונים ורישום פרוטוקול אוטומטי, עליה מפתחי צד ג' יוגלו להוסיף יישומים ספציפיים למגזרי שוק שונים. בתור פלטפורמה, התוכנה שלהם חייבת לספק עושר כלים ויציבות ממשק היישומים, שאי אפשר להבטיח בלי השקעה של זמן. לכן הם מצפים שהמערכת תהפוך למסחרית רק בעוד 3 עד 4 שנים, למרות שרוב הרכיבים כבר מוכנים ועיקר המאמץ מושקע באינטגרציה. בלוח הזמנים הזה אפשר לצפות שהתרומה של צוותי פיתוח אחרים במיקרוסופט, שעובדים על זיהוי דיבור, זיהוי כתב יד וכדומה, כבר תהיה זמינה להטמעה בחדר הפגישות האלקטרוני.

 

  תגובה חדשה
הצג:
אזהרה:
פעולה זו תמחק את התגובה שהתחלת להקליד
RingCam, זה כל מה שצריך
RingCam, זה כל מה שצריך
מתוך: PC Magazine
מתוך: PC Magazine
צילום: פי סי מגזין
מומלצים