בכנס טכנולוגיה בשם Re/Code, מנכ"ל מיקרוסופט סאטיה נדלה הציג גרסת קדם בטא לשירות תרגום הפועל בזמן אמת תוך כדי שיחת סקייפ. בהדגמה משוחח אמריקני ממוצא הודי, עם עמיתתו הגרמניה דרך התוכנה, כשהוא מדבר באנגלית והיא עונה בגרמנית, והתרגום מופיע בטקסט ומושמע בקול.
תרגום מקול אדם, הבנת הנשמע וההקשר, ודיבוב מחדש בשפה זרה בקול מכונה, היווה תמיד אתגר משמעותי ליצרניות התוכנה. אולי האתגר הכי גדול הוא הבנת ההקשר. לכל שפה יש גם את הסלנג שלה, הביטויים העל זמניים ואלו שמחזיקים רק כמה חודשים, ובנוסף לכך המבטאים השונים וההגיה הלא תקינה של מילים מוכרות וכאלה שהושאלו משפות זרות.
בהדגמה אפשר להבחין בקלות שבעוד שהוא מדבר בצורה טבעית וברורה, ומקריא מה שנראה כמו תסריט מוכן מראש, היא מבטאת את המילים בדיקציה השמורה לקלינאית תקשורת, מה שמעלה חשד לגבי כמה התוכנה באמת גמישה בשלב זה.
כך זה עובד: המשתמש מדבר כרגיל אל המיקרופון, אחרי כמה שניות מופיע על המסך כיתוב בגדול עם התרגום בשפה הזרה, כשהקלט בשפה המקורית מופיע בקטן מתחת, כך שניתן לראות כמה מדויק הוא.
בזמן ההדגמה, ניתן היה לראות שגיאות קלות בתרגום הנובעות מההקשר, כאשר באנגלית אמר הדובר Right, ובהקשר התכוון ל-"ובכן", התרגום בגרמנית היה Recht, כלומר ימינה. מעבר לכך, כמעט ולא היו טעויות, אך האתגר האמיתי נשאר, הבנת הנשמע מאלו שדוברים שפה שהיא לא שפת האם שלהם, ושאינם מבטאים אותה עם דיקציה מושלמת.
בשנת 2010 גוגל חשפה תכונה בשירות התרגום שלה - Google Translate שאפשרה בתאוריה לשני אנשים הדוברים שפות שונות, לשוחח דרך הטלפון, אך זה דרש משניהם להיות נוכחים פיזית סביב אותו מכשיר בעל חיבור אינטרנט פעיל, כשהוא הועבר ממשתמש למשתמש. כמו כן, סמסונג הציגה אפליקציה משלה שהגיעה עם הגלקסי S4 שהציעה בדיוק את אותו שירות.