Крупнейшая в мире ИТ-компания Microsoft завершает работу над технологией, которая позволяет распознавать речь, переводить ее на другой язык и воспроизводить ее на новом языке с сохранением особенностей голоса того, кто говорит, написал в корпоративном блоге директор Microsoft по разработке Рик Рашид.
Рашид впервые продемонстрировал работу технологии, выступая на презентации в Китае. Сначала его речь распознавалась в реальном времени и выводилась на экран в виде обновляемого текста на английском языке, пишетТСН.
Финальным этапом стал голосовой перевод его речи - Рашид произносил предложения на английском языке, а программа воспроизводила их на китайском с сохранением особенностей голоса топ-менеджера Microsoft.
"Наиболее значительным является то, что мы добились важной цели - смогли позволить англоязычной человеку, похожему на меня, провести презентацию на китайском, сохраняя свой голос", - отметил Рашид. Стоит отметить, что несмотря на достигнутые успехи, технология делает ошибки в одном слове из 7-8. Когда новинка распознавания и перевода языка с сохранением голосов поступит в коммерческое использование, топ-менеджер Microsoft не уточнил.