Microsoft научилась очень точно распознавать речь
Команда исследователей компании Microsoft из подразделения Speech & Dialog сообщила о разработке системы, позволяющей очень точно распознавать речь.
В метрике Word Error Rate ученые софтверного гиганта получили впечатляющий результат в 6.3%. Простыми словами, этот показатель определяет процентовку неправильно распознанных слов.
Самый лучший показатель в этом плане демонстрировала компания Google в прошлом году. Тогда ей удалось получить 8% в Word Error Rate, а в 2013 году поисковый гигант распознавал лишь 23% слов.
Разработки в этой сфере помогут вывести на новый уровень голосовые помощники и разнообразные системы, занимающиеся переводом речи.
Для достижения такого впечатляющего результата специалисты Microsoft разработали новые алгоритмы обучения, высокооптимизированные сверхточные и рецидивирующие нейросетевые модели, а также такие инструменты, как вычислительная сеть Toolkit.