Компания Microsoft объявила, что ее система распознавания речи по уровню точности сравнялась с распознаванием речи живым человеком. Добиться этого выдающегося результата ученым удалось с помощью метода, разработанного резидентом «Сколково» компанией «ЦРТ-инновации» (Группа ЦРТ).
«Мы использовали моделирование человеческого языка многослойными рекуррентными нейронными сетями с блоками долговременной и кратковременной памяти (long short term memory). Они позволяют учитывать дальний смысловой контекст в предложениях. Это заметно снижает количество ошибок распознавания», — комментирует Кирилл Левин, руководитель научно-исследовательского департамента ЦРТ.
На сегодняшний день набор алгоритмов, разработанный учеными группы ЦРТ, занимает третье место в мире по качеству распознавания речи американцев в лабораторных условиях. Российские технологии уступают только последним разработкам IBM и Microsoft.
Несколько дней назад группа исследователей Microsoft в области искусственного интеллекта опубликовала научную статью по автоматическому распознаванию телефонных разговоров американцев. Согласно отчету, ошибка распознавания составила 5,9% — это означает, что более 94% слов система распознает верно. Такой же результат в аналогичных условиях показали профессиональные стенографисты. Исследователи из Microsoft подчеркивают, что наибольший вклад в улучшение результата внесло использование метода, предложенного Группой ЦРТ на международной конференции Interspeech сентябре 2016 года в Сан-Франциско.
«Мы достигли уровня человека. Это историческое достижение», — заявил главный инженер исследовательской группы Microsoft по работе с искусственным интеллектом Сюэдун Хуан (Xuedong Huang). С ученым согласен и Сергей Ходаков, руководитель направления «Безопасные информационные технологии» IT-кластера Фонда «Сколково». «Достижение уровня точности распознавания речи, сопоставимого с точностью человека, — важный шаг к созданию новых технологий и продуктов, направленных на решение задач автоматизации предоставления сервисов и обеспечения безопасности, — говорит он. — Считаю, что признание технологий, разработанных «ЦРТ-инновации», со стороны ведущих компаний является отличной рекомендаций, подтверждающей инновационность и высокий коммерческий потенциал российских разработок. Это достижение поможет нашему резиденту укрепить свои позиции в России и успешно продолжить коммерциализацию на международном рынке».
Ранее корпорация уже публиковала результаты экспериментов по распознаванию на стандартном наборе тестов «НИСТ-2000». Тогда специалистам удалось снизить ошибку до 6,3%. Ученые добились этого к середине октября. Последний рывок в повышении качества распознавания удалось сделать благодаря модернизации архитектуры искусственного интеллекта, основанного на нейронных сетях.