Артем Члегов artem.chlegov@dp.ru Все статьи автора
26 марта 2014, 11:10 377

"Деловой Петербург". Вперед, в страну глухих

Фото: Ишкиняева Надежда

Российский рынок систем распознавания речи прирастает новым сегментом — сервисами автоматизированных телевизионных субтитров. Потенциальные лидеры в нем — петербургские компании.

В России активно развивается рынок систем распознавания речи. С подачи Министерства связи и массовых коммуникаций РФ может сформироваться новый сегмент этого рынка — разработка систем создания автоматизированных титров для телевизионных каналов. Его потенциальная емкость, по подсчетам участников, — 500 млн рублей. О разработке первого отечественного решения в этом направлении заявляет петербургская компания "Центр речевых технологий" (ЦРТ).

Как понять спорткомментатора

ЦРТ — один из крупнейших участников рынка речевых технологий и биометрии России. Его учредитель и основатель — Михаил Хитров. В 2012 году выручка компании составила 929 млн рублей.

На прошлой неделе ЦРТ объявил о первом внедрении своей системы по созданию субтитров в режиме реального времени. Как объясняют в компании, ее решение, в отличие от подобных технологий, которые внедряются на зарубежных телеканалах и облачных видеосервисах вроде YouTube, позволяет оснащать субтитрами даже спортивные трансляции. Из–за большого количества внешних шумов и спонтанности речи комментатора оснащать автоматизированными титрами спортивные игры до сих пор было малореально.

Эту проблему в ЦРТ решили с помощью респикера — специально обученного человека, который оперативно пересказывает звучащую в эфире речь. Из–за этого точность распознавания повышается до 94%, а оставшиеся огрехи подчищает специалист–редактор.

Система была разработана по заказу Минкомсвязи РФ, которое планирует внедрить ее на всех общероссийских обязательных телеканалах. Тендер министерства на 310 млн рублей ЦРТ выиграл в конце 2012 года, а уже в марте 2013–го рабочая система была опробована на портале RussianSport.ru во время трансляции открытия сочинской Параолимпиады.

Поле деятельности расширяется

"Коммерческое решение на основе технологии мы представим уже в этом году, — сообщил директор научно–исследовательского департамента ЦРТ Кирилл Левин. — Оно будет ориентировано в том числе на кабельные и интернет–каналы". По словам Кирилла Левина, ориентировочная стоимость будущего решения — несколько миллионов рублей.

Кроме поставки программного продукта компания планирует зарабатывать на обучении специалистов сопровождения, а также на технической поддержке.

В компании надеются, что популярности продукта будет способствовать постепенное развитие законодательства о безбарьерной среде для инвалидов по слуху. Согласно госпрограмме "Доступная среда", уже в этом году количество программ с субтитрами на общероссийских каналах достигнет 14 тыс. часов, что почти в 5 раз больше, чем в 2011 году.

В ЦРТ не исключают, что со временем законодательство будет обязывать к внедрению подобной системы самый широкий круг телеканалов. В Минкомсвязи возможные планы в этом направлении пока не комментируют.

Как считают представители канала "Санкт–Петербург", если такое решение все же примут, это вряд ли будет серьезным финансовым ударом для телекомпаний. Однако, по их мнению, более разумным вариантом было бы субсидирование внедрения новой технологии.

Несопоставимость масштабов

Вероятно, в первое время компании придется осваивать новый сегмент рынка в одиночку. Основной конкурент ЦРТ на российском рынке — американская Nuance, известная разработкой персонального помощника Siri для iOS и поставкой системы управления звонками для "Аэрофлота", пока не торопится составить конкуренцию петербуржцам. "Для нас приоритетное направление — полностью автоматизированные решения без постоянного участия людей. Но существующие технологии до этого пока не дошли", — говорит региональный директор Nuance в России и СНГ Виталий Юрченко.

Тем не менее, по словам Виталия Юрченко, компания в силах предложить сходное решение в том случае, если спрос на технологию и потенциальный объем рынка их удовлетворят.

Также речевые технологии привлекают внимание стартапов, однако пока они недостаточно зрелые, чтобы делать предложения корпоративным клиентам. Например, резидент "Сколково" ООО "РеалСпикер Лаб" готово представить рабочую систему по распознаванию голоса этой осенью. Однако первое время она будет рассчитана на потребительский рынок, создатели готовы подумать и о телевещателях, только если система станет успешной.

Также технологии распознавания речи в последнее время активно осваивают корпорации Google, Microsoft и Apple. Но для них потенциальные масштабы российского рынка, создаваемого ЦРТ, слишком малы. Компании используют технологии для популяризации своих собственных операционных систем и работающих на них устройств.

Мировой рынок речевых технологий, по данным Technavio, в 2013 году оценивался в $1,37 млрд. При этом технологии распознавания речи составляют подавляющую часть этого рынка — более $1 млрд. Оставшуюся часть занимают технологии голосовой биометрии, то есть идентификации пользователя. Ежегодный рост этого рынка — примерно 22%.

Технология, предложенная ЦРТ, хотя и не обеспечивает полностью автоматизированного распознавания речи, но имеет хорошие перспективы. Ведь сейчас так трудно найти хороших сурдопереводчиков. У нас тоже есть технологическое решение, но у него еще имеются некоторые проблемы с точностью распознавания речи. Поэтому мы пока не готовы работать с крупными корпоративными клиентами. Сейчас мы будем активно тестировать систему на частных заказчиках. Не исключаем, что в дальнейшем будем работать и с телеканалами.
Виктор Осетров
Виктор Осетров
генеральный директор ООО "Реал Спикер Лаб"
Если внедрение автоматизированных субтитров пойдет централизованно и на это будут выделять деньги, то ничего плохого в этом я не вижу. Если же будут заставлять внедрять на свои средства, телеканалы это все равно смогут потянуть. Другое дело, что я бы не стал добавлять субтитры в каждую передачу. Части аудитории это мешает. Очевидно, передачи с субтитрами привлекают глухих, однако на рейтингах это никак не отражается. Дело в том, что в домохозяйствах, которые участвуют в измерениях, глухих нет.
Сергей Боярский
Сергей Боярский
генеральный директор телеканала "Санкт–Петербург"
Выделите фрагмент с текстом ошибки и нажмите Ctrl+Enter
Новости партнеров
Реклама