Покажи личико. Петербургские ученые развивают технологию компьютерного зрения

Автор фото: Михаил Тихонов
Петербургская компания СVS ("Системы компьютерного зрения") занялась разработкой сервиса локализации, основанного на нейронной сети. Приложению, которое совмещает в себе геолокационные карты и дополненную реальность, еще предстоит несколько лет доработки. Но авторы уверены в его востребованности.

Миллионы за алгоритмы

"Сегодня на рынке существует множество картографических справочников — они ищут по геолокации пользователя и отражают, какие здания и компании находятся вокруг. Но они даже близко не дают необходимой точности локализации. Разработанный нами "дополненный город" позволяет интегрировать всю информацию об окружающих пользователя компаниях с помощью камеры смартфона. При включении камеры и наведении на окружающие дома на экране будет высвечиваться не только информация о заведениях, но и комментарии от клиентов, уже их посетивших", — поясняет совладелец CVS Владимир Уфнаровский. По его мнению, "это гораздо более сложный механизм, чем обычный справочник, он интереснее и удобнее для пользователя".
В мире уже предпринимаются попытки создания программ локализации с помощью нейронных сетей. Однако прорыва пока не случилось. Нейронные сети плохо распознают объекты в меняющейся обстановке — когда, например, на фоне здания идет группа людей.
Компания работает над программой уже 1,5 года. Приложение почти разработано, но ему предстоит еще несколько лет доработок и устранения "багов". Заказчиком сервиса стала туристическая компания, которая вложила в разработку около $1,5 млн. "Чтобы довести приложение до рынка, еще предстоят вложения $3–5 млн", — прогнозирует Уфнаровский.
Компания занимается созданием сервисов и в других областях, не только в сфере туризма. Востребованность компьютерного зрения (КЗ) бизнесом становится все очевиднее: CVS — небольшая компания, но, например, в 2017 году заработала на этом рынке 41 млн рублей. Алгоритмы распознавания объектов уже сегодня позволяют говорить об экономии средств заказчиков (благодаря уменьшению погрешности подсчетов, например, объемов древесины, обнаружению дефектов изделий на производственных линиях или на стадии промышленных образцов).

Математический анализ

Искусственные нейронные сети построены по принципу нейронной системы человеческого мозга, способной получать входящую информацию и обрабатывать ее самостоятельно. Наиболее подробно нейронную систему человеческого мозга изучил первый нобелевский лауреат Иван Павлов. Следующая ступень — криптоанализ, теория информации, искусственный интеллект — уже была введена в научный оборот Аланом Тьюрингом, Клодом Шенноном и Френком Розенблаттом в прошлом веке. Сегодняшние задачи связаны с улучшением работы алгоритмов обработки информации — снижение времени, повышение точности обработки (в том числе фильтрация и очистка от шума исходных данных), снижение размерности данных, создание нейроморфных систем.
Поэтому главная задача всех компаний, работающих в сфере КЗ, — разработать свой математический алгоритм поведения искусственных нейронных сетей и вложить в программу возможность самостоятельного обучения для выявления зависимостей между входными и выходными данными.

Будущее уже на улицах

Аналитики компании Tractica прогнозируют, что к 2025 году КЗ прочно войдет в такие сферы, как видеонаблюдение, локализация, анализ медицинских изображений и документов, развитие дополненной и виртуальной реальности. Объем мирового рынка в ближайшие годы совершит скачок — с $1,1 млрд в 2016 году до $26 млрд к 2025 году.
Один из крупнейших игроков на рынке компьютерного зрения также родом из Петербурга — компания "Центр речевых технологий", годовой объем дохода которой в 2017 году перевалил за 1,4 млрд рублей, в основном специализируется на разработке сервисов по обеспечению безопасности.
Компания создала систему распознавания лиц "Визирь", которая преобразует лица в биометрические модели и сопоставляет полученное изображение с базами данных. Власти Петербурга осенью 2018 года в рамках проекта "Умный город" внедрили эту технологию в городскую систему видеонаблюдения (ГСВН). На улицах Петербурга установлено более 80 "интеллектуальных" камер с функционалом видеоаналитики.
В режиме реального времени система идентифицирует лица, программируя их в биометрические модели. По таким прототипам невозможно восстановить оригинальные изображения (что соответствует принципам закона о персональных данных), но легко сопоставить с базами данных. Помимо того, камеры распознают регистрационные номера авто.
Другой пример внедрения в широкие массы компьютерного зрения — из банковского сектора. Технология позволит клиентам пользоваться счетом без банковской карты, а компаниям — выстроить систему дополнительной защиты пользователей.
Мы создали комплекс нейромаркетинга, с помощью которого узнаем о потребностях клиента до принятия им осознанного решения. В упрощенном виде подобные системы представляют собой айтрекер, позволяющий регистрировать направление и продолжительность взора человека. Стоимость таких продуктов варьируется от 1 млн до 40 млн рублей. Свой авторский учебный курс «Айтрекинг в нейрокогнитивных и психологических исследованиях» внедрили на факультете психологии СПбГУ. Студенты изучают физиологию органа зрения, характеристики движения взгляда, узнают способы применения айтрекинга и то, какие результаты можно получить благодаря этой технологии.
Константин Шелепин
руководитель ООО «Нейроиконика Ассистив»
Мы разработали аналитическую систему, которая работает на базе распознавания лиц искусственными нейтронными сетями. Определяются такие параметры, как возраст, пол, эмоции. Стимулом послужил запрос клиента на отслеживание людских потоков внутри торгового центра. Система может быть использована для контроля доступа на территорию, оценки качества работы персонала, изучения клиентов и многого другого.
Альбина Ямалетдинова
управляющий партнер «Rusland SP Северо–Запад»
Традиционно в России системы распознавания лиц применяются для решения задач безопасности. За последний год наметилась тенденция применения подобных систем для оптимизации бизнес–процессов, в частности, интерес со стороны аэропортов, транспортных компаний. В интеллектуальном видеонаблюдении используются уже имеющиеся камеры, а установка системы, обрабатывающей один видеопоток, составляет десятки тысяч рублей, не сотни. В среднем отечественные системы дешевле иностранных аналогов в 2,5 раза.
Андрей Хрулев
директор по бизнес–развитию направления биометрических систем группы компаний «ЦРТ»