Роботы против пиратов. Российский софт встает на стражу лицензионного контента

Автор фото: Vostock-Photo
Ниша антипиратского программного обеспечения активно развивается в России, однако крупных представителей этого направления по–прежнему нет. По оценкам аналитиков ГК "ФИНАМ", выручка таких предприятий составляет примерно 1% от продаж самого контента. При этом на запуск подобного стартапа потребовалось бы $500 тыс. и штат 10 человек. Однако в преддверии скорого принятия нового антипиратского закона за автоматизацию процесса активно взялись сами правообладатели.

Внутренние распри

На днях Медиа–Коммуникационный союз (МКС) представил автоматизированное ПО для анализа переданных правообладателями веб–страниц на наличие пиратского контента. Участники антипиратского меморандума (подписан в 2018 году) уже получили софт для бета–тестирования, его проверку планируют завершить в течение месяца.
Сам по себе софт не занимается мониторингом сети для поиска пиратского контента. Он предназначен для подачи и обработки заявлений правообладателей. С его помощью участник меморандума может загрузить массив URL–страниц, на которых предположительно содержится пиратский контент.
"Система комплексно анализирует содержимое интернет–страницы, используя обученные нейросети, и принимает решение о наличии или отсутствии нарушения. По итогам проверки ссылка либо включается в антипиратский реестр, либо отклоняется", — рассказывает директор по связям с общественностью МКС Елена Соловьева. Подписавшие меморандум интернет–компании ("Яндекс", Mail.Ru Group и другие) должны удалять попавшие в реестр ссылки из поисковой выдачи. По оценкам экспертов, на поисковики приходится почти 80% трафика пиратских сайтов.
По словам представителя МКС, если система не может принять однозначного решения, то ссылка вручную проверяется модератором, а результат используется для дообучения системы. Участие человека планируется свести к минимуму.
В дополнение к проекту МКС "Яндекс" активно работает над собственным сервисом, который "позволяет находить страницы сайтов, похожие по наличию аудиовизуального контента на те, что уже занесены правообладателями в реестр". Однако Елена Соловьева заявила, что расширение функционала софта МКС и его интеграция со сторонними сервисами для автоматического поиска нелегального контента в сети не планируется.
На практике это приведет к дублированию функций софта и появлению лишнего бюрократического звена. Робот "Яндекса" ищет пиратские сайты в рунете, но включить их в реестр может только сервис МКС после перепроверки по заявлению правообладателя.
Генеральный директор ассоциации "Интернет–видео" Алексей Бырдин считает, что технологического объединения ПО, вероятно, не будет. Однако "Яндекс" может поделиться своими разработками с "Кинопоиском" (принадлежит "Яндексу"). В результате дочерняя компания, являясь участником меморандума, сможет выступать в качестве заявителя включения самостоятельно найденных ссылок в реестр.
"При идеальном раскладе "Яндекс" разработает некий поисковый алгоритм, который позволит исключить пиратский контент из выдачи без требований правообладателей. Ему это не запрещено. Но до недавнего времени компания не занималась устранением ссылок на нелицензионный контент, поскольку имела от этого прямые или косвенные выгоды — например, рекламу на пиратских плеерах", — рассуждает Алексей Бырдин.

Найдется все

Технически поиск однотипной начинки в интернете не составляет для ПО особого труда: программы ищут пиратский контент по цифровым отпечаткам файла, раскадровке видео и наличию похожих элементов, а также по ключевым словам в поисковиках.
Но у каждого из подходов свои минусы: технология цифровых отпечатков пока используется редко (в основном на YouTube), а при сопоставлении видео с оригиналом приходится учитывать искажения файла (например, при анализе "экранки"). В то же время ключевые слова могут привести на страницы, где на самом деле размещены трейлеры (а иногда и вовсе другие фильмы).
Опыт компании Axghouse AntiPiracy показывает, что наиболее эффективен синергетический подход. После поиска по ключевым словам сервис дополнительно анализирует потенциально пиратские ссылки на наличие нелицензионного контента.
"Софт покрывает до 90–95% всего доступного контента, который пользователь может найти в поисковиках. Остальные 5–10% — это пираты, которые банят либо ботов, либо IP–адреса антипиратского софта. Поэтому минимальная доля ручной проверки всегда должна быть", — рассказывает основатель сервиса Александр Гончаренко.
Некоторые эксперты скептически относятся к идее исключения пиратского контента из поисковой выдачи. По их мнению, на месте одной удаленной веб–страницы появляются две другие, а на внесение страницы в антипиратский реестр и удаление ссылки требуется время. Вместо этого более эффективным считается снижение рентабельности бизнеса пиратов — например, за счет прямого запрета на размещение рекламы на таких ресурсах.
Искусственный интеллект мог бы облегчить задачу обнаружения нелегального контента в сети, например автоматизировав поиск файлов с цифровым отпечатком. Но в каждый фильм такую метку не поставишь, это будет необоснованно дорого. К тому же лицензирование контента и ограничение свободного распространения информации, на мой взгляд, вредно. Например, продажа научной литературы напрямую тормозит технический прогресс. А киностудии пока еще не придумали новую бизнес–модель, поэтому боятся не отбить свои расходы на производство, хотя на хороший фильм люди пойдут в любом случае.
Роман Душкин
директор по науке и технологиям Агентства искусственного интеллекта
Фильм «Джон Уик 3» сегодня ни в поисковиках, ни на торрентах найти не получается, хотя он уже давно идет в кинотеатрах. Значит, антипиратская система все же работает. Вероятно, есть какая–то договоренность, что первые 2–3 недели после релиза фильм активно вычищают, чтобы получить выручку с кинотеатров, а потом следят менее активно. Новинок выходит не так много, их проще удалять вручную. Дальше третьей страницы в поисковике все равно почти никто не заходит. Мониторить всю сеть по всем существующим фильмам можно только автоматически, но вряд ли это необходимо. Такая система мониторинга может обойтись гораздо дороже, чем потенциальная прибыль от продаж
Станислав Ашманов
генеральный директор компании «Нейросети Ашманова»