Я и моя цифровая тень: как заработать на виртуальных двойниках

Автор фото: скриншот рекламы Сбера

Виртуальные люди уже "живут" в интернете, постят фото в Instagram, общаются в чатах. Даже этот текст могла написать цифровая копия автора, и вы бы этого не заметили.

Индустрия цифровых двойников развивается сразу по нескольким направлениям. Пока наиболее перспективные: реклама и медицина. Мировые бренды от Puma до "Сбера" активно экспериментируют с цифровыми аватарами, покупают стартапы. На медицинских же двойников выделяют государственные деньги.

Мёртвого достанут

Несколько лет назад были популярны технологии компьютерной реинкарнации. Самый известный кейс — проект Replika, созданный в США российскими разработчиками. Его основатель Евгения Куйда на основе переписки с погибшим другом создала чат–бот, который мог общаться от его имени в похожем стиле. Из этого родилась идея: пользователю предлагают создать свою цифровую копию, которая обучалась бы в процессе общения и постепенно смогла бы заменять в переписке "оригинал". Компания привлекла в этот проект $6,5 млн. Позднее, однако, совершила пивот и перестала позиционировать себя в роли воскресителя.
Сохранением информации о жизни, передачей цифровой копии человека в будущее и даже распределением цифрового наследия сейчас занимается украинский стартап Bank of Memories. Инвестиции в него поскромнее — около $70 тыс. Такого рода стартапы регулярно появляются и пропадают. По–видимому, это связано с тем, что спроса на данные технологии пока нет, да и у многих возникают вопросы к этичности и безопасности хранения подобных данных. Microsoft, например, запатентовал технологию создания цифровой копии человека ещё в 2017 году, однако реализации идеи нет даже в планах компании.
Есть вариант и живого "цифрового двойника" — это алгоритм, который учится принимать решения так, как это делает его владелец, чтобы взять часть работы. "Эта логика заложена в разработке нашего центра — платформе цифровых аватаров. Например, ассистент студента в ходе использования владельцем будет уточнять его предпочтения в различных контекстах и настраивать механизмы работы различных сервисов непосредственно под конкретного пользователя (в отличие от контентных и коллаборативных рекомендательных алгоритмов)", — сообщила Клавдия Боченина, старший научный сотрудник Национального центра когнитивных разработок Университета ИТМО.
Похожее решение предлагает стартап от российских разработчиков Digital Doubles. Он создаёт цифрового двойника, который общается от имени владельца в соцсетях. Инструмент востребован среди менеджеров по продажам. "Спрос на такие решения ожидаемо будет расти, потому что цифровые двойники — удобный способ делегировать полномочия искусственному интеллекту. Будут возникать интересные решения на стыке взаимодействия людей и цифровых двойников, особенно когда ассистенты смогут общаться и учиться друг у друга", — отмечает Клавдия Боченина.
Впрочем, на данном этапе ИИ не настолько совершенен, чтобы подражать живому человеку. "Чат–боты пытаются поддерживать разговор, кажется, что он осмысленный, но на деле это просто сообщения из памяти. Такой чат–бот не ориентирован на достижение какой–то конечной цели (как, например, боты для продаж или техподдержки). Цель необходима, а простое воспроизведение определённых признаков поведения человека большого коммерческого потенциала не имеет", — уверен начальник суперкомпьютерного центра СПбПУ Алексей Лукашин.

Двойниковая реклама

Зато оценён потенциал применения ИИ для рекламы. Портал Virtualhumans, отслеживающий искусственных людей в социальных сетях, насчитывает уже 144 аватара. Большинство из них — рекламные проекты брендов. Неудивительно, что их пока не больше двух сотен, ведь создание одной качественной нейросети обойдётся в десятки тысяч долларов, сообщил основатель компании Somin.ai Алекс Фарсеев. Если нейросеть уже есть и нужно создать просто другого персонажа, то это, конечно, дешевле.
Помимо генерации аватара есть два важных этапа, которые необходимы для того, чтобы искусственный человек функционировал. Первое — нужен визуальный контент. "Для высокого качества необходим реальный человек, который будет ходить по улице, делать селфи и так далее. Потом на него уже будут накладываться изображения. Креативные агентства используют результаты дипфейка и накладывают их на реальную картинку", — рассказал Алекс Фарсеев.
Поэтому платить приходится и агентству — контент такого уровня стоит дорого. Если речь о видео, то прайс может доходить до нескольких тысяч долларов. "Помимо качественного продакшена можно использовать технологии, которые работают в этом направлении автоматизированно. Например, “Сбер” инвестировал в компанию Malivar. Они пытаются генерировать видео автоматически. Но у современных алгоритмов возникают проблемы, качество у них ниже, чем у креативного агентства", — отмечает он.
Вторая составляющая "рекламных" аватаров — это контент. Пока что его никто не автоматизировал, однако компании уже начали первые попытки. Somin.ai совсем недавно получил доступ к GPT–3 от OpenAI. Это нейронная сеть от Илона Маска, которая может генерировать контент, имитируя индивидуальный стиль письма любой личности. Она делает это практически неотличимо от человека. "С помощью таких технологий можно скопировать любого человека, анимировать его, натренировать модель говорить, как он", — говорит Алекс Фарсеев.

Неживая речь

Так, "Сбер" уже предпринял первую попытку, создав рекламу с "возрождённым" Жоржем Милославским. Конечно, содержание речи было написано "вручную", но визуальный и аудиальный компонент воссоздали с помощью ИИ. В проекте принимала участие петербургская группа компаний ЦРТ.
Для создания речевого аватара конкретной персоны помимо визуального ряда используют синтез речи. "Для этого, как правило, требуется не менее 20 часов речи диктора, записанной в студии по определённому текстовому шаблону. Затем строится фонемная транскрипция, данные очищаются от постороннего шума, полученной модели придаются эмоции, придыхание", — рассказал "ДП" гендиректор группы компаний ЦРТ Дмитрий Дырмовский.
Другая компания — Replica из Австралии — использует ИИ для создания голосов актёров. Они могут использоваться для переозвучки записей разговоров или чтения текста. По идее создателей, медийные персоны (особенно музыканты) смогут лицензировать свои голоса и использовать как дополнительный источник дохода, например разрешая использование их речи в рекламе.
Такие речевые технологии, и синтез речи в частности, будут демонстрировать серьёзный рост и на российском, и на глобальном рынках, считают эксперты. Однако это несёт и определённые риски безопасности. Чтобы отличать синтезированный голос от живой человеческой речи, в ЦРТ разрабатывают специальные системы детектирования попыток взлома, они учитывают массу характеристик звука, указывающих на то, что голос не является живым. Похожий проект есть и за рубежом: система Void, которую создали исследователи из Австралии, компании Samsung и южнокорейского университета Сонгюнгван.

В здоровом теле здоровая цифра

Для медицинских целей планируют оцифровывать не только разум, но тело, включая внутренние органы. Так, учёные из нижегородского Университета Лобачевского работают над созданием цифрового двойника. В 2018 году им даже выделили на это мегагрант — 90 млн рублей.
По задумке учёных, персональные сенсоры должны отправлять данные о состоянии пациента в его личный аккаунт. Эти данные будут обрабатываться специальной программой, с её помощью можно будет прогнозировать риски развития заболеваний.
Центр CompBioMed, финансируемый Евросоюзом, решил оцифровывать человеческие органы для предсказания итогов операции. Собираются данные: рентгеновские снимки, МРТ, КТ и другая медицинская информация о человеке. С её помощью создаётся цифровой аватар, позволяющий предугадать, какие проблемы у этого конкретного пациента могут возникнуть во время операции. Таким образом, хирурги смогут подготовиться ко всем возможным нюансам операции. Но это только исследования, реальные прототипы таких программ могут появиться через многие годы.