Автор фото: Sergey Usovik/Shutterstock/FOTODOM

Врачи требуют ограничить использование искусственного интеллекта для консультирования по вопросам, связанным со здоровьем человека

Нейросети и чат–боты всё увереннее дают медицинские консультации, причём делают это быстрее, чем терапевт в поликлинике. Однако, по данным недавнего исследования, опубликованного в журнале BMJ Open, чат–боты на базе искусственного интеллекта в 50% случаев дают неточные ответы на вопросы о здоровье и медицине. В работе оценивали пять самых популярных сервисов: Gemini, DeepSeek, Meta AI (принадлежит корпорации Meta, которая признана в России экстремистской и запрещена), ChatGPT и Grok.

Цена цифровой уверенности

Эксперты сошлись во мнении, что самая опасная категория ошибок — генерация несуществующих медицинских фактов. Причём, как показывают исследования, большие языковые модели выдают ложную информацию с полной уверенностью в своей правоте.
"Популярные AI–чат–боты получают данные из различных общедоступных источников, а не из клинических протоколов, — объясняет основатель и генеральный директор клиник EMS Татьяна Романюк. — Среди таких источников могут оказаться форумы и обсуждения непрофессионалов, устаревшие рекомендации, ложные выводы, неверные заключения. Затем AI комбинирует эту информацию, не понимая медицину. И предоставляет пользователю вполне правдоподобный, но недостоверный ответ".
Татьяна Романюк также отмечает, что ИИ не умеет качественно оценивать клинический контекст: возраст пациента, его анамнез, сопутствующие заболевания, приём лекарств, результаты обследований и прочее.
"Немаловажно и то, что пользователь может сформулировать запрос некорректно. И если врач на очном приёме задаст уточняющие вопросы, алгоритм этого не сделает и предоставит ответ, основываясь на неполной картине", — добавляет эксперт.
В итоге пользователь либо начинает паниковать и тратить деньги на ненужные анализы, либо успокаивается и запускает болезнь.
Управляющий партнёр цифровой стоматологии Medall Дмитрий Чёрный рассказал "ДП", что не реже раза в месяц встречает последствия ошибок искусственного интеллекта.
"Самый частый сценарий, когда пациент приходит с запущенным пульпитом или периодонтитом и говорит: “А я спросил в чате, он сказал, что это просто повышенная чувствительность, надо полоскать ромашкой”. Три месяца он полоскал, а там уже и очаг воспаления на снимке. Был также случай, когда пациентка с острым отёком после удаления зуба не поехала в скорую, потому что бот сказал: “Это нормальная реакция, примите ибупрофен”. Приехала к нам через 2 дня с флегмоной. Чудом обошлось без госпитализации. Я не представляю, сколько таких историй в масштабах страны", — говорит он.

Посильные задачи

По мнению генерального директора компании Lab4U Алексея Образцова, наиболее проблемными областями для медицинского ИИ являются диагностика редких заболеваний и оценка рисков, включая рекомендации.
"Работа моделей, оптимизированных на частотности данных, часто приводит к систематическому игнорированию редких клинических случаев, которые попросту тонут в массе типичных примеров. Это проявляется в неспособности распознать атипичные лекарственные реакции, редко встречающиеся варианты течения болезни или малораспространённые заболевания. Если неспециализированный искусственный интеллект и демонстрирует относительную компетентность в диагностике распространённых болезней, то в работе с редкими он систематически ошибается. А например, задачи интерпретации анализов лежат где–то посередине по степени риска", — уточняет специалист.
Однако, по словам главного врача стационара АО "Медицина" (Клиника академика Ройтберга) Натальи Кондратовой, есть области, где искусственный интеллект безусловно хорош.
"Например, он хорошо зарекомендовал себя для интерпретации рентгеновских изображений во время ковида, — считает эксперт. — Его задача была очень простой: отличить норму от не нормы. И там, где не норма, — посчитать процент поражения. Это большой объём работы, который освобождал руки и голову врача для анализа действительно сложных случаев. Другой пример — искусственный интеллект хорошо делает суммаризацию. То есть из длинного текста создаёт хорошее короткое резюме. Это помогает врачам при составлении выписного эпикриза, особенно если пациент провёл в стационаре длительное время. Например, в нашей клинике ИИ в выписке выделяет “не норму” в анализах. И пациент может не просматривать много страниц с результатами лабораторных тестов, а прочитать только резюме, где перечислены отклонения от нормы, на которые надо обратить внимание".

Спасёт ли маркировка?

По мнению заместителя руководителя направления Т1 ИИ (ИТ–холдинг Т1) Сергея Карповича, повысить качество данных может ограничение обучения ИИ только проверенными учебниками и клиническими протоколами, а также исключение форумов и "Википедии". Однако решить проблему полностью эти меры неспособны.
"Этот подход эффективен для снижения количества грубых фактических ошибок и устаревшей информации, так как учебники и протоколы проходят строгую экспертизу, — объясняет эксперт. — Однако он не устраняет главную проблему: отсутствие контекста и невозможность комплексного анализа конкретного пациента. Даже обученный на идеальных данных ИИ, получив от пользователя неполный и неточный запрос, всё равно может дать ошибочный совет, потому что не видит всей клинической картины".
Сергей Карпович считает, что поскольку медицина — наука живая, где новые данные появляются постоянно, то строгое ограничение может привести к тому, что искусственный интеллект будет отставать от актуальных исследований, если они ещё не вошли в учебники. Поэтому такой метод должен быть частью стратегии, но не единственным решением. Необходимо также развивать способность моделей задавать уточняющие вопросы и чётко обозначать границы своей компетенции.
По мнению диетолога клиники "Атрибьют" Александры Карасёвой, разработчики в законодательном порядке должны маркировать медицинские ответы ИИ как "требующие проверки специалистом".
"Маркировка должна быть обязательной, ведь врач несёт ответственность за свои назначения, а в случае с системами искусственного интеллекта границы ответственности размываются", — считает она.
Татьяна Романюк полагает, что должна быть не просто маркировка, а запрет давать медицинские заключения без явного предупреждения перед каждым ответом.
"Более того, критически значимые медицинские ответы (назначение лечения, изменение дозировки, отмена терапии) AI давать не вправе в принципе, — убеждена Татьяна Романюк. — Маркировка должна быть визуально неотличима от самого сообщения, это важно для предотвращения самолечения и ложных диагнозов".
По мнению эксперта, подобная маркировка повысит осведомлённость пациентов об ограничениях технологии и снизит риск вреда их здоровью.
На нашем сайте используются cookie-файлы. Продолжая пользоваться данным сайтом, вы подтверждаете свое согласие на использование файлов cookie в соответствии с настоящим уведомлением и Политикой о конфиденциальности.