Студент ИТМО разработал систему, диагностирующую COVID-19 по голосу

Автор фото: ИТМО
Владимир Шилоносов, студент 3 курса Университета ИТМО
Владимир Шилоносов, студент 3-го курса Университета ИТМО, изучающий направление "Нейротехнологии и программная инженерия", занимается разработкой новой системы предсказания COVID-19 на основе анализа звуковых данных.
Разработчик утверждает, что обнаруживает COVID-19 с точностью 91,7%.
Основная идея проекта системы распознавания COVID-19 по голосу заключается в использовании методов классического машинного обучения и выборе наиболее эффективного из них.
Студент попробовал несколько подходов классического машинного обучения, включая KNeighbors, LogisticRegression, RandomForest и DecisionTree.
Последний подход показал наилучшую точность. Он брал набор данных с аудиозаписями и извлекал из них характеристики. Затем он использовал только наиболее значимые и некоррелирующие признаки, на основе которых обучал модель.
Идея проекта основана на применении метода "дерева решений" (decision tree), который широко используется в различных областях. В своей работе студент ИТМО Владимир Шилоносов использует этот подход, извлекая признаки из аудиоданных и выбирая только наиболее значимые и некоррелирующие из них. Затем модель обучается на этих признаках.
Decision tree — это модель, которая строит последовательность вопросов, основанных на признаках, чтобы классифицировать объекты. В процессе обучения модели определяется наиболее важный признак, который разделяет данные на здоровые и больные случаи с наибольшей вероятностью.
На основе анализа данных студент определил топ-10 важных признаков для своего проекта. Эти признаки описывают различные аспекты звуковых колебаний, включая высоту звука, уровень громкости, наклон и спектральные характеристики.
Используя эти признаки, модель обучается предсказывать вероятность наличия COVID-19 у человека на основе звукового сигнала.
В настоящее время тестирование системы проводится на основе тренировочных и тестовых данных. Однако в планах — провести дополнительные исследования и тестирование на реальных людях совместно с медицинскими учреждениями.
Основной сложностью при этом является поиск пациентов с подтверждённым диагнозом COVID-19 для включения в исследование.
В рамках практического применения разработанной технологии Владимир планирует запустить Telegram-бота, который будет хоститься на платформе Serverspace. Пользователи смогут отправлять голосовые аудиофайлы в бота и получать предсказания в формате 0 или 1, где 0 означает, что человек здоров, а 1 указывает на возможное заболевание COVID-19.
На прошлой неделе глава Роспотребнадзора Анна Попова заявила на полях ПМЭФ, что ближайшей осенью в России и Петербурге увеличится число пациентов с COVID-19, а новая волна заболеваемости может оказаться сильнее, чем весной.
Несколько месяцев назад аналитики Смольного тоже перевели коронавирус в разряд сезонных заболеваний. Представители городского правительства указали, что в период с марта 2020 года до начала 2023-го ковидом переболела почти треть петербуржцев.