
Американские учёные показали, что алгоритмы могут фиксировать едва заметные акустические изменения, связанные с поражениями голосовых связок, задолго до появления явных симптомов
Анализ тончайших изменений в человеческом голосе с помощью искусственного интеллекта может помочь в обнаружении самых начальных стадий рака гортани. К такому заключению пришли исследователи из Орегонского университета науки о здоровье (OHSU) и Портлендского государственного университета. Результаты их работы были обнародованы в журнале Frontiers in Digital Health.
Акустические «отпечатки» болезни
Исследования показали, что любые изменения в структуре голосовых связок, независимо от их природы, формируют специфические акустические сигнатуры. Искусственный интеллект обладает возможностью идентифицировать эти маркеры на начальных этапах развития патологии, опережая традиционную диагностику с применением эндоскопических методов. Такой подход позволяет оперативно начинать терапию и повышает вероятность благоприятного исхода.
Традиционные методы диагностики требуют наличия специализированной аппаратуры и инвазивных манипуляций, что может затягивать процесс, особенно в удаленных районах с ограниченным числом специалистов-оториноларингологов. При онкологических заболеваниях гортани пятилетняя выживаемость колеблется в широком диапазоне, от 35% до 78%, в зависимости от стадии заболевания, что подчеркивает критическую важность своевременной диагностики.
Голос как биомаркер
Исследование базировалось на датасете Bridge2AI-Voice, созданном в рамках программы Национального института здоровья США Bridge to Artificial Intelligence, направленной на формирование обширной и этически выверенной базы голосовых записей для исследования голоса в качестве биомаркера состояния здоровья.
Первичный набор данных содержит свыше 12 500 образцов, полученных от 306 участников из Северной Америки, включая 23 человек с подтвержденным диагнозом рака гортани или доброкачественных образований голосовых связок. Алгоритм анализировал колебания частоты голоса, изменения интенсивности звука и соотношение гармонических составляющих к шуму (HNR), которое отражает баланс между тональными и шумовыми компонентами речи.
У мужчин средние значения HNR и их изменчивость существенно отличались между группами с доброкачественными новообразованиями, раком гортани и здоровыми голосовыми связками. Разница в среднем HNR между мужчинами с доброкачественными поражениями и мужчинами со здоровыми связками была статистически значимой (p = 0,004), как и разница в изменчивости HNR (p = 0,002). Данные параметры также способствовали различению мужчин с доброкачественными поражениями и пациентов, страдающих раком гортани (p = 0,027).
У женщин подобные различия не были обнаружены, что ученые объясняют недостаточным объемом выборки.
«Мы продемонстрировали возможность использования голосовых биомаркеров для дифференциации голосов пациентов с поражениями голосовых связок от голосов людей без подобных нарушений с использованием данного набора данных», – подчеркнул ведущий автор исследования, Филлип Дженкинс.
Исследователи отмечают, что для успешного применения голосового скрининга в медицинских учреждениях необходимы более обширные массивы информации и проверка работоспособности технологии в повседневной практике.
“Инструменты голосовой диагностики сейчас проходят начальные этапы апробации. Если собрать больше данных и подтвердить их клиническую значимость, то аналогичные системы для обнаружения проблем с голосовыми связками могут быть запущены в тестовом режиме в течение следующих нескольких лет”, – заявил Дженкинс.