Исследователи представили модель распознавания языка жестов на основе глубокого обучения и компьютерного зрения.
Разработка направлена на создание эффективного инструмента коммуникации для глухих и слабослышащих людей, позволяющего преодолеть существующие социальные барьеры.
Методика HHODLM-SLR включает несколько инновационных этапов обработки данных. На первом этапе применяется двусторонняя фильтрация для очистки входных изображений от шумов и артефактов. Затем глубокоя сверточная сеть ResNet-152 выделяет наиболее значимые функции жестов, обеспечивая высокую детализацию анализа. Классификация осуществляется с помощью двунаправленной сети LSTM, параметры которой оптимизируются алгоритмом Харриса Хока.
Согласно исследованию, опубликованному в Scientific Reports, система показала точность в 98,95% на тестовых данных. Такой результат значительно превосходит существующие аналоги и открывает новые перспективы для создания доступных коммуникационных сервисов.
Технология может быть интегрирована в системы видеонаблюдения, смартфоны и специализированные устройства, обеспечивая бесшовное взаимодействие между людьми с разными возможностями здоровья.