Вторник, 13 января 2026
$78.23 €92.09 ¥11.16
-7.9 C
Санкт-Петербург

В Петербурге научили ИИ понимать наречие карельского языка

В Санкт-Петербурге исследователи разработали первую в России систему распознавания речи для ливвиковского наречия карельского языка.

Новая технология способна преобразовывать устную речь в текст с помощью искусственного интеллекта (ИИ). В перспективе разработка станет частью онлайн-переводчика с функцией работы в реальном времени.

Ученые отмечают, что на данный момент из 30 тысяч носителей карельского языка в мире лишь 5-7 тысяч используют его в повседневной. Это ставит язык под угрозу исчезновения. Новая система не только поможет сохранить его, но и может быть использована как инструмент для изучения языков коренных народов России.

Система адаптирована к реальным условиям использования карельского языка, где часто встречается смешение с русским. Об этом сообщили в пресс-службе Министерства науки и высшего образования России.

По словам разработчиков, алгоритм специально обучен корректно обрабатывать такие случаи, что делает его эффективнее по сравнению с существующими многоязычными моделями, которые демонстрируют низкую точность при распознавании карельской речи.

Для обучения системы использовались тексты из открытого корпуса вепсского и карельского языков, а также специально собранные образцы разговорной речи, обработанные носителями языка.

Первоначально система будет представлена в виде компьютерного приложения, которое распознает речь через микрофон. Однако разработчики уже задумываются об адаптации системы для мобильных устройств.

По мнению ученых, разработка может быть полезной для автоматического стенографирования речи, создания систем машинного перевода, анализа медиаконтента и разработки ассистивных технологий.

Узнавайте о новостях первыми в наших официальных каналах в Telegram и Дзене

Поделиться:

Читайте также

Комета 3I/ATLAS — третий в истории наблюдений объект, чье происхождение находится за пределами Солнечной системы. Третий подтвержденный гость из межзвездного пространстваОбъект был зафиксирован 1 июля телескопами системы ATLAS, принадлежащей NASA. Цифра «3» в обозначении официально указывает на его статус третьего обнаруженного тела внесолнечного происхождения.Первыми двумя стали астероид Оумуамуа (2017) и комета Борисова (2019). Кометная природа нового объекта была установлена путем анализа, выявившего признаки газопылевой активности вокруг ядра.Ключевым доказательством межзвездного происхождения служит его гиперболическая траектория и скорость около 60 километров в секунду, что превышает значение, необходимое для преодоления гравитации Солнца. Это означает, что после сближения со светилом комета навсегда покинет нашу систему.Происхождение и путь космического скитальцаУченые предполагают, что объект мог быть выброшен из своей родной планетной системы миллионы лет назад. Одним...
Результаты исследования психологов Бернского университета демонстрируют, что движения глаз во время мысленной визуализации отражают процесс последовательной сборки образа из отдельных частей.Сравнение с частью и целымВ двух экспериментах ученые сопоставили движения глаз участников в трех ситуациях: при свободном восприятии изображений, при их мысленном воссоздании, а также при просмотре через специальные фильтры, навязывающие стратегию восприятия. Результаты их работы были опубликованы в научном журнале Scientific Reports.В первом случае использовалось «окно, зависящее от взгляда» (GCW), которое позволяло видеть только небольшую область вокруг точки фиксации, вынуждая собирать картину по частям. Во втором применялся «искусственный скотом» (AS), блокирующий центральное зрение и стимулирующий целостное, периферическое восприятие. Такой подход позволил напрямую сравнить, на какую из двух стратегий больше похожа глазодвигательная активность при воображении.Сходство с частью независимо от...

Интересное

Новости дня

По теме

Подпишись на наши соцсети

Сообщить новость

Отправьте свою новость в редакцию, расскажите о проблеме или подкиньте тему для публикации. Сюда же загружайте ваше видео и фото.

ИЛИ ПИШИТЕ