Разработанная специалистами Авито языковая модель A-Vibe стала лидером среди легких нейросетевых решений по версии российского тестового комплекса MERA.
Согласно данным компании, она обошла конкурентов, включая продукты OpenAI, Google и Anthropic, продемонстрировав более высокие результаты в сфере обработки естественной речи, создания кода и поддержания логических бесед.
В сравнительных испытаниях A-Vibe тестировали наряду с такими моделями, как GPT-4o mini, Gemma 3 27B, Claude 3.5 Haiku и Mistral Large. Оценка проводилась по нескольким направлениям: анализ сложных запросов, генерация программного кода и способность вести диалог с сохранением контекста. Отмечается, что A-Vibe, как и другие нейросети, пока не может превзойти показатели реальных людей, но приближается к этим значениям.
Архитектура A-Vibe базируется на доработанной открытой структуре, в которой традиционный токенизатор заменили на специализированный аналог, оптимизированный для работы с русскоязычными текстами.
В настоящее время разработка уже интегрирована в сервисы Авито: например, она автоматически генерирует продающие описания для товаров, а также упрощает коммуникацию между участниками сделок во внутреннем мессенджере платформы.
Как отметил Андрей Рыбинцев, старший директор по данным и аналитике Авито, компания намерена инвестировать около 12 млрд рублей в развитие генеративного искусственного интеллекта. По прогнозам, к 2028 году прибыль от этого направления превысит 21 млрд рублей.
Анастасия Рысьмятова, возглавляющая разработку крупных языковых моделей в Авито, сообщила, что рассматривается возможность публичного выпуска модели, что может способствовать расширению отечественного ИИ-рынка.
Познакомиться с рейтингом можно на сайте MERA https://mera.a-ai.ru/ru/leaderboard. Цифры Human Benchmark — это результат тестирования реальных людей.