Классифайд Авито инвестировал порядка полумиллиарда рублей в создание собственных ИИ-моделей для электронной коммерции и теперь впервые выпускает их в открытый доступ.
Технологическая платформа представила обновленные версии двух разработок — текстовой модели A-Vibe и мультимодальной A-Vision с 8 млрд параметров. Обе системы адаптированы под русский язык и ориентированы на задачи онлайн-торговли. Это первые опенсорс-нейросети российского происхождения, ориентированные на e-commerce. Их можно применять для анализа документов, генерации контента и построения интеллектуальных ассистентов.
По оценке специалистов Авито, использование подобных инструментов позволит разработчикам и бизнесу снижать затраты на запуск и обслуживание моделей примерно наполовину по сравнению с существующими аналогами.
По словам управляющего директора по искусственному интеллекту Авито Андрея Рыбинцева, открытие моделей должно ускорить развитие всей российской ИИ-экосистемы.
«Чем больше разработчиков вовлечено в создание ИИ-решений, тем быстрее развивается вся отрасль», — заявил Рыбинцев.
Две собственные нейромодели разработала технологическая «дочка» Авито — «Авито Тех». Одним из ключевых элементов разработки стал собственный токенизатор для русского языка, который ускоряет генерацию текста почти в два раза и повышает точность ответов по сравнению с зарубежными аналогами. Обучение моделей проходило на реальных данных, включая массивы из сферы электронной коммерции.
Модели обрабатывают до ста страниц текста за раз, что соответствует примерно 32 тысячам токенов. С помощью них можно искать данные, проводить расчеты или обращаться к сторонним сервисам через API.
В компании рассчитывают, что модели будут иметь спрос как у стартапов и небольших команд, так и у крупных организаций и исследовательских центров. Они могут помочь в автоматизации документооборота, генерации контента, создании чат-ботов, а также в разработке и обучении собственных ИИ-систем.
«Рынок остро нуждается в качественных русскоязычных моделях с открытым кодом. Компании тратят месяцы на адаптацию зарубежных решений под российские реалии», — уверена руководитель направления больших языковых моделей Авито Анастасия Рысьмятова.
Отметим, что команда классифайда протестировала модели, переведя на русский язык ряд международных тестов для оценки нейросетей. По результатам испытаний A-Vibe показала уверенное лидерство в отечественных тестах MERA и RU Arena Hard, заняв первое место среди лёгких нейросетей.

