19 мая 2026 года компания «Яндекс» представила значительное обновление своей генеративной модели Alice AI ART. Теперь популярный ИИ-ассистент, встроенный в экосистему компании, способен создавать изображения с корректными и длинными надписями на русском языке. Обновленная модель доступна для всех пользователей в чате с «Алисой AI», а также для корпоративных клиентов через платформу Yandex AI Studio

Создание изображений с текстом на определённом языке — это нетривиальная задача для большинства генеративных нейросетей. Модели часто допускают ошибки в словах или генерируют нечитаемые «псевдо-символы», которые лишь отдалённо напоминают буквы. Главная причина этого — «перекос» данных, на которых они обучены. Большинство открытых датасетов, используемых для обучения мировых нейросетей, содержат крайне мало примеров с русскоязычными надписями. «Яндекс» решил эту проблему, отказавшись от стандартных подходов и пойдя собственным путём.


Для обучения обновленной модели компания проделала огромную работу с данными. На этапе предобучения (pre-training) в модель было загружено около 30 миллионов примеров, содержащих тексты на русском языке. Для финальной «доводки» (fine-tuning) инженеры использовали примерно 100 тысяч изображений с детальной ручной разметкой текста, что позволило модели более точно понимать структуру и расположение надписей.

Помимо этого, разработчики внесли изменения в архитектуру самой нейросети и добавили важный функциональный элемент — механизм рефразирования (перефразирования) запросов. Теперь «Алиса AI» может сама уточнять нечеткие формулировки пользователя. Например, если в запросе указана фраза «наша столица», модель преобразует её в более конкретный образ — «Москва». Это существенно повышает точность и релевантность генерации.

Усилия разработчиков принесли ощутимые результаты. По данным компании, после обновления нейросеть стала в три раза чаще создавать изображения с корректным русскоязычным текстом без ошибок и нечитаемых символов. Кроме того, общее качество изображений (без искажений, с правильной композицией) выросло примерно на треть.

Однако самое интересное — это качественное улучшение понимания культурного контекста. Модель не просто выучила буквы, она усвоила образы, значимые для русскоязычной аудитории. Так, по запросу «русский народный ансамбль» нейросеть создаёт изображения с гармонистами и балалаечниками, а при описании традиционного праздничного стола щедро дополняет его икрой, соленьями и самоваром.

Для достижения максимального качества, разработчики «Яндекса» рекомендуют пользователям придерживаться нескольких простых правил при составлении запросов:

  • Используйте кавычки: Заключайте текст надписи в кавычки, чтобы модель точно понимала, что именно нужно написать.

  • Пишите заглавными буквами: Сложные или неочевидные слова лучше писать заглавными буквами.

    • Для частных пользователей: теперь в чате с «Алисой AI» можно создавать полноценные постеры, афиши для мероприятий, персонализированные открытки и любые другие изображения, где требуется читаемый русский текст.

    • Для бизнеса: на платформе Yandex AI Studio компании получили доступ к новому инструменту Image Generation Tool. Он позволяет интегрировать генерацию изображений в автоматизированные рабочие процессы. Например, ИИ-агенты смогут автоматически создавать визуальный контент для карточек товаров на маркетплейсах, рекламных материалов, лендингов или презентаций, используя данные из корпоративных систем и брендбуков.

      Разбивайте длинные фразы: Длинные надписи на изображении стоит разбивать на более короткие логические фрагменты
      Обновление открывает новые возможности как для обычных людей, так и для коммерческих структур.

    Это обновление выходит далеко за рамки простого улучшения алгоритма. Оно знаменует собой важный шаг в развитии «локальных» систем ИИ, которые могут эффективно работать с богатством и спецификой русского языка и культуры. Решив фундаментальную проблему генерации текста на изображениях, Яндекс не только повысил удобство своего сервиса для миллионов пользователей, но и предложил бизнесу мощный инструмент для автоматизации создания контента, что может изменить подходы к digital-маркетингу и электронной коммерции на русскоязычном рынке.