Нейросеть от «Сбера» генерирует картинки из текстового описания
Новости Интернет
Сбербанк разработал нейросеть ruDALL-E, которая способна создавать изображения по русскоязычному описанию. На сайте rudalle.ru можно написать текстовый запрос и получить сгенерированную нейросетью ruDALL-E картинку.
Как сообщается на сайте проекта, по короткому текстовому описанию ruDALL-E генерирует яркие и красочные изображения на самые разные темы и сюжеты. Модель понимает обширный набор понятий и генерирует совершенно новые изображения и объекты, которых не существовало в реальном мире.
«На кластере Christofari модель обучалась 37 дней на 512 GPU TESLA V100, и затем еще 11 дней по 128 GPU — всего 20352 GPU-дней. Наша самая большая обученная модель XXL (12 миллиардов параметров) сравнима с английской DALL-E от OpenA», — говорится на сайте проекта.
Как отмечают разработчики, генерация изображений решает две важные задачи, которые не может решить поиск: 1) позволяет учесть точное описание желаемого, 2) создает изображение, которое раньше не существовало. Генерацию изображений можно использовать, например, для фото-иллюстрации статей, в копирайтинге и в рекламе.
|
Все рубрики статей (859 / 305):
|
|