МАГАЗИН ДОМЕНОВ СОФТОДРОМА
|
«Сбер» представил нейросеть Kandinsky для генерации изображений по описанию
«Сбер» представил нейросеть Kandinsky — самую большую на данный момент модель генерации изображений по текстовому описанию на русском языке. Об этом говорится в сообщении пресс-службы «Сбера».
«Это улучшенная версия мультимодальной нейросети ruDALL-E, которая генерирует картинки по описанию на русском языке. Использовать её можно для создания любых видов изображений — иллюстраций, материалов для рекламы, архитектурного и промышленного дизайна и даже дизайна в области цифрового искусства.
В ноябре была выпущена модель ruDALL-E XL, содержащая 1,3 млрд параметров. Её параметры и код были выложены в открытый доступ, и был разработан сервис генерации изображений. За полгода этим сервисом воспользовались 2 млн уникальных пользователей, которые суммарно сгенерировали 125 млн изображений. Также в ноябре была анонсирована, а в декабе опубликована в маркетплейсе AI Services платформы SberCloud ML Space эксклюзивная модель ruDALL-E XXL c 12 миллиардами параметров.
В этом году команды Sber AI и SberDevices смогли существенно улучшить качество работы этой модели, дообучив её на 179 млн изображений, снабжённых текстовыми описаниями, с помощью платформы SberCloud ML Space и суперкомпьютера Christofari Neo. Дообученная модель Kandinsky умеет генерировать изображения с произвольным соотношением сторон, а также может использовать новый способ повышения разрешения сгенерированных картинок на основе диффузионного процесса для изображений с соотношением сторон 1:1 (помимо стандартного подхода с использованием Real-ESRGAN). Теперь модель значительно лучше справляется с созданием реалистичных изображений, качественно передавая различные текстуры, тени и отражения.
Создание изображений при помощи модели Kandinsky происходит в три этапа. Сначала одна нейросеть (непосредственно Kandinsky), используя текстовое описание, генерирует заданное число изображений. Затем вторая (ruCLIP Large) выбирает наиболее удачные и максимально соответствующие заданному текстовому описанию картинки, а потом третья увеличивает их в размере (доступны как диффузионная модель, так и генеративно-состязательная модель Real-ESRGAN). Итогом работы модели является набор сгенерированных изображений высокого качества. Отличительным преимуществом модели Kandinsky по сравнению с предыдущими версиями является более высокая степень детализации создаваемых изображений.
Модель доступна в мобильном приложении Салют, на умных устройствах Sber по запросу «Включи художника»...»
МАГАЗИН ДОМЕНОВ СОФТОДРОМА
|
23.06.2022 16:00
Минцифры России опубликовало подробности об отечественном магазине приложений, законопроект о создании которого был внесен в Госдуму
23.06.2022 14:05
Компания «Яндекс» выложила в открытый доступ YaLM 100B — нейросеть для генерации и обработки текстов на русском и английском языках
22.06.2022 21:39
Правительство внесло в Госдуму законопроект о создании российского магазина приложений, который в обязательном порядке будет предустанавливаться на технические устройства
22.06.2022 18:24
Актуальность российских альтернатив Google Docs выросла после того, как американская корпорация начала отменять платные подписки Google One для российских пользователей
21.06.2022 15:00
Мессенджер Telegram снизил стоимость платной подписки Premium спустя два дня после запуска этого нововведения
|
23.06.2022 16:00
Минцифры России опубликовало подробности об отечественном магазине приложений, законопроект о создании которого был внесен в Госдуму
29.11.2017 02:28
Софтодром рассказывает о том, что такое портативные приложения и в чем их преимущества перед непортативными
23.06.2022 14:05
Компания «Яндекс» выложила в открытый доступ YaLM 100B — нейросеть для генерации и обработки текстов на русском и английском языках
02.12.2017 19:52
Обзор приложений для восстановления удаленных данных с флешки после ее форматирования
03.12.2017 01:04
Софтодром рассказывает о различных способах, которые позволяют скрыть папку или отдельные файлы в Windows
|
|
» Оставьте первым свой комментарий
Все рубрики статей (494 / 1):
|
|