Софтодром   
Windows Программы для Windows
Linux Программы для Linux
Android Приложения для Android
iOS Приложения для iPhone

Новости  Форумы

Microsoft научила нейросеть рисовать сложные сцены по текстовому описанию



Новости    Наука и техника



Исследовательская группа Microsoft Research представила генеративно-состязательную нейросеть, способную генерировать изображения с несколькими объектами на основе текстового описания. По словам разработчиков, в отличие от более ранних подобных алгоритмов text-to-image, которые были способны воспроизводить изображения только базовых объектов, эта нейросеть может справляться со сложными описаниями более качественно.

Как отмечают разработчики, сложность создания подобного алгоритма заключалась в том, что, во-первых, ранее бот был не способен в хорошем качестве воссоздавать все базовые объекты по их описаниям, и, во-вторых, не мог проанализировать то, как несколько объектов могут относиться друг к другу в рамках одной композиции. К примеру, чтобы создать изображение по описанию «Женщина в шлеме сидит на лошади», нейросеть должна была семантически «понять», как каждый из объектов относится друг к другу. Эти проблемы удалось решить, обучив нейросеть на основе открытого дата-сета COCO, содержащего разметку и данные сегментации для более 1,5 млн объектов.

В основе алгоритма лежит объектно-ориентированная генеративно-состязательная нейросеть ObjGAN (Object-driven Attentive Generative Adversarial Newtorks). Она анализирует текст, выделяя из него слова-объекты, которые необходимо расположить на изображении. В отличие от обычной генеративно-состязательной сети, состоящей из одного генератора, который создает изображения, и одного дискриминатора, который оценивает качество сгенерированных изображений, ObjGAN содержит два различных дискриминатора. Один анализирует, насколько реалистичен каждый из воспроизведенных объектов и насколько он соответствует имеющемуся описанию. Второй определяет, насколько вся композиция реалистична и соотносится с текстом.

Предшественником алгоритма ObjGAN стал AttnGAN, также разработанный в Microsoft. Он способен генерировать изображения объектов по более простым текстовым описаниям. По словам разработчиков, технология преобразования текста в изображения может применяться для помощи дизайнерам и художникам в создании эскизов.


Автор: Softodrom.ru
Дата:

22.11.2024 22:26

Глава «Роскосмоса» рассказал, когда начнутся пилотируемые полеты на Марс

Уже в 2030–40-х годах Россия начнет использовать ядерный буксир «Зевс» для исследования дальнего космоса, рассказал гендиректор «Роскосмоса» Юрий Борисов


31.10.2024 20:03

Яндекс наградил 14 ученых за достижения в сфере машинного обучения

Совет премии выбрал 14 лауреатов, представивших работы в области генеративных моделей, обработки естественного языка, компьютерного зрения, информационного поиска, распознавания и синтеза речи, когнитивной робототехники


25.09.2024 23:35

Минтранс предложил запретить водителям пользоваться планшетами за рулем

Целью предлагаемых поправок в ПДД является повышение безопасности дорожного движения, а также «актуализация действующих норм, которые не учитывают появление новых различных современных устройств»


17.09.2024 21:02

Создание российского аналога Starlink оценили в 445 млрд руб.

К концу 2030 года группировка «Бюро 1440» должна состоять из 292 спутников, а всего предстоит запустить 383 спутника


24.08.2024 00:51

Маск пообещал чипы Neuralink миллионам людей

На данный момент нейрочип, который разработала компания Neuralink Илона Маска, вживлен уже двум пациентам


Популярное: Наука и техника
22.12.2023 21:01

СМИ: проект Hyperloop близок к закрытию

Hyperloop — проект вакуумного поезда, предложенный в 2013 году Илоном Маском


20.12.2023 20:00

NASA протестировало лазерную систему связи и получило из космоса видео с котом

NASA объявило об успешной передаче информации с зонда Психея, направляющегося к одноименному астероиду, с помощью лазерной системы связи


04.11.2023 17:30

Учебники по китайскому и корейскому в России обошли по популярности немецкий

Спрос на учебники по европейским языкам в России значительно упал, но при этом растут продажи учебных пособий по китайскому и корейскому


29.02.2024 23:49

Минздрав зарегистрировал обновленную вакцину «Спутник V»

Регистрация «Спутника V» дала возможность перейти к испытаниям обновленной вакцины на подростках


12.12.2023 22:22

«Алиса» перестала подчиняться пользователям из-за сбоя

В работе устройств «Яндекса» для «умного» дома произошел сбой



Ищете, где скачать бесплатные программы?

Скачать бесплатные программы для компьютера на Windows и смартфона на iOS или Android можно на Софтодроме. На данный момент в каталоге Софтодрома представлено более 13 000 бесплатных программ для Windows, iOS, Android и Linux.
Все рубрики статей (898 / 140):


Программы для Windows | Приложения для Android | Приложения для iPhone | Программы для Linux
Статистика | Рейтинги | Авторам | Рассылки
Copyright © 1999-2024 Softodrom.ru
Реклама | О проекте | О перепечатках | Пользовательское соглашение | Политика конфиденциальности | Карта сайта