Исследователи из компании Microsoft разработали систему искусственного интеллекта, способную генерировать подписи к изображениям, которые во многих случаях оказываются более точными, чем описания, сделанные людьми. «Этот прорыв стал важной вехой в стремлении Microsoft сделать свои продукты и услуги инклюзивными и доступными для всех пользователей», — говорится в сообщении компании.
Новая модель доступна потребителям через Computer Vision в Azure Cognitive Services, которое является частью Azure AI, и позволяет разработчикам использовать эту возможность для улучшения доступности своих сервисов. Она также включается в приложение Seeing AI и в конце этого года начнет работать в Microsoft Word и Outlook для Windows и Mac, а также в PowerPoint для Windows, Mac и в веб-версии.
«Описание изображений — одна из основных функций компьютерного зрения, которая делает возможной работу широкого спектра сервисов», — сказал Сюэдун Хуан (Xuedong Huang), технический сотрудник Microsoft и главный технический директор Azure AI Cognitive Services в Редмонде.
Автоматическое описание помогает пользователям получить доступ к важному содержимому любого изображения, будь то фотография, возвращенная в результатах поиска, или иллюстрация для презентации.
«Использование подписей, описывающих содержимое изображений (так называемый альтернативный или замещающий текст), на веб-страницах и в документах особенно важно для незрячихили слабовидящих людей», – отметил Сакиб Шейх (Saqib Shaikh), менеджер по программному обеспечению в группе платформ AI Microsoft в Редмонде.
«В идеале всем следует добавлять альтернативный текст для всех изображений в документах, в Интернете, в социальных сетях, так как это позволяет незрячим людям получить доступ к содержимому и принять участие в разговоре. Но, увы, люди этого не делают, — говорит Шейх. — Однако есть несколько приложений, которые используют функцию описания изображений, чтобы добавлять альтернативный текст, когда он отсутствует».
Уже в 2030–40-х годах Россия начнет использовать ядерный буксир «Зевс» для исследования дальнего космоса, рассказал гендиректор «Роскосмоса» Юрий Борисов
Совет премии выбрал 14 лауреатов, представивших работы в области генеративных моделей, обработки естественного языка, компьютерного зрения, информационного поиска, распознавания и синтеза речи, когнитивной робототехники
Целью предлагаемых поправок в ПДД является повышение безопасности дорожного движения, а также «актуализация действующих норм, которые не учитывают появление новых различных современных устройств»
В работе устройств «Яндекса» для «умного» дома произошел сбой
Ищете, где скачать бесплатные программы?
Скачать бесплатные программы для компьютера на Windows и смартфона на iOS или Android можно на Софтодроме. На данный момент в каталоге Софтодрома представлено более 13 000 бесплатных программ для Windows, iOS, Android и Linux.