Софтодром   


«Яндекс» научил нейросети расшифровывать записи с дореволюционной орфографией



Новости    Интернет


Компания «Яндекс» научила нейросети расшифровывать архивные записи со сложной дореволюционной орфографией. Об этом говорится в сообщении компании.

Попробовать технологию в действии можно уже сейчас в сервисе «Поиск по архивам»: он открывает всем желающим доступ к более чем 2,5 миллиона страниц исторических документов с текстовой расшифровкой.

Как отмечают в «Яндексе», новый алгоритм, который разработан на основе системы оптического распознавания символов, учитывает особенности почерка, способен распознавать утратившие актуальность буквы и понимает особую структуру архивных документов.

Специалисты «Яндекса» обучили нейросеть на массиве данных, состоящем из сотен тысяч рукописных строк, взятых из реальных текстов XVIII–XIX веков и десятков миллионов сгенерированных примеров. Материалы для обучения размечали и расшифровывали эксперты, они же контролировали качество распознавания.

Рукописи, которые неподготовленному человеку сложно разобрать, технология «Яндекса» почти мгновенно превращает в печатный текст, отмечают в компании. Благодаря этому в базе сервиса можно быстро находить документы с упоминанием фамилии, населенного пункта или любых других слов.




Автор: Softodrom.ru
Дата:

Новое: Интернет
05.05.2025 16:47

В Москве доступ в интернет может быть ограничен в праздники

Москвичей предупредили о возможных ограничениях доступа в интернет в праздники


05.05.2025 12:36

В России произошел сбой в работе мобильных операторов и мессенджеров

Сбои зафиксированы в работе мобильной связи и интернета у российских операторов Т2, МТС, «МегаФон», Yota и «Билайн», а также в работе Telegram и WhatsApp


30.04.2025 18:08

Власти российских регионов почти полностью ушли из YouTube

Тем не менее, обновляются YouTube-каналы Кремля, правительства России, Верховного суда и Следственного комитета


29.04.2025 13:39

VK запустила новую грантовую программу для авторов видеоконтента

Обновленная программа предназначена для создателей оригинального контента и впервые доступна для физических лиц и самозанятых


26.04.2025 18:10

Просмотры детского контента в VK Видео выросли в 30 раз

Детский контент — самая быстрорастущая зрительская категория контента в VK Видео


Популярное: Интернет
03.01.2023 17:02

Как опубликовать свою статью на Софтодроме

Если вы хотите опубликовать свою статью на Софтодроме, то рассказываем о том, какие статьи нам нужны


25.12.2023 14:13

Суд отправил жительницу Петербурга в психбольницу за фейки про армию в соцсети

Калининский районный суд Санкт-Петербурга вынес приговор местной жительнице за фейки в соцсети «ВКонтакте»


27.12.2023 13:09

Фильм «Догмен» Люка Бессона выйдет в российских онлайн-кинотеатрах

Российская премьера нового фильма «Догмен» режиссера Люка Бессона состоится в онлайн-кинотеатрах, но в прокат в обычных кинотеатрах фильм в России не выйдет


26.12.2023 18:10

Доходы пиратов выросли на 71% после ухода Netflix и Голливуда

На фоне роста нелегальных сервисов официальные аудио- и видеостриминговые сервисы находятся в стагнации, отмечают аналитики


24.12.2023 16:49

Ведущий шахматный портал заблокировал Крамника за критику в свой адрес

Российский шахматист в очередной раз раскритиковал руководство платформы из-за отсутствия серьезных мер по борьбе с читерством


Все рубрики статей (824 / 824):


Программы | Рейтинги | Статистика | Авторам | Рассылки
Copyright © 1999-2025 Softodrom.ru
Реклама | О проекте | О перепечатках | Пользовательское соглашение | Политика конфиденциальности | Карта сайта