Нейронными сетями «Яндекса» расшифрованы 300 тысяч страниц метрических книг (документы XVIII – начала XX века) из Центрального государственного архива Московской области.
«Документы были обработаны алгоритмом на базе системы оптического распознавания символов», – рассказали в пресс-службе IT-компании.
Благодаря применяемым методам рукописи преобразовываются в печатный текст, и в базе можно находить отдельные слова, такие как упоминания фамилий и населенных пунктов.
За два месяца с запуска сервиса «Поиск по архивам» в январе 2023 года количество расшифрованных нейросетями страниц увеличилось вдвое, с 2,5 до 5 миллионов, сообщает ТАСС.
Также в базу вошли материалы из Главархива Москвы (700 тыс. страниц) и впервые опубликованные в открытом доступе описи из архива Республики Мордовия.
Ранее московский онлайн-сервис «Моя семья» опубликовал свыше девяти миллионов страниц метрических книг. Более того, в онлайн-сервисе «Моя семья» теперь доступны не только метрические книги, но и ревизские сказки.
Также сообщалось, что россияне стали проявлять все больший интерес к истории своих семей.
#ик