ФОТО: НОВОСИЛЬЦЕВ АРТУР/АГЕНТСТВО «МОСКВА»

Годы проходят, но история русских людей былых времён удивительным образом не отдаляется от нас, а становится ближе. Бумажные архивы обретают цифровую форму и становятся доступны каждому человеку. Начали, как обычно, с Москвы.

Необычная система, основанная на искусственном интеллекте, начала действовать в московском Главном архивном управлении (Главархиве). Совместно с компанией «Яндекс» столичные архивариусы внедрили нейросеть, которая поможет оцифровать исторические документы – не просто отсканировать их, а ещё и распознать содержимое, перевести его в текстовый вид.

Эта революционная технология со скромным названием «Поиск по архивам» была отработана на материалах онлайн-сервиса «Моя семья«. Жители всей страны, желающие узнать историю своего рода, сделали уже более 10 миллионов запросов к этому сервису, который обобщает данные церковных метрических книг. Именно метрические книги были использованы разработчиками «Поиска по архивам», чтобы «натренировать» искусственный интеллект, обучить его читать не всегда простой почерк церковных дьяков.

Сейчас обрабатываются книги Москвы, а также трёх губерний – Московской, Оренбургской и Нижегородской. Используются, кстати, материалы не только православных приходов, но и евангелическо-лютеранских, и римско-католических церквей. Кроме метрических книг в сервисе «Моя семья» используются также ревизские сказки (отчёты о переписях населения) и исповедные росписи (списки прихожан с указанием факта исповедей и причастий).

Руководитель столичного Главархива Ярослав Онопенко не скрывает радости:

Если раньше поиски по рукописному архиву занимали десятки часов, то сейчас нужные имена можно найти за считаные минуты. Мы надеемся, что благодаря настолько удобному сервису количество горожан, интересующихся историей своей семьи, сильно возрастёт. Сейчас на платформе «Поиск по архивам» доступно 2,5 миллиона страниц метрических книг и других документов по генеалогии. В дальнейшем их количество будет только расти.

ЦЕНТРЫ ГОСУСЛУГ «МОИ ДОКУМЕНТЫ» И ГЛАВАРХИВ СТОЛИЦЫ ЗАПУСТИЛИ АКЦИЮ «МОСКВА — С ЗАБОТОЙ ОБ ИСТОРИИ». ФОТО: АГН «МОСКВА»

Вообще, чтение дореволюционных метрических книг – чрезвычайно увлекательное занятие. Актовые записи указывают не только имена ребёнка и его родителей вместе с пропиской (тогда она называлась припиской), как сейчас, но и род занятий родителей, а также имена крёстных. Если же запись повествует о браке, то там указано сословие вступающих в брак, род занятий жениха, количество предыдущих браков, а иногда и имена родителей молодожёнов. Может быть, традицию расширенных записей имело бы смысл возобновить и в наши дни.

Надо понимать, что всю предыдущую историю Руси поиск всех данных, собранных в «доцифровые» времена, проводился практически вручную. Сотрудники архивных учреждений назубок знают уже, где какие книги лежат, в каком порядке, как они соотносятся друг с другом; стороннему же исследователю разобраться во всём этом было исключительно сложно.

Но вернёмся к искусственному интеллекту, которому удалось одолеть нелёгкое дело распознавания старых рукописных записей. Даже живому исследователю порой сложно прочесть какое-то имя – у машины процент ошибок существенно ниже. Кроме того, алгоритм сопоставляет записи из разных книг, что сильно упрощает поиск: достаточно забить в поиск то или иное имя – и система выдаст все его вхождения с дополнительными данными.

Со временем на основании московского опыта, надеемся, удастся оцифровать вообще все церковные метрические книги, сохранившиеся в России. После этого жители России смогут формировать разветвлённые генеалогические древа, не вставая из-за компьютера, буквально несколькими щелчками мыши. К слову, у работы программистов есть и не вполне очевидный плюс: после завершения сканирования и распознавания бумажные оригиналы наконец смогут «вздохнуть спокойно»: к ним будут обращаться в десятки раз реже, а значит, бесценные раритеты в сохранности перейдут нашим потомкам.

К слову, любителям архивов или просто старины можно порекомендовать ещё два столичных сервиса: виртуальный музей «Москва – с заботой об истории» и «Уникальные документы» – богатейший набор самых разных раритетов, от метрических записей выдающихся личностей до проектов нереализованных советских строек.

ИВАН ДЕМЕНТЬЕВ