Ruski spletni velikan Yandex predstavil umetno inteligenco, ki dešifrira stoletne rokopise

Znanost in tehnologija
ERWANN PENSEC
Ta platforma bo olajšala delo vsem, ki se želijo poglobiti v ruske carske arhive, vendar nimajo dovolj znanja za razumevanje pisave, ki se je uporabljala pred boljševiškimi reformami.

Leta 1918 se je mlada boljševiška vlada lotila velike jezikovne reforme, katere cilj je bil zmanjšati nepismenost in poenostaviti ruski jezik. To je vključevalo spremembo abecede, pri čemer so nekatere črke nadomestili druge, nekateri znaki pa so izginili. Zato je predrevolucionarno pisavo zdaj včasih težko razumeti.

Ruski spletni velikan Yandex se zaveda te težave, zato je razvil umetno inteligenco, ki je na voljo na tej povezavi in omogoča dešifriranje rokopisov iz cesarske dobe. Strokovnjaki so jo na podlagi velikega števila pisav iz 18. in 19. stoletja ter milijonov umetno ustvarjenih primerov naučili, da z optičnim prepoznavanjem simbolov upošteva posebnosti pisave, prepozna zastarele znake in razume strukturo arhivskih dokumentov.

Pri učenju umetne inteligence so razvijalci uporabili Moskovski centralni arhiv, vendar baza podatkov že vključuje arhive Orenburške in Novgorodske regije in se bo sčasoma še razširila.

Tako lahko uporabniki zdaj pregledujejo in dešifrirajo skoraj 2,5 milijona dokumentov od sredine 18. do začetka 20. stoletja. S pregledovanjem baze podatkov z uporabo filtrov, na primer po letih ali arhivskih fondih, pa tudi z iskanjem priimka ali določenega kraja, bodo uporabniki lahko našli sledi svojih prednikov. Orodje naj bi bilo dragocen pripomoček za zgodovinarje, sociologe in demografe, pa tudi za posameznike, ki želijo obnoviti svoje družinsko drevo.

"Odločil sem se poskusiti in sem našel rojstni list mojega dedka v približno 20 sekundah. Z bratom sva ta dokument iskala sama lani spomladi, še preden je bila ta storitev na voljo, in iskanje nama je vzelo več dni: digitalizirane cerkvene knjige Moskve za leto 1915 sva morala brati "s štirimi rokami". Pa vendar nam umetna inteligenca ni pomagala rešiti naše glavne težave: razvozlati ime poljskega mesta, od koder prihaja naša prababica, pri čemer smo imeli smolo: pisni zapis je bil zelo slabo narejen," pravi Moskovčan, ki se je odločil preizkusiti novo storitev.

O najbolj norih iskanjih na ruskem spletnem iskalniku Yandex v letu 2018 lahko preberite tukaj.