U Švicarskoj se nalazi knjižnica (St. Gall) koja služi kao dom za 160 000 svezaka književnih i povijesnih rukopisa. Rukopisi datiraju iz osmog stoljeća, te su svi napisani ručno, na pergamentu i na jezicima koji su odavno zamrli.
Kako bi se sačuvali, ovi i brojni drugi tekstovi su se čuvali na sigurnome, pohranjeni u knjižnicama i samostanima diljem svijeta. Značajan dio ovih zbirki je dostupan javno u obliku digitalnih verzija, no stručnjaci upućuju na to da postoji niz materijala koji nikad nije pročitan.
Istraživači sa Sveučilišta Notre Dame su odlučili razviti umjetnu neuronsku mrežu za čitanje složenog drevnog rukopisa.
Kojim jezicima su pisani spisi?
Najčešći korišteni jezik u spisima je naravno latinski, no postoje i brojni drugi jezici koji se nalaze u spisima. Svim jezicima je jedno zajedničko – odavno se ne koriste i malo tko ih danas zna prevesti.
Kako se radi o milijunima tekstova, nije realno očekivati da će ih ljudi čitati i prevoditi (pogotovo kada te jezike zna analizirati samo mala šačica ljudi). Istraživači su uspjeli stvoriti softver koji oponaša ljudsku percepciju čitanja. Softver ima mogućnost čitanja teksta, te analiziranja istog sa vrlo visokom točnošću.
Pa za početak, ovdje ne govorimo o tekstu na računalu koji možete ubaciti u google translate i dobiti donekle pristojan prijevod. Riječ je o vrlo složenim jezicima koji ne samo da su pisani rukom, nego su takvi zapisi dostupni isključivo u obliku slike. Ta dva faktora uvelike otežavaju prepoznavanje i čitanje teksta.
U sljedećoj fazi, tim istraživača će se usmjeriti na poboljšanje točnosti transkripcija, posebno u slučaju oštećenih ili nepotpunih dokumenata. Također, u spisima postoje i brojne ilustracije koje je potrebno dodatno objasniti.