A HTR- (Handwritten Text Recognition-) modellt az Országos Széchényi Könyvtár Digitális Bölcsészeti Központja (OSZK DBK) hozta létre, és mindenki számára elérhetővé tette a Transkribus nevű szoftver komponenseként.
A kézírásfelismerést mesterséges intelligencián alapuló algoritmus végzi.
Először be kell tanítani, hogy a különböző kézírásokat felismerje, majd a megadott minták alapján a gép felépít egy modellt, amellyel képessé válik arra, hogy egy általa ismeretlen, még nem látott kézírásképet is értelmezzen.
A jelenlegi modell először Kiss József írásán, majd a levelezőpartnerek vegyes kézírásán tanult.
Az eddig felhasznált kéziratok a Petőfi Irodalmi Múzeumban (PIM) találhatók. A tanulásra felhasznált szavak száma körülbelül hetvenötezer. A dokumentumok között szerepelnek borítékok, képeslapok, hagyományos és fejléces levelek, névjegykártyák is.
A levélírók Kiss József és családja, valamint a századforduló írói, újságírói és művészei, mint Ady Endre, Móricz Zsigmond és Tömörkény István.
Ez összesen háromszáz darab változó hosszúságú és minőségű levelet jelent, amelyeket a DBK folyamatosan közzétesz az olvasók számára a dhupla.hu/collection/kiss-jozsef-levelezes oldalon. A levélváltások további kéziratai jelenleg is feldolgozás alatt állnak az OSZK-ban és a PIM-ben. A modell jelenleg 9,19 hibaszázalékkal működik, ami azt jelenti, hogy a projektben csaknem kilencven százalékos pontossággal meg tudja állapítani, milyen karakterekből áll a szöveg.
Fejléckép: Országos Széchényi Könyvtár

hírlevél








