OCR

S kratico OCR, ki izhaja iz angleškega poimenovanja Optical Character Recognition (slov. optična prepoznava znakov), označujemo proces pretvorbe skeniranega ali fotografiranega besedila v računalniško berljivo obliko.

Z drugimi besedami, naloga OCR je prebrati besedilo, ki je na vhodni sliki, in ga zapisati kot zaporedje znakov v določeni kodni tabeli (na primer ASCII ali Unicode). Če je na sliki prikazana beseda »ABBA«, jo program OCR prebere in zapiše kot zaporedje znakov Unicode: 0041, 0042, 0042 in 0041.

Ljudje z branjem nimamo težav in z lahkoto beremo besedilo različnih velikosti, barv in oblik. Tudi kadar so črke slogovno zavite in umetniško oblikovane, se nam zdi branje enostavno in popolnoma samoumevno. Pri zelo slabo vidnih ali celo nepopolnih besedah (besedah z manjkajočimi črkami) znajo naši možgani še vedno pravilno ugotoviti, za katero besedo gre. Kljub temu, da se branje na prvi pogled zdi enostavno in popolnoma podzavestno, pa predstavlja za računalnike trd oreh – tako zelo trd, da ga znanosti še vedno ni uspelo popolnoma razbiti. Treba se je namreč zavedati, da za razliko od ljudi, ki slike dojemamo »inteligentno«, računalniki slike vidijo kot suhoparno zaporedje števil. Slika 1 prikazuje zgled takega zaporedja. Lahko iz slike ugotovimo, kaj to zaporedje števil predstavlja? Najbrž zelo težko. Odgovor se skriva na sliki 2: zaporedje števil ustreza sliki črke »G«. Prepričan sem, da je marsikdo, ki je bil pred branjem tega sestavka trdno prepričan, da bi morali računalniki branje stresati iz rokava, po ogledu slik 1 in 2 spremenil mnenje in se kar naenkrat začudeno sprašuje, kako je sploh mogoče, da računalnike naučimo brati. Odgovor je preprost: »Težko!« Pa vendar, so načini, kako pravilno interpretirati kupe na videz neurejenih števil in ugotoviti, za katere črke gre.

DODATNO: Zgodovina OCR

Optično prepoznavanje znakov sega že v zgodnja petdeseta leta prejšnjega stoletja. Metode OCR so se sprva osredotočale na prepoznavanje črnih tiskanih črk na beli podlagi, kar označujemo z izrazom »klasični OCR«. V kasnejših letih so se metode postopoma izboljševale, v 60. in 70. letih pa so že nastale prve komercialne aplikacije OCR, ki so jih uporabljali v bankah, zavarovalnicah in podobnih ustanovah. Ker so aplikacije delovale slabo, so se s strani izdelovalcev sistemov OCR porodile težnje po standardizaciji pisav, ki bi izboljšali natančnost prepoznave. Tako sta se v 70. letih razvila nova nabora pisav, namenjena optični prepoznavi znakov, OCRA in OCRB, ki sta ju vpeljala ANSI (angl. American National Standards Institute) oziroma ECMA (angl. European Computer Manufacturers Association). Oba nabora pisav je sprejela tudi organizacija ISO (angl. International Standards Organization).

Na telefonu obstaja kar nekaj odprtokodnih aplikacij za neposredno prepoznavanje znakov v posneti sliki, npr. Text Fairy (OCR Text Scanner). Tudi za računalnike z Windows okoljem obstajajo odprtokodni programi, a na računalniku je najlažje opraviti OCR preko brezplačnih spletnih strani, kot je na primer https://www.onlineocr.net/.

Google Sites

Report abuse