Bildet viser avansert utstyr som benyttes på Nasjonalbiblioteket til å skanne bøker, men som amatør trenger du langt enklere utstyr og mange ganger kanskje bare mobiltelefon
Generelt
Hvordan fungerer OCR?
Bildeinnhenting: Den første fasen involverer å hente inn et bilde av teksten. Dette kan gjøres med en skanner, et kamera eller en mobiltelefon.
Forbehandling: Bildet blir forbedret for å fjerne støy og forvrengninger. Dette kan inkludere å justere kontrasten, fjerne bakgrunner og rette opp skjeve bilder.
Tekstlokalisering: OCR-programvaren identifiserer områder i bildet som inneholder tekst.
Tegngjenkjenning: Programvaren sammenligner de identifiserte tekstområdene med en database av kjente tegn. Hvert tegn blir gjenkjent basert på dets form og pikselmønster.
Etterbehandling: Den gjenkjente teksten gjennomgår en siste kontroll for å rette feil og forbedre nøyaktigheten. Deretter kan teksten formateres og lagres i et digitalt format.
Nøyaktighet av OCR-teknologi
Nøyaktigheten til OCR-teknologi har forbedret seg betydelig de siste årene. Moderne OCR-programmer kan gjenkjenne tekst med en nøyaktighet på over 99% for maskinskrevet tekst. Nøyaktigheten for håndskrevet tekst er lavere, men kan også være ganske høy for lesbar håndskrift.
Generelle bruksområder for OCR-teknologi
OCR-teknologi har et bredt spekter av bruksområder, inkludert:
Digitalisering av papirdokumenter
Skanning av kvitteringer og fakturaer
Oversettelse av tekster
Håndtering av post
Lesehjelpemidler for personer med synshemming
Automatisk bildeteksting
For slektsforskeren er det et svært viktig verktøy for å samle tekst og annen informasjon for så å kunne bearbeide det i en tekstbehandler senere.
OCR-teknologi er et kraftig verktøy for å konvertere bilder av tekst til digitalt format. Den har et bredt spekter av bruksområder og fortsetter å forbedre seg over tid.
Hvordan gjenkjenner OCR-programmer bokstaver?
Det er to hovedmetoder OCR-programmer bruker for å gjenkjenne bokstaver:
Mønstergjenkjenning: Programvaren sammenligner mønsteret av piksler i et tegn med mønstrene i en database av kjente tegn. Dette er den mest vanlige metoden og fungerer bra for maskinskrevet tekst.
Nevrale nettverk: Nevrale nettverk er kunstig intelligens-modeller som kan lære å gjenkjenne mønstre. De kan trenes på store datasett av bilder og tekst for å forbedre nøyaktigheten. Nevrale nettverk er nyttige for å gjenkjenne håndskrevet tekst, som kan være mer variert og vanskelig å lese.
Gratis:
Tesseract: Open source OCR-motor med støtte for over 100 språk. Integrert i mange programmer.
Google Lens: App for Android og iOS som kan brukes til å gjenkjenne tekst i bilder.
Google Keep: innebygget OCR funksjonen i notater
Microsoft Office Lens: App for Android og iOS som kan brukes til å konvertere bilder av tekst til Word-dokumenter eller PowerPoint-presentasjoner.
Adobe Scan: App for Android og iOS som kan brukes til å skanne dokumenter og konvertere dem til PDF-filer.
FreeOCR: Gratis program for Windows, Mac og Linux.
Betalingsalternativer:
ABBYY FineReader: Kraftig OCR-program med støtte for over 190 språk.
Nuance Power PDF: Program for Windows og Mac som kan brukes til å konvertere PDF-filer til redigerbare Word-dokumenter.
OmniPage Ultimate: OCR-program for Windows og Mac med støtte for over 120 språk.
Kofax OmniPage: Kraftig OCR-program med støtte for over 300 språk.
Tjenester:
Amazon Textract: OCR-tjeneste fra Amazon Web Services.
Google Cloud Vision: OCR-tjeneste fra Google Cloud Platform.
Microsoft Azure Computer Vision: OCR-tjeneste fra Microsoft Azure.
IBM Watson Visual Recognition: OCR-tjeneste fra IBM Cloud.
Spesielle funksjoner:
Claro Read: App for Android og iOS som kan brukes til å lese tekst høyt med OCR-teknologi.
Prizmo Go: App for Android og iOS som kan brukes til å skanne tekst og oversette den til andre språk.
Valg av OCR-program eller tjeneste:
Det beste alternativet for deg avhenger av dine behov. Her er noen ting du bør vurdere:
Hvilket språk trenger du OCR for?
Hvor mye tekst trenger du å gjenkjenne?
Trenger du avanserte funksjoner, som oversettelse eller tekst-til-tale?
Hvor mye er du villig til å betale?
Tips:
De fleste OCR-programmer og tjenester tilbyr gratis prøveversjoner.
Du kan sammenligne forskjellige OCR-programmer og tjenester på nettsteder som https://www.techradar.com/best/best-ocr-software.
For best resultat, bruk bilder av høy kvalitet med god belysning.
Denne listen er ikke uttømmende. Det finnes mange andre OCR-programmer og tjenester tilgjengelig.
Etter å ha prøvd ut en rekke OCR-programmer har vi havnet på det aller enkleste som i våre øyne er Google keep.
Slik kan du bruke Google Keep til å konvertere bilder av tekst til redigerbar tekst (OCR). NB! Denne forklaringen er basert på at du bruker en Windows PC og at den har versjon 10 eller nyere.
1. Ta et utklipp fra skjermen (WIN+SHIFT+S) fra f.eks en side i en bygdebok:
Åpne nettleseren Google Chrome hvis du har laget utklippet fra en annen nettleser
Hvis dette er første gang du prøver dette så er den korteste veien følgende:
1. Åpne mailprogrammet ditt.
2. Åpne "Vaffelmenyen" den med 9 prikker øverst i høyre hjørne. Se bilde 1 under
3. Applikasjonen du velger her er Google Keep (Lyspære på gul bakgrunn) Se bilde 2 under
4. Åpne et nytt notat i Google Keep. I tekstfeltet limer du utklippet inn (CTRL. V)
2. Konvertere bildet til tekst:
Nå har bildet (utklippet) kommet på plass øverst i notatet.
Trykk på de tre prikkene nederst i menyen.
Velg i menyen "Hent tekst fra bilde". Se bilde 3 under
3. Rediger teksten:
Teksten fra bildet vil nå vises under bildet ferdig tolket og konvertert til redigerbar tekst.
Du kan redigere teksten som vanlig tekst i Google Keep.
Det finnes imidlertid mange andre foretrukne redigeringsverktøy som vi ikke kommer inn på her
Avhengig av hvor og hvordan du planlegger og bruker denne teksten må du alltid ta hensyn til copyright bestemmelsene.
Bildet viser øvre høyre hjørne i Google mail
Bildet viser ditt valg i applikasjonsnmenyen
Når bildet er lest inn i et notat er det her du trykker for å kjøre OCR på teksten
Hvilke fonter kan OCR-rutinen tolke?
OCR-rutinen i Google Keep kan tolke et bredt spekter av fonter, inkludert:
Vanlige sans-serif fonter som Arial, Verdana og Calibri
Serif-fonter som Times New Roman og Garamond
Skrivefonter som Comic Sans og Brush Script MT
Monospaced-fonter som Courier New
Kan OCR-rutinen konvertere gotisk skrift?
OCR-rutinen i Google Keep kan konvertere gotisk skrift, men nøyaktigheten kan variere. Det er best å bruke bilder av gotisk skrift med høy kvalitet og god kontrast mellom teksten og bakgrunnen.
Tips for å forbedre OCR-nøyaktigheten:
Bruk utklipp av best mulig kvalitet. Noen ganger kan det være nødvendig å etterbehandle utklippet for å øke kontrasten mellom bakgrunn og tekst. Dette vil gi en bedre gjenkjenning og dermed et bedre resultat.
Bruk bilder med god kontrast mellom teksten og bakgrunnen.
Unngå bilder med tekst som er for liten eller for stor.