v Ubuntu 12.04, aby byl program cuneiform funkční musel se nainstalovat balíček cuneiform-refaktoring verze 0.9.0 (starší verze). S nástrojem tesseract vše OK.
1)
#### Launchpad PPA for tesseract; ocrfeeder (fronted pro OCR nástroj tesseract i cuneiform); yagf (fronted pro OCR nástroj cuneiform i tesseract); cuneiform-linux; gscan2pdf; gimp https://launchpad.net/~alex-p/+archive/notesalexp-precise
## Run this command: sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys CEF9E52D
deb http://ppa.launchpad.net/alex-p/notesalexp-precise/ubuntu precise main
2)
#### Launchpad PPA for gImageReader (fronted pro OCR nástroj tesseract) https://launchpad.net/~sandromani/+archive/gimagereader
## Run this command: sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys B4591784
deb http://ppa.launchpad.net/sandromani/gimagereader/ubuntu saucy main
3)
#### Launchpad PPA for ocropus (OCR analyzátor) http://code.google.com/p/ocropus/ https://launchpad.net/~alex-p/+archive/ocropus
## Run this command: sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys CEF9E52D
deb http://ppa.launchpad.net/alex-p/ocropus/ubuntu precise main
YAGF - je grafický (Qt) frontend pro OCR nástroj tesseract i cuneiform
gImageReader - grafický fronted pro OCR nástroj tesseract. - V Ubuntu 12.04 až 13.10 vše OK.
OCRFeeder - grafický fronted pro OCR nástroj tesseract i cuneiform
Pro funkční češtinu se musí ručně změnit parametry příkazu pro oba nástroje - tesseract i cuneiform.
Změna parametrů pro tesseract. Pro češtinu přidáme parametr -l ces.
Nástroje > Výkonné nástroje OCR > Upravit
$IMAGE $FILE -l ces; cat $FILE.txt; rm $FILE
U verze programu OCRFeeder 0.7 je parametr upraven pro mnoho jazyků. Bohužel pro český jazyk je v parametru chyba. Viz níže. Je nutno opravit cse na ces. Jinak v této verzi se nic neupravuje!
el:ell,en:eng,zh:chi-sim,af:afr,vi:vie,ca:cat,it:ita,kn:kan,cs:cse,ar:ara,atd...
Změna parametrů pro cuneiform. Pro češtinu přidáme parametr -l cze.
Nástroje > Výkonné nástroje OCR > Upravit
-l cze -f text -o $FILE $IMAGE > /dev/null 2> /dev/null && cat $FILE && rm $FILE
U verze programu OCRFeeder 0.7 je vše OK! Nic se pro nástroj cuneiform neupravuje.
en:eng,it:ita,cs:cze,et:est,atd...
1) Nainstalujeme balík wine
2) Stáhneme tyto zip archívy a vše rozbalíme:
Portable version (ZIP)
Portable Version (OCR Lang Files) > adresář ocrdats zkopírujte do adresáře PDFX_Vwr_Port
OCR Language Files (OCRAdditionalLangsEU.zip) > rozbalíme i exe soubor > innoextract OCRAdditionalLangsEU.exe (musí být nainstalován balík innoextract)
3) Z adresáře code:SetAppFolder|inst zkopírujeme do adresáře PDFX_Vwr_Port/ocrdats jazyky které budeme používat.
4) Asociujeme soubor PDFX_Vwr_Port/PDFXCview.exe s wine a povolíme spouštění tohoto souboru.