A partir do momento em que o PDF-A passou a ser uma norma aberta, os programadores puderam começar a trabalhar em aplicações para manipulação deste tipo de ficheiros.
pdfedit
sudo apt-get install pdfedit
popler-utils - pacote que já vem instalado no Ubuntu
Pdf toolkit (pdftk)
O PDF toolkit é um conjunto de ferramentas fantástico permite separar as páginas de um ficheiro ou agrupar vários ficheiros num novo ficheiro, rodar um ficheiro ou apenas algumas páginas e muito mais.
instalar (em distribuições baseadas no debian, ex. ubuntu)
sudo apt-get install pdftk
pdfgrep - idêntico ao comando grep mas em ficheiros pdf.
Alguns exemplos de utilização do pdftk:
Rodar ficheiros - não se trata de fazer uma rotação temporária para leitura do ficheiro mas sim uma rotação permanente num ficheiro novo.
Rodar o ficheiro 90º para a Esquerda (Oeste - W)
pdftk ficheiro-original.pdf cat 1-endW output ficheiro-modificado.pdf
Rodar o ficheiro 90º para a Direita (Este - E)
pdftk ficheiro-original.pdf cat 1-endE output ficheiro-modificado.pdf
Rodar o ficheiro 180º para a Direita (Sul - S)
pdftk ficheiro-original.pdf cat 1-endS output ficheiro-modificado.pdf
Rodar o ficheiro 180º para a Esquerda (Norte - N)
pdftk ficheiro-original.pdf cat 1-endN output ficheiro-modificado.pdf
Rodar a primeira página de um ficheiro 90º para a Esquerda (Oeste - W)
pdftk ficheiro-original.pdf cat 1W output ficheiro-modificado.pdf
Rodar a segunda página de um ficheiro 90º para a Esquerda (Oeste - W)
pdftk ficheiro-original.pdf cat 2W output ficheiro-modificado.pdf
Rodar as páginas 1 até 9 de um ficheiro 90º para a Esquerda (Oeste - W)
pdftk ficheiro-original.pdf cat 1-9W output ficheiro-modificado.pdf
Consultar
Estrutura do comando
find /path -iname '*.pdf' -exec pdfgrep pattern {} +
Como encontrar stings em ficheiros PDF usando comandos de linha no Linux:
find /path -name '*.pdf' -exec sh -c 'pdftotext "{}" - | grep --with-filename --label="{}" --color "your pattern"' \;
(http://stackoverflow.com/questions/4643438/how-to-search-contents-of-multiple-pdf-files)