Nel prossimo passo andremo alla ricerca delle cifre numeriche all'interno della tabella di cui ora conosciamo l'esatta ubicazione delle caselline.
Prima di ricercare le cifre però è utile aumentare al massimo il contrastro fra i caratteri numerici e lo sfondo. Questa operazione è detta normalizzazione (normalization) o estensione del contrasto (contrast stretching).
Innanzitutto cominciamo con il ritagliare l'immagine (crop) in modo tale da "cancellare" l'area non contenente informazioni a noi utili. L'operazione di cancellazione consta semplicemente nel porre al valore di colore massimo (o minimo) i pixel appartenenti alla parte eccedente i bordi esterni della tabella. Il risultato è visibile in figura.
FIGURA 1: Cancellazione dell'imamgine al di fuori dei bordi esterni
Procediamo dunque a trovare il valori minimo e massimo dell'immagine. Per estendere al massimo il range di colori basterà applicare per ogni punto P dell'immagine la seguente semplice funzione:
Dove M ed m sono rispettivamente i valori (colori) minimo e massimo assunti dell'immagine ed A è il valore assoluto massimo (nel nostro caso, scala di grigi a 8bit, pari a 255).
Applicando tale funzione all'immagine si avrà la figura che segue.
FIGURA 2: Immagine normalizzata (esaltazione del contrasto)
Ora, sperando che chi ha creato lo schema abbia stampato numeri scuri su sfondo chiaro, procediamo ad effettuare una sogliatura in modo tale da ricavare nuovamente un'immagine binaria. Il valore di sogliatura lo poniamo a metà del range di valori ammissibili (0..255) ed otteniamo quanto riportato in figura.
FIGURA 3: Immagine binaria ricavata dopo la normalizzazione