«La reconnaissance optique de caractères (ROC), en anglais optical character recognition (OCR), ou océrisation, désigne les procédés informatiques pour la traduction d'images de textes imprimés ou dactylographiés en fichiers de texte.» Source: Wikipédia
Les intervenants en milieu scolaire doivent, à l'occasion, obtenir une version numérique d'un document (livre, manuel scolaire, examen, etc.) pour répondre à certains besoins de leurs élèves. Parfois, la version numérique du document n'étant pas offerte par l'éditeur, une numérisation de l'oeuvre est nécessaire. Les besoins se retrouvent principalement au niveau de l’adaptation ou de la reproduction numérique d’un document papier pour faciliter l’utilisation des fonctions d’aide technologique (synthèse vocale, mise en évidence du mot lu, etc.) auprès des élèves ayant des besoins particuliers. De plus, des intervenants utilisent la ROC lors de l’adaptation physique d’un document (grossissement des caractères, braille, etc.).
On obtient une version numérique d'un document papier en utilisant un appareil permettant la numérisation ou à l’aide d’un appareil photo numérique, d’un téléphone intelligent ou d’une tablette. Le document obtenu est de format PDF ou image (TIF, JPEG, PNG, etc.).
Toutes les écoles de la commission scolaire des Hauts-Bois de l'Outaouais sont équipées de photocopieurs permettant une numérisation rapide de bonne qualité et un transfert du fichier numérisé par courriel.
L’étape de ROC peut se faire pendant la numérisation avec certains appareils, à l’aide d’une application web ou avec un logiciel installé sur un poste informatique. Certains offrent la possibilité de vérifier et de valider le texte reconnu. Les coûts et la qualité finale varient beaucoup selon l’option choisie.
L’exportation en format PDF est l’option que l’on retrouve dans tous les types d’outils et d’applications permettant la ROC. Étant une image numérique du document, le document PDF est probablement le format qui respecte le plus la mise en page originale. Il faut cependant noter que la ROC effectuée n’est pas toujours identique au texte de l’image. La modification du document est très difficile et, dans certains cas, impossible.
Texte
Certaines applications permettent d’exporter le document en format texte (DOCX, DOC, ODJ, etc.) pour l’édition à l’aide de logiciel de traitement de texte comme Word, OpenOffice et LibreOffice. La mise en page (image, tableau, titre, etc.) n’est pas nécessairement fidèle à l’originale et varie beaucoup selon l’application choisie. Certains formats (TXT et RTF) ne conservent pas les éléments graphiques du document.
Audio
Des applications de ROC offrent la possibilité de produire un fichier audio (WAV, Mp3, etc.). Ce format offre donc un fichier pouvant être écouté à l'aide de divers outils technologiques (lecteur Mp3, téléphone intelligent, tablette, ordinateur, etc.).