La digitalización es el proceso de transformar procesos analógicos y objetos físicos en digitales. Considera cómo el escaneo de documentos de papel o el uso del almacenamiento en la nube para guardar todos tus archivos importantes. Todo aquello que antes hacíamos sin conexión y en papel ahora se volvió completamente digital gracias a la digitalización y tecnologías digitales mucho más eficaces.
Como la información del mundo real tiene multitud de formas para que la computadora pueda reconocer la escritura manual o un texto impreso, el escáner o cualquier otro dispositivo de entrada debe digitalizar la información (convertirla a un formato digital), existen una gran cantidad de dispositivos de entrada para capturar y digitalizar dicha información. Desde un escáner común hasta una cámara digital.
Un digitalizador de vídeo es un conjunto de circuitos que pueden capturar la entrada procedente de una cámara de vídeo, un reproductor, la televisión o cualquier otra fuente y convertirla a una señal digital que puede almacenarse en memoria y mostrarse en los monitores de cualquier computadora.
Los digitalizadores de audio contienen los elementos necesarios para digitalizar sonidos procedentes de un micrófono o cualquier otro dispositivo de audio. Estos sonidos pueden almacenarse en la memoria de una computadora y modificarse a discreción.
Colección de información completa con nombre, como un programa o un documento creado por el usuario. Es una recopilación de datos que un usuario puede recuperar, cambiar, eliminar, guardar, imprimir o enviar por correo electrónico. También podemos decir que es la unidad básica de información que le permite a una computadora distinguir entre conjunto de datos diferentes. Estos tienen nombre, un punto y extensión, ej: tu_nombre.doc. +Info
Archivos de texto plano
.html/.htm: El lenguaje en el cual están escritos los documentos Web.
.txt: Estos archivos pueden ser vistos con un simple editor de texto.
Documentos con formato
.doc /.docx: Un formato de PC común para archivos de textos formateados.
.pdf: formato de documento portátil, este tipo de archivo requiere un lector de documentos PDF.
Archivos ejecutables y comprimidos
.exe: Archivo ejecutable.
.zip: Estos archivos están comprimidos mediante algún software capaz de realizar dicha acción.
Archivos de gráficos
.gif: Generalmente las animaciones de las páginas tienen este formato.
.jpg/.jpeg: Un popular estándar de compresión usado para fotografías e imágenes inmóviles.
.bmp: Mapa de bits de Windows.
Archivos de sonido
.mp3: El formato de archivo más popular en la Web para la distribución de música con calidad de CD.
.wav: El formato de sonido nativo para Windows.
Archivos de video
.avi: El formato de video estándar para Windows. Se ejecuta con Windows Media Player.
.mpg/mpeg: estándares de codificación de archivos y así garantizar una compatibilidad.
.mp4: es el formato más extendido y con mejor soporte por parte de los navegadores.
El OCR (Optical Character Recognition) es un software de reconocimiento de texto que saca de una imagen el texto que contiene y lo transforma en cadenas de caracteres para guardarlos en un formato que se pueda utilizar en programas de edición de texto.
Cuando tenemos una imagen (ya sea una fotografía o un documento que hayamos escaneado), el texto que contiene forma parte de esa imagen, al igual que cualquier elemento de la misma (un dibujo o un esquema, por ejemplo). Pues bien, si necesitamos extraer ese texto para poder editarlo, necesitamos un programa de OCR que reconozca dicho texto y lo transforme en una cadena de caracteres (ya sea ASCII o Unicode) y posteriormente copiar esta cadena a un programa de edición para ya poder trabajar con ella, con el consiguiente ahorro de tiempo al no tener que teclear este texto.