Estudiamos los diferentes tipos de archivos y su forma de acceso, como una introducción al tratamiento que se puede hacer de los datos y de la información.
A continuación, un breve resumen tomado de los apuntesde la clase 1 utilizados en la cátedra de Gestión de Datos de la carrera Ingeniería en Sistemas de Información., de la UTN-Facultad Regional Rosario.
Archivos
.Las estructuras de datos, en general, se definen y
utilizan sobre la memoria RAM y tienen existencia
mientras el programa se encuentra activo.
.Cuando es necesario tener persistencia en la
información que maneja un algoritmo, esta
información debe ser almacenada en un archivo.
Archivo: Colección de registros que abarcan entidades
con un aspecto común y originadas para algún
propósito particular.
.Se deben distinguir dos conceptos diferentes de
archivos pero interrelacionados:
•Archivo físico: Es el archivo residente en la
memoria secundaria y es administrado
(ubicación, tipos de operaciones disponibles)
por el sistema operativo.
•Archivo lógico: Es el archivo utilizado desde el
algoritmo. Cuando éste necesita operar con un
archivo, genera una conexión con el S. O.
(independencia física).
Acceso a los datos
•Secuencial: El acceso a cada dato se realiza luego
de haber accedido a su inmediato anterior.
•Secuencial indexado: El acceso a los datos se
realiza teniendo presente alguna organización
previa, sin tener en cuenta el orden físico.
•Directo: Es posible recuperar un dato con un solo
acceso, más allá de que exista un orden físico o
lógico predeterminado.
Operaciones sobre Archivos
.Las operaciones esenciales son:
•Alta: Ingreso de nuevos datos.
•Modificación: Alteración del contenido de algún
dato.
•Consulta: Presentación del contenido total o
parcial.
•Baja: Eliminación de datos (baja física, baja
lógica).
Búsqueda de información. Manejo
de índices
Cuando se realiza la búsqueda de un dato, se
deben considerar:
•La cantidad de accesos a disco en pos de
encontrarlo. Costo alto.
•La cantidad de comparaciones. Costo
relativamente bajo (despreciable).
.El proceso de búsqueda implica un análisis de
situaciones en función del tipo de archivo sobre el
que se quiere buscar información:
.Supongamos ahora que tenemos el problema de
encontrar libros en una biblioteca por autor, título o
tema.
•Compramos 3 copias de cada libro y 3 edificios de
biblioteca separados. Edificio1: libros ordenados
por autor; edificio 2: libros ordenados por título, y
Edificio 3: libros ordenados por tema (absurdo).
Supongamos que tenemos el problema de buscar un
tema en un libro, ¿cómo lo resolvemos?
•Recorremos página por página.
•Utilizamos el índice temático.
Índice: Estructura de datos adicional que permite
agilizar el acceso a la información almacenada en un
archivo.
.En el índice se almacenan las claves de los registros
del archivo, junto con la referencia de acceso a
cada registro asociado a la clave. Es necesario que
las claves permanezcan ordenadas.
.El índice es otro archivo con registros de longitud
fija, independiente de la estructura del archivo
original.
.Un índice posibilita imponer un orden en un archivo
sin que realmente este se reacomode.
Índice
¿cómo se genera y mantiene?
.Índice primario: creado a partir de la clave
primaria.
.Índices secundarios: Creados a partir de otros campos, considerados claves secundarias.