Sin descanso posible...

Elementos técnicos a considerar

Desde el punto de vista teórico hay varios aspectos que deben ser entendidos para manejar correctamente la información. Uno de los aspectos que he observado es que muchas personas aprenden cómo funciona un software, pero dedican menos esfuerzo a los datos en si y a cómo analizar un área (o viceversa). Si no sabemos lo que hacemos, el software no va a hacer magia por si solo, toca leer más. En este caso, indicamos algunos términos claves para facilitar la comprensión de lo que explicamos más adelante.

Modo de análisis Adaptado vs General

Modos de análisis Adaptado o General son dos aproximaciones que utilizamos para distinguir la forma en la que procesamos los datos y utilizamos las aplicaciones software en relación al nivel de integración con el área de estudio. En el primer caso, conocemos los datos de entrada, qué son, el orden con el que se leen, etc., de tal forma que el software puede actuar con conocimiento previo para procesarlos e incluso obtener nuevos indicadores a partir de la combinación de los anteriores, generando un archivo de salida con una estructura definida, más compleja y amplia. De esta forma, podemos sacarle mucho más partido a los datos. Es pues, un desarrollo adaptado a un lugar específico de trabajo, por ejemplo, para el Distrito Metropolitano de Quito existen en la actualidad más de 50 capas de información que se procesan en esta modalidad. No obstante, este modo tiene como problema que la incorporación de nuevos datos requiere programación, es decir, alterar el código del módulo donde se llevan a cabo los cálculos.

Por contrapartida, los datos en modo general pueden ser de cualquier tipo, esto es, el software actúa procesando los datos en el orden que especificamos en el archivo de configuración, pero sin conocer en realidad que son. Es por ello que el análisis es más limitado, si bien tiene la ventaja de poder operar en cualquier lugar y grupo de datos sin tener que alterar el código, solo preparando los archivos de configuración, que son simples archivos de texto. 

Unidad de Análisis Espacial vs dato raster

Hay que tener clara la diferencia entre una Unidad de Análisis Espacial (UAE) y un dato raster. El propósito de la primera es dividir el territorio según estructuras administrativas, en cuadrícula, etc. (polígonos). A partir de esta división se caracteriza cada uno de los polígonos que la componen como si fuera un área independiente. Esto implica que necesitamos un identificador (número único) que servirá de base para el proceso de rasterización que veremos más adelante. Si tenemos 10 polígonos vectoriales cuyos valores identificativos se mueven entre 1 y 10, el archivo raster resultante debe moverse también en esa franja. 

En este caso, el archivo o dato raster (que inicialmente puede estar representado vectorialmente) está integrado por categorías o tipologías. Por ejemplo, un mapa de susceptibilidad a movimientos en masa puede tener cientos de polígonos, pero el valor que nos interesa (en forma numérica) es el del nivel de peligro (bajo, medio, alto que pueden expresarse como 1, 2 y 3). Así, los valores del archivo raster que los contiene solo se moverá en esa franja. Este segundo tipo de raster tiene como cometido principal pasar su valor a la UAE, en términos de terreno ocupado por cada categoría, o bien a un elemento puntual (p.e. a que tipo de peligro está expuesto una edificación según su posición geográfica).

Saber cómo vamos a utilizar una u otra es fundamental antes de empezar a procesar la información. Por ejemplo, siguiendo con el ejemplo anterio de la susceptibilidad a movimientos en masa. Si queremos que esta capa trabaje como dato raster, los valores del mismo, tal como indicamos, se moveran entre 1 y 3. Si, por el contrario queremos analizar que pasa en cada polígono que representa un nivel de susceptibilidad dado, entones necesitamos agregar un autonumérico. Si hubieran 100 polígonos, la UAE resultante se movería en esos valores.

Importancia de la organización de los datos

Es MUY IMPORTANTE controlar bien desde el principio la estructura organizativa de la información vamos!, saber donde se guardan los archivos en el disco duro): donde está que, de dónde viene, para qué sirve y dónde se guardan los archivos de salida. Independientemente de la estructura de almacenamiento que el usuario decida, esta tiene que estar clara y ser respetada por todos los componentes del grupo. En nuestro caso utilizamos estructuras para almacenar archivos individuales, no geodatabases, ya veremos por qué más adelante. Esta estructura ha sido reorganizada en la nueva versión del software desarrollada en 2022 para facilitar la gestión de los datos.

Tiempo de respuesta

El tiempo de respuesta podemos dividirlo en dos partes, lo que tarda el pc en calcular y lo que necesita el usuario para preparar el dato antes de ser procesado. El primero ha sido reducido considerablemente, pueden ser unos pocos segundos o bien algunas horas según el tipo de análisis utilizado y tamaño de los archivos implicados. Un pc mejor, puede reducir este tiempo, pero no tiene necesariamente que ser muy evidente dado que no se está utilizando programación paralela. 

En realidad, donde más podemos reducir los tiempos de respuesta de procesado es en el manejo que realiza el usuario para operar el sistema. Cuanto más use la metodología y sus herramientas, más rápido podrá obtener la información que necesite. Este tiempo de respuesta se centra en comprender los datos de una ciudad, cómo están organizados, los problemas que pueden tener, entre otros y no solo la configuración del software previa a su ejecución. Al menos, se debería invertir varios meses hasta que se haya controlado las operaciones a realizar, antes de responder a emergencias. La ventaja es que podemos reducir mucho nuestra capacidad de manejo (salvo que tengas ya experiencia en el mundo Linux y en el manejo de aplicaciones en línea de comando, creo que al principio necesitarás muchas horas, pero tampoco tanto).

Otro tiempo está asociado al de preparación de los datos de entrada, tanto si son UAE como otras capas de información. Si el estado de los datos es bueno, el tiempo puede ser corto, pero si requieren muchos pre-procesados, podría llegar a semanas. Eso pasa con algunas de las capas de información que utilizamos en el Distrito Metropolitano de Quito, aunque el resultado final sea una simple columna más.

Conocer los datos

Todos los actores implicados deben conocer en todo momento, en mayor o menor medida, las características de los datos utilizados (metadatos), de tal forma que se sepan las limitaciones e incertidumbres de los resultados obtenidos. La defensa de los mismos en entornos hostiles es algo que puede ocurrir, especialmente si el problema analizado se ha politizado, así que toca estar preparado.