ambient@

CLASIFICACIÓN DIGITAL DE ZONAS FORESTALES USANDO DATOS LIDAR, ORTOFOTO Y ANÁLISIS ORIENTADO A OBJETOS

Eduardo González Ferreiro
Laura Barreiro Fernández
David MirandaLaboratorio del Territorio – Departamento de Ingeniería AgroforestalUniversidad de Santiago de Compostela. Escuela Politécnica Superior

Los ecosistemas forestales poseen características inherentes particulares a su situación geográfica (condiciones climáticas, composición del suelo, régimen de aprovechamiento, etc.), que las convierten en zonas con características únicas en el mundo. Por lo tanto, la existencia de información espacial precisa y actualizada para cada área forestal es de vital importancia para una gestión forestal adecuada. La planificación y gestión de las zonas forestales, así como de sus recursos, necesita un conocimiento previo de la superficie de análisis, con el fin de dotar a sus gestores de información suficiente que permita establecer políticas apropiadas a la realidad existente. Los mapas temáticos son una fuente importante de información, y generalmente se obtienen con técnicas automáticas o semiautomáticas de clasificación digital.

La clasificación digital es un proceso que permite categorizar una imagen concreta, reduciendo los niveles digitales detectados por el sensor a clases categóricas u ordinales, no siendo su objetivo buscar definiciones de cubiertas absolutas o universales aplicables a otras imágenes. Como resultado se obtiene una imagen temática donde cada píxel u objeto contiene un valor que define la clase asignada. Nada tiene que ver este valor temático con el nivel digital que contiene cada píxel antes de la clasificación. Las fuentes de información más habitualmente empleadas en las clasificaciones digitales son aquellas provenientes de sensores remotos aerotransportados o satelitales. 

Los sensores remotos permiten resolver algunas carencias de la visión humana, ampliando la perspectiva visual e informativa que percibimos del entorno. Con ellos obtenemos información a distancia de objetos situados en la superficie terrestre y somos capaces de explorar zonas del espectro electromagnético no visible, información ajena al ojo humano, amplificado de este modo el conocimiento que percibimos del medio que nos rodea. Los sensores fotográficos aerotransportados, como los empleados en el vuelo del Instituto Geográfico Nacional (IGN) para la ejecución del PNOA (Plan Nacional de Ortofotografía Aérea de España. Ministerio de Fomento, 2013), proporcionan imágenes que recogen información espectral. Sin embargo, esta información no siempre es suficiente en la discriminación de cubiertas forestales, debido a que numerosas especies presentan un comportamiento espectral similar.

Así por ejemplo, Álvarez (2005) realizó un inventario de la superficie ocupada por Pinus radiata D. Don en el Bierzo (Noroeste de España) empleando una imagen Landsat, que contiene siete bandas espectrales: azul, verde, roja, infrarrojo próximo, dos bandas de infrarrojo medio e infrarrojo térmico. Incluso con toda esta información espectral, la complejidad del estudio hizo que el mejor resultado alcanzado mostrase confusión entre las clases coníferas, frondosas, matorral y raso. Se obtuvieron valores del indicador de precisión KIA (Kappa Index of Agreement) modestos, especialmente en estas dos últimas categorías.

Es en este tipo de clasificaciones donde aparece la necesidad de combinar información procedente de diversas fuentes para obtener resultados más aproximados a la realidad. Diversos estudios apuntan que, el empleo de la tecnología LiDAR (Light Detection And Ranging) aerotransportada en la clasificación de zonas forestales, mejora los resultados obtenidos (Holmgren y Persson, 2004; Antonarakis et al., 2008; Gonçalves et al., 2008;. Ørka et al., 2009).

Los sistemas LiDAR aerotransportados son sensores remotos activos que han sido principalmente utilizados para la realización de levantamientos topográficos, pero cada vez más en la extracción de información del medio forestal. Su ventaja competitiva en el medio forestal radica en el comportamiento “semipermeable” que presentan las copas de los árboles respecto a la penetración de los pulsos LiDAR. Así, en zonas cubiertas de vegetación, la mayor parte de los pulsos LiDAR son reflejados de vuelta al sensor desde las hojas y ramas del dosel, sin embargo una cierta fracción de pulsos LiDAR llega al suelo debajo de las copas a través de pequeños huecos en las mismas. Los datos LiDAR pueden, por tanto, proporcionar información tridimensional acerca del tamaño y la estructura del dosel de copas y del terreno bajo las mismas.

A partir de estos datos es posible generar Modelos Digitales de Elevación (MDE) y Modelos Digitales de Copas (MDC), que recogen una gran cantidad de información sobre la vegetación por tratarse de representaciones tridimensionales y georreferenciadas de la realidad. Además, los datos LiDAR proporcionan valores de intensidad, que es un constituyente radiométrico de los mismos (Singh et al., 2010). La intensidad es registrada por el sensor como la cantidad de energía retrodispersada por la tierra o los objetos situados sobre la misma. Por tanto, LiDAR reconoce la variabilidad estructural de las masas en términos de distribución, altura y valores de intensidad, es decir, se pueden obtener una amplia variedad de capas de información para su uso en las clasificaciones digitales.

Voss y Sugumaran (2008) obtuvieron mejoras de entre un 9% y un 10% en la discriminación de coníferas y frondosas frente a otros tipos de cubiertas, en comparación  con una clasificación que sólo empleaba imágenes multiespectrales, al añadir un MDC y una capa de intensidad generados a partir de datos LiDAR. El MDC separó correctamente la vegetación alta de la vegetación baja y la intensidad se empleo para discriminar entre coníferas y frondosas. Arroyo et al. (2009) discriminó las seis clases vegetales más significativas de las sabanas tropicales de Australia, obteniendo valores muy precisos (Precisión Global da clasificación del 88%) a partir de datos LiDAR y de una imagen QuickBird, concluyendo que la integración de ambas fuentes de información produce un mapa de coberturas del suelo preciso, a pesar de la gran complejidad de la zona de estudio.

Por lo tanto el resultado de una clasificación depende de las capas de información entrantes, pero este no es el único factor influyente, ya que la elección de uno u otro método de clasificación también tiene influencia en el resultado final. Las clasificaciones orientadas a objetos (Object Based Image Analyst – OBIA) se están imponiendo sobre los métodos tradicionales de clasificación, que interpretan de forma independiente cada píxel sin tener en cuenta a los vecinos. El paradigma de la clasificación OBIA consiste en agrupar los píxeles primitivos en entidades significativas y consistentes (objetos   imagen), que recogen información espectral, variables de contexto y variables de forma. Estos objetos,  imagen o segmentos se adaptan mejor a las distintas geometrías de los diferentes tipos de cubiertas. Su superioridad quedó reflejada en el estudio de Gonçalves et al. (2008), que comparó los resultados obtenidos a partir de varios métodos de clasificación.  

La última fase de cualquier clasificación es la verificación de los resultados. Es necesaria para comprobar la calidad de los mismos y la validez del método empleado, permitiendo al usuario valorar el grado de acuerdo entre el resultado y la realidad, o dicho de otro modo, el riesgo que asume el usuario al tomar decisiones de gestión en base a la información generada. La verificación de resultados incluye las siguientes fases (Congalton y Green, 1998): (i) Diseño de muestreo, señalando cuantas parcelas, píxeles u objetos   imagen de validación deben medirse y como se seleccionan; (ii) toma de los datos de referencia; (iii) comparación de los datos de referencia con el resultado, mediante la generación de las matrices de confianza y la aplicación de varios test estadísticos y (iv) análisis de los errores encontrados.

El objetivo de este trabajo es presentar una metodología sencilla y ágil para la clasificación digital de zonas forestales, a partir de un estudio piloto en una zona de marcado carácter forestal, atendiendo a las distintas categorías de cubierta del suelo (coníferas, frondosas, matorral y zona rasa), combinando información espectral obtenida de una ortofotografía aérea digital con datos LiDAR y aplicando una posterior verificación de los resultados de la clasificación.  

Figura 1. Localización de la zona de estudio en Europa y Península Ibérica (a), CCAA de Galicia (b) y Provincia de Lugo y Municipio de Guitiriz (c).    

DATOS LIDAR, ORTOFOTOGRAFIA Y ZONA DE ESTUDIO 

 Los datos LiDAR se adquirieron en septiembre de 2007, usando un sensor Optech ALTM3025 (Optech Inc., Toronto, ON, Canada), que operó con una longitud de onda 1064 nm, con una frecuencia de repetición láser de 25 kHz, una frecuencia de escaneado de 200 Hz, un ángulo máximo de escaneo de ± 17º y altura de vuelo de 1.300 m sobre el nivel del mar. La superposición de las pasadas fue del 60 % y la densidad máxima de muestreo fue de 8 pulsos m‑2.

La ortofotografía pertenece al vuelo del IGN para el PNOA del año 2007, con un tamaño de píxel de 0.25 m de lado e información espectral de las bandas del rojo, verde, azul e infrarrojo próximo.

Se eligió como zona de estudio piloto un recuadro de 25 ha dentro del Término Municipal de Guitiriz (Figura 1c), que representaba de forma suficientemente amplia las diferentes tipologías de cubierta que se querían estudiar. La localización exacta de la zona de estudio es el recuadro definido por las siguientes coordenadas UTM huso 29N: 591.000‑4.784.500 y 591.500‑4.785.000.

ELABORACIÓN DEL MDE Y EL MDC 

Figura 2. MDE resultante.     

Se utilizaron varias herramientas implementadas en el LTK (LiDAR ToolKit de FUSION - McGaughey, 2012) para la generación del MDE. Los pasos fueron los siguientes: Primero, se separaron los primeros retornos de los últimos retornos de la nube de datos LiDAR con las herramientas FirstLastReturn; los últimos retornos serán los usados en la generación del MDE. En segundo lugar, se extrajeron los datos pertenecientes al terreno utilizado la herramienta GroundFilter, que implementa un algoritmo de filtrado adaptado de Kraus y Pfeifer (1998) y basado en predicción lineal (Kraus y Mikhail 1972). Por último, se utilizó la herramienta GridSurfaceCreate para generar una malla regular de datos, que representase el terreno en formato ráster. 

Esta herramienta calcula la elevación de cada celda de la malla como la media de todos los puntos LiDAR clasificados como terreno dentro de la celda, y si la celda no contiene ningún punto, genera un dato por interpolación a partir de las celdas vecinas. En la Figura 2 se puede ver el MDE resultante.  

En el caso del MDC se utilizaron únicamente los datos pertenecientes a los primeros retornos. La nube de puntos LiDAR normalizada se obtuvo restando la altura elipsoidal del MDE de la coordenada Z de cada retorno LiDAR con la herramienta ClipData. A continuación se utilizó la herramienta GridSurfaceCreate para la interpolación de los datos normalizados. Otra alternativa posible sería utilizar la herramienta CanopyModel igualmente implementada en el LTK de FUSION (McGaughey, 2012), pero se prefirió la combinación de las dos primeras por ofrecer un mayor abanico de posibilidades. En la Figura 3 se puede ver el MDC resultante. 

Figura 3. MDC con la ortofotografía digital superpuesta.      

CLASIFICACIÓN 

La clasificación se realizó en dos etapas: una clasificación inicial a nivel de píxel en la que se utilizó el MDC como información de entrada y una clasificación final orientada a objetos en la que se uso el índice de vegetación NDVI (Normalized Difference Vegetation Index) e información procedente de la clasificación inicial. Definiens® Developer 7.0 (Definiens Developer, 2008) fue el software utilizado tanto en la clasificación inicial como en la clasificación final.

Clasificación inicial

El MDC, que representa la altura normalizada (respecto al nivel del terreno) de la vegetación para cada píxel de 1 m de lado, representa información muy útil para discriminar diferentes  tipos de vegetación.

La segmentación previa a la clasificación inicial se realizó con el algoritmo Chessboard Segmentation (Definiens Developer, 2008),que dividió el MDC en objetos ‑ imagen de tamaño definido por el usuario y de forma cuadrada. En este caso, el tamaño de los objetos fue de 1 m de lado, de igual tamaño que los píxeles del MDC, por lo que se puede decir que esta clasificación inicial fue orientada a píxel.

Figura 4. Modelo Digital de Copas clasificado.   

El MDC fue reclasificado en tres intervalos de altura (m): [0 – 0,2]; (0,2 – 2,0] y (2,0 – hmáx), siendo hmáx la altura máxima de la vegetación en la zona de estudio. Los umbrales fueron determinados empíricamente a partir de observación en campo y de pruebas de ensayo ‑ error. Para clasificar cada objeto imagen en función de los anteriores intervalos de altura se empleo el algoritmo Classification (Definiens Developer, 2008), de forma que el MDC ráster quedó categorizado en las clases Raso, Matorral y Arbolado. Por último, se creo una capa temática en formato TIFF (Figura 4) con una tabla de atributos asociada que se empleará en el posterior análisis OBIA.

Clasificación final

Los índices de vegetación permiten discriminar cubiertas que tienen un comportamiento reflectivo distinto en dos o mas bandas del espectro electromagnético, entre otras aplicaciones. Para la identificación de zonas de vegetación se emplean de forma habitual las bandas del rojo e infrarrojo próximo, debido al particular comportamiento radiométrico de la vegetación sana, que presenta un gran contraste entre estas dos bandas. En este contraste espectral se basan la mayoría de los índices de vegetación. El NDVI (Rouse et al., 1973) fue el empleado en la clasificación, elegido por su facilidad de cálculo e interpretación. Este índice toma valores en el rango [-1, +1]; en general, valores de NDVI en torno a 0,1 indican presencia de vegetación, que será densa y vigorosa con valores de 0,5 o superiores. La definición de este índice se realiza con reflectividades, pero cuando no se pretende conceder un valor físico a los resultados, son varios los autores que emplean los niveles digitales (Chuvieco, 2007). Teniendo en cuenta esto, y que la finalidad del estudio es la de discriminar de forma automática las clases Coníferas, Frondosas, Matorral y Zona rasa para una zona de estudio en concreto, se emplearon los niveles digitales directamente proporcionados por la ortofotografía. En la zona de estudio se observó que un valor de NDVI = 0,41 resultaba crítico, permitiendo discriminar las clases Coníferas (NDVI ≥ 0,41) y Frondosas (NDVI < 0,41).

La segmentación previa a la clasificación, que permite generar los objetos ‑ imagen, se realizó con el algoritmo Multiresolution Segmentation (Definiens Developer, 2008). Este algoritmo parte de un tratamiento independiente de cada píxel y una posterior agrupación en función de criterios de homogeneidad (Shape y Compactness) y de resolución (Scale Parameter). Los valores adoptados son descritos en la Tabla 1.

Para la clasificación de los objetos   imagen se empleó un clasificador en árbol (Decisión tree classifier Definiens Developer, 2008). Este algoritmo discrimina secuencialmente a cada clase basándose en valores espectrales, variables texturales o información auxiliar que la definen, pudiendo ser considerado como un sistema experto sencillo (Skidmore, 1989). En este caso la información de partida proviene del NDVI. Por último, con el algoritmo Classification (Definiens Developer, 2008) se procedió a clasificar cada objeto   imagen de la zona de estudio según las reglas establecidas en el árbol de decisión. La Figura 5 muestra un diagrama de flujo que describe la lógica de la clasificación inicial y de la clasificación final. La Figura 6 muestra el resultado de la clasificación final y una comparación visual con la ortofotografía de la zona de estudio. 

Figura 5. Diagrama de Flujo. 
Figura 6. Zona de estudio clasificada y ortofotografía de referencia. 

VERIFICACIÓN DE LOS RESULTADOS 

La verificación de los resultados permite conocer el grado de ajuste entre la clasificación obtenida y la realidad, comparando la categoría real de un objeto   imagen con la asignada en el proceso de clasificación. Para tal fin se siguieron los pasos descritos por Congalton y Green (1998).

Figura 7. Muestras de validación seleccionadas.    

El primer paso fue seleccionar las muestras de validación sobre la ortofotografía digital. Para cada clase de cubierta se seleccionaron 20 objetos - imagen siguiendo un diseño de muestreo aleatorio. Algunos autores recomiendan un mínimo de 50 píxeles de validación por clase (Congalton, 1991), pero debido a que cada objeto - imagen está formado por un conjunto de píxeles, se consideró que 20 objetos - imagen proporcionarían un tamaño de muestra suficiente para la verificación de los resultados. Los objetos   imagen de validación seleccionados se muestran en la Figura 7. 

Con el fin de asignar de forma fidedigna una clase de referencia a cada una de las muestras, se realizó una interpretación visual de la ortofotografía y una posterior comprobación en campo. En el siguiente paso se compararon las muestras con el resultado de la clasificación, generándose varias medidas del error cometido y de la fiabilidad de la clasificación descritas en Chuvieco (2007): Matriz de confusión, Fiabilidad del usuario y del productor y Estadístico Kappa. Los resultados de la validación pueden verse resumidos en la Tabla 2.

Las confusiones más importantes se observaron entres las clases Coníferas y Matorral y en las clases Coníferas y Frondosas. En el primer caso 3 de las muestras seleccionadas para verificar la clase Coníferas se clasificaron erróneamente como Matorral. Probablemente este error se debe a que estas muestras se corresponden con coníferas de pequeño tamaño procedentes de repoblaciones recientes y que por lo tanto no superan los 2 m de altura (valor establecido como límite entre las clases Matorral y Coníferas). En el segundo caso, de los 20 objetos de validación para la clase Frondosas, 1 objeto se clasificó erróneamente como Coníferas. La Fiabilidad global mostró que el 95,2 % de los objetos de validación se clasificaron correctamente y el valor del Estadístico Kappa indicó que los resultados obtenidos son un 93,6 % mejores que los resultados esperados si la clasificación se hiciese por azar. 

CONCLUSIONES   

La validación de los resultados ha demostrado la eficacia de esta metodología de clasificación digital para entornos forestales en el noroeste de España. Las capas empleadas en la clasificación, procedentes de datos LiDAR y de ortofotografía aérea, junto con la clasificación orientada a objetos proporcionaron un alto grado de acuerdo entre la realidad y la clasificación. Este estudio demuestra que es posible clasificar de una forma sencilla y ágil coníferas, frondosas, matorral y zonas rasas.

La metodología aquí presentada u otras similares basadas en las mismas fuentes de datos poseen un gran potencial de uso, sobre todo teniendo en cuenta que el PNOA (Ministerio de Fomento, 2010) proporciona productos fotogramétricos con una cobertura periódica (dos a tres años) para el conjunto de España y que en la actualidad ya incluyen vuelos LiDAR de baja densidad (0,5 primeros retornos m 2), para la generación de los MDE. Esto resuelve uno de los principales problemas asociados tradicionalmente a la teledetección aérea, es decir, la pobre cobertura espacial y temporal. Por lo tanto, la metodología aquí presentada podría usarse para generar mapas temáticos para una descripción periódica de las zonas forestales cada vez que el PNOA proporcione nuevos datos.  

BIBLIOGRAFÍA 

Álvarez, F. 2005. Inventariación de las masas de Pinus radiata D. Don en El Bierzo (León) empleando teledetección con imágenes multiespectrales y clasificadores orientados a objetos. Trabajo final de Postgrado y Máster Internacional a distancia en SIG (Programa UNIGIS). Disponible en: http://www.cartesia.org/article.php?sid=183 (Acceso: 19/11/2013).

Antonarakis, A., Richards, K. y Brasington J. 2008 Object-based land cover classification using airborne Lidar. Remote Sensing of Environment. 112: 2988–2998.

Arroyo, L., Johansen, K., Armston, J. y Phinn, S. 2009. Integration of LiDAR and QuickBird imagery for mapping riparian biophysical parameters and land cover types in Australian tropical savannas. Forest Ecology and Management. 259: 598–606.

Chuvieco, E. 2007. Teledetección ambiental: La observación de la tierra desde el espacio (3ª edición). Barcelona: Editorial Ariel. 586 pp.

Congalton, R. 1991. A review of assessing the accuracy of classifications of remotely sensed data. Remote sensing of environment. 37: 35-46.

Congalton, R. y Green, K. 1998. Assessing the accuracy of remotely sensed data: Principles and practices (1st edition). London: Taylor & Francis (CRC Press). 160 pp.

Definiens Developer. 2008. Developer User Guide, Version 7. Munich: Definiens AG.

Gonçalves, G., Seco, L., Reyes, F., Miranda, D. y Coimbra, P. 2008. Land cover classification of rural areas using LiDAR data: a comparative study in the context of fire risk. SilviLaser 2008, Sept. 17-19, 2008 – Edimburgo. Pp. 427-436.

Holmgren, J. y Persson, A. 2004 Identifying species of individual trees using airborne laser scanner. Remote Sensing of Environment. 90: 415–423.

Kraus, K. y Mikhail, EM. 1972. Linear least squares interpolation. Photogrammetric Engineering. 38: 1016–1029.

Kraus, K. y Pfeifer, N. 1998. Determination of terrain models in wooded areas with airborne laser scanner data. ISPRS Journal of Photogrammetry and Remote Sensing. 53: 193–203.

McGaughey, R. (Ed.). 2012. FUSION/LDV: Software for LiDAR data analysis and visualization. USDA Forest Service, Pacific Northwest Research  Station. (Seattle, WA), 167 pp. Disponible en: http://forsys.cfr.washington.edu/fusion/FUSION_manual.pdf (Acceso: 19/11/2012).

Ministerio de Fomento (2013) Plan Nacional de Ortofotografía aérea. Especificaciones Técnicas para vuelo fotogramétrico digital con vuelo LiDAR. (Ministerio de Fomento: Madrid) Disponible en: http://www.ign.es/PNOA/ (Aceso: 07/nov/2013).

Orka, H., Næsset, E. y Bollandsås, O. 2009 Classifying species of individual trees by intensity and structure features derived from airborne laser scanner data. Remote Sensing of Environment. 113: 1163–1174.

Rouse, JW., Haas, RH., Schell, JA. y Deering, DW. 1973. Monitoring vegetation systems in the Great Plains with ERTS. 3rd ERTS Symposium, NASA SP-351 I, pp. 309–317.

Singh, KK., Vogler, JB. y Meentemeyer, RK. 2010. Estimation of land use in an urbanized landscape using lidar intensity data: A regional scale approach.  International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences. 38: 1–4.

Skidmore, A. 1989. An expert system classifies eucalypt forest types using Thematic Mapper data and a digital terrain model. Photogrammetric Engineering and Remote Sensing. 55: 1449–1464.

Voss, M. y Sugumaran, R. 2008. Seasonal effect on tree species classification in an urban environment using hyperspectral data, LiDAR, and an object-oriented approach. Sensors. 8: 3020–3036.