Metodologia

A metodologia empregada no trabalho é baseada no artigo de Jean, N. et al. (2016) , e em sua adaptação realizada por Triñanes et al. (2020). Essencialmente, ela consiste em quatro etapas: aquisição de dados, extração de features, treinamento de modelo e validação dos resultados.

1. Aquisição de Dados

Nesta primeira etapa, são coletados os indicadores e as imagens de satélite da zona estudada. A região do estudo foi dividida em clusters correspondentes aos municípios do território, cada qual sendo representado por uma coordenada geográfica central de latitude e longitude, totalizando 538 municípios. Os indicadores utilizados neste projeto foram coletados por intermédio do Nexus, a partir de estudos realizados pelo Instituto Nacional de Pesquisas Espaciais (INPE).

As imagens de satélite diurnas referentes a cada cluster foram obtidas através do Google Static Maps, cada uma com dimensões de 400 x 400 pixels e em formato PNG. Uma coordenada central de latitude e longitude é atribuída a cada imagem e através desta a imagem é relacionada ao indicador analisado. Por fim, é coletada uma imagem de proxy que serve para filtrar e descartar imagens de regiões que não sejam adequadas para o estudo. Por exemplo, quando se estuda o IDH, pode-se utilizar um proxy de imagens de luzes noturnas para identificar regiões com ocupação humana, descartando aquelas que são inabitadas e não ajudariam na análise.


2. Extração de Features

Nesta etapa, o algoritmo recebe um arquivo .csv com os indicadores, além das imagens baixadas, e utiliza uma técnica de transfer learning para identificar aspectos relevantes das imagens, de forma que facilite o treinamento do modelo na etapa seguinte. Primeiro, se utiliza uma rede neural convolucional (CNN) previamente treinada no ImageNet, um grande dataset de classificação de imagens composto de imagens rotuladas. Isso permite ao modelo identificar certas características das imagens, como por exemplo cantos e arestas.

Em seguida, com o uso da técnica de transfer learning, utiliza-se os dados extraídos das imagens de proxy (luzes noturnas, evapotranspiração), para pré-treinar o modelo extrator de features, que recebe como entrada imagens de satélite diurnas. Estas features extraídas das imagens de satélite são vetores de representação que contêm informações relevantes para a inferência dos indicadores.

3. Treinamento do modelo

O terceiro passo consiste no treinamento do modelo de regressão Ridge, também para cada um dos indicadores, alimentado com as features extraídas no passo anterior através de imagens de satélite diurnas. O modelo tem como saída os indicadores estimados, ou seja, os dados finais. O treinamento do modelo é feito por cluster, com cada um sendo treinado individualmente com as imagens disponíveis no dataset, um processo que é repetido até que a melhor correlação seja encontrada.

4. Validação de resultados

Finalmente, no último passo, realiza-se a validação dos modelos treinados para cada um dos indicadores. Para isso, é adotado o método de validação cruzada k-fold. Para a medição da acurácia (ou performance) do modelo, baseia-se na análise do coeficiente de determinação (R²), que indica o grau de correlação entre os indicadores real e previsto.

Artigos de referência

JEAN, N. et al. Combining satellite imagery and machine learning to predict poverty (2016). Science 19 Aug 2016: Vol. 353, Issue 6301, pp. 790-794.

TRIÑANES, E.; MACHICAO, J.; CORRÊA, P. (2020). Application of a deep learning algorithm for predicting socioeconomic data through satellite images in the Vale do Ribeira. Disponível em: <https://doi.org/10.5281/zenodo.4712815>