Revista Brasileira de Ciência do Solo (Apr 2013)
Comparison between artificial neural networks and maximum likelihood classification in digital soil mapping Comparação entre redes neurais artificiais e classificação por máxima verossimilhança no mapeamento digital de solos
Abstract
Soil surveys are the main source of spatial information on soils and have a range of different applications, mainly in agriculture. The continuity of this activity has however been severely compromised, mainly due to a lack of governmental funding. The purpose of this study was to evaluate the feasibility of two different classifiers (artificial neural networks and a maximum likelihood algorithm) in the prediction of soil classes in the northwest of the state of Rio de Janeiro. Terrain attributes such as elevation, slope, aspect, plan curvature and compound topographic index (CTI) and indices of clay minerals, iron oxide and Normalized Difference Vegetation Index (NDVI), derived from Landsat 7 ETM+ sensor imagery, were used as discriminating variables. The two classifiers were trained and validated for each soil class using 300 and 150 samples respectively, representing the characteristics of these classes in terms of the discriminating variables. According to the statistical tests, the accuracy of the classifier based on artificial neural networks (ANNs) was greater than of the classic Maximum Likelihood Classifier (MLC). Comparing the results with 126 points of reference showed that the resulting ANN map (73.81 %) was superior to the MLC map (57.94 %). The main errors when using the two classifiers were caused by: a) the geological heterogeneity of the area coupled with problems related to the geological map; b) the depth of lithic contact and/or rock exposure, and c) problems with the environmental correlation model used due to the polygenetic nature of the soils. This study confirms that the use of terrain attributes together with remote sensing data by an ANN approach can be a tool to facilitate soil mapping in Brazil, primarily due to the availability of low-cost remote sensing data and the ease by which terrain attributes can be obtained.O levantamento de solos é a principal fonte de informação espacial sobre solos para diferentes usos, principalmente o uso agrícola. No entanto, a continuidade dessa atividade tem sido grandemente comprometida, principalmente pela escassez de recursos financeiros. O objetivo deste estudo foi avaliar a eficiência da utilização de dois classificadores distintos (redes neurais artificiais - RNAs e o algoritmo da máxima verossimilhança - Maxver) na predição de classes de solos em uma área na região noroeste do Estado do Rio de Janeiro. As variáveis discriminantes usadas incluem atributos do terreno, como elevação, declividade, aspecto, plano de curvatura e índice topográfico combinado (CTI) e índices clay minerals, iron oxide e de vegetação NDVI, derivados de uma imagem do sensor ETM+ do LANDSAT 7. Para o treinamento e a validação dos classificadores, foram utilizadas, respectivamente, 300 e 150 amostras por classe de solo, representativas das características dessas classes, com relação às variáveis discriminantes utilizadas. De acordo com os testes estatísticos realizados, o classificador com base na RNA produziu maior exatidão do que o classificador clássico da máxima verossimilhança (Maxver). A comparação com 126 pontos de referência coletados no campo evidenciou que o mapa produzido pela RNA teve desempenho superior (73,81 %) ao mapa produzido pelo algoritmo Maxver (57,94 %). As principais causas de erros detectadas na utilização desses classificadores foram: a heterogeneidade geológica da área aliada a problemas no mapa geológico utilizado; profundidade do contato lítico e, ou, exposição da rocha; e problemas com o modelo de correlação ambiental utilizado em razão da natureza poligenética dos solos. Os resultados obtidos permitem inferir que a utilização de atributos do terreno juntamente com dados de sensoriamento remoto em uma abordagem por RNAs pode contribuir para facilitar o mapeamento de solos no Brasil, principalmente por causa da disponibilidade de dados de sensores remotos a custos mais baixos e da facilidade de obtenção dos atributos do terreno.