Pesquisa Agropecuária Brasileira (Sep 2016)

Regressão linear múltipla e modelo Random Forest para estimar a densidade do solo em áreas montanhosas

  • Waldir de Carvalho Junior,
  • Braz Calderano Filho,
  • César da Silva Chagas,
  • Silvio Barge Bhering,
  • Nilson Rendeiro Pereira,
  • Helena Saraiva Koenow Pinheiro

DOI
https://doi.org/10.1590/s0100-204x2016000900041
Journal volume & issue
Vol. 51, no. 9
pp. 1428 – 1437

Abstract

Read online Read online

Resumo O objetivo deste trabalho foi o desenvolvimento de modelos com diferentes conjuntos de dados, para estimar a densidade de solos de regiões tropicais montanhosas, a partir de atributos de solos comumente encontrados nas análises de perfis de solos descritos nos levantamentos regionais. O conjunto total de dados compõe-se de 163 amostras e foi dividido em seis grupamentos, dos quais três com 73 amostras, com o máximo de 32 covariáveis, e três com 163 amostras, com o máximo de 18 covariáveis. Testaram-se modelos de regressão linear múltipla (RLM) e randomForest (RF). A menor incerteza entre os modelos foi alcançada pelo RLM2, com R2 de 0,56, 13 covariáveis e 73 amostras. Nos grupamentos com 163 amostras, os melhores modelos foram os RF, com R2 médio de 0,48. A raiz quadrada da média do erro ao quadrado variou entre 0,09 e 0,14. As covariáveis mais importantes no modelo RF foram: carbono orgânico, hidrogênio, areia fina e grossa, saturação por bases e capacidade de troca catiônica. Pelo método "stepwise regression", as variáveis mais importantes foram: a relação silte/argila; areia grossa e fina; carbono orgânico; saturação por bases; e potássio.

Keywords