Artigo Acesso aberto Produção Nacional Revisado por pares

Regressão linear múltipla e modelo Random Forest para estimar a densidade do solo em áreas montanhosas

2016; Embrapa Informação Tecnológica; Volume: 51; Issue: 9 Linguagem: Português

10.1590/s0100-204x2016000900041

ISSN

1678-3921

Autores

Waldir de Carvalho, Braz Calderano Filho, C. da S. Chagas, S. B. Bhering, N. R. Pereira, Helena Saraiva Koenow Pinheiro,

Tópico(s)

Soil Geostatistics and Mapping

Resumo

Resumo O objetivo deste trabalho foi o desenvolvimento de modelos com diferentes conjuntos de dados, para estimar a densidade de solos de regiões tropicais montanhosas, a partir de atributos de solos comumente encontrados nas análises de perfis de solos descritos nos levantamentos regionais. O conjunto total de dados compõe-se de 163 amostras e foi dividido em seis grupamentos, dos quais três com 73 amostras, com o máximo de 32 covariáveis, e três com 163 amostras, com o máximo de 18 covariáveis. Testaram-se modelos de regressão linear múltipla (RLM) e randomForest (RF). A menor incerteza entre os modelos foi alcançada pelo RLM2, com R2 de 0,56, 13 covariáveis e 73 amostras. Nos grupamentos com 163 amostras, os melhores modelos foram os RF, com R2 médio de 0,48. A raiz quadrada da média do erro ao quadrado variou entre 0,09 e 0,14. As covariáveis mais importantes no modelo RF foram: carbono orgânico, hidrogênio, areia fina e grossa, saturação por bases e capacidade de troca catiônica. Pelo método "stepwise regression", as variáveis mais importantes foram: a relação silte/argila; areia grossa e fina; carbono orgânico; saturação por bases; e potássio.

Referência(s)