Por favor, use este identificador para citar o enlazar este ítem:
https://rima.ufrrj.br/jspui/handle/20.500.14407/21232| Tipo do documento: | Tese |
| Título: | Eficiência do Autora: um algoritmo para delineamento automático de áreas de referência para suporte à amostragem otimizada de solos |
| Otros títulos: | Efficacy of autoRA: algorithm for automatic delineation of reference areas to support optimized soil sampling |
| Autor: | Rodrigues, Hugo Machado |
| Orientador(a): | Ceddia, Marcos Bacis |
| Primeiro coorientador: | Vasques, Gustavo de Mattos |
| Primeiro membro da banca: | Ceddia, Marcos Bacis |
| Segundo membro da banca: | Anjos, Lúcia Helena Cunha dos |
| Terceiro membro da banca: | Pinheiro, Helena Saraiva Koenow |
| Quarto membro da banca: | Brandão, Diego Nunes |
| Quinto membro da banca: | Terra, Fabrício da Silva |
| Palabras clave: | Mapeamento Digital de Solos;Modelagem Preditiva;Estratégias de amostragem;Digital Soil Mapping;Predictive Modeling;Sampling Strategies |
| Área(s) do CNPq: | Agronomia |
| Idioma: | por |
| Fecha de publicación: | 17-feb-2025 |
| Editorial: | Universidade Federal Rural do Rio de Janeiro |
| Sigla da instituição: | UFRRJ |
| Departamento: | Instituto de Agronomia |
| Programa: | Programa de Pós-Graduação em Agronomia - Ciência do Solo |
| Citación: | RODRIGUES, Hugo Machado. Eficiência do Autora: um Algoritmo para delineamento automático de áreas de referência para suporte à amostragem otimizada de solos. 2025. 146 f. Tese (Doutorado em Agronomia, Ciência do Solo) - Instituto de Agronomia, Universidade Federal Rural do Rio de Janeiro, Seropédica, 2025. |
| Resumen: | O algoritmo autoRA é uma metodologia baseada em dados projetada para delinear Áreas de Referência (ARs) que capturam fatores críticos de formação do solo, aprimorando os fluxos de trabalho de mapeamento digital do solo (MDS). Ao aproveitar o Índice de Dissimilaridade de Gower, o autoRA determina sistematicamente o tamanho ideal da área alvo e as configurações de resolução espacial, equilibrando desempenho preditivo e custo-benefício. Para avaliar sua eficácia, o autoRA foi testado em três cenários distintos. No primeiro cenário, realizado no Rio de Janeiro e na Flórida, examinamos o efeito da resolução espacial no cálculo do Índice de Gower e o impacto do tamanho da área-alvo no desempenho do modelo. O modelo preditivo foi desenvolvido para estimar uma Superfície Teórica Simulada (STS) usando uma única iteração. O Modelo de Área de Referência (MAR) ideal com uma área alvo de 50% e um tamanho de bloco de 10 pixels alcançou valores de Distância Euclidiana (DE) (0,15 no Rio de Janeiro e 0,38 na Flórida), aproximando-se dos resultados da amostragem exaustiva e reduzindo os custos em aproximadamente 61% e 63%, respectivamente. No segundo cenário, o autoRA foi aplicado a uma classificação de unidade de solo já mapeada em Sátiro Dias, Bahia, Brasil. Como este estudo teve uma AR delineada manualmente por um especialista e amostras de solo coletadas de acordo com uma estrutura completa de perfil de solo, a autoRA foi aplicada usando as mesmas covariáveis do especialista. Testamos ARs com 10%, 20%, 30%, 40% e 50%, cruzando os limites das ARs propostas com os locais reais das amostras de solo. As amostras internas foram usadas para treinamento do modelo, enquanto as amostras externas validaram a extrapolação das predições. Com 40% de cobertura de AR, o erro de predição usando autoRA foi menor do que o da AR delineada manualmente. Além disso, mapas de classe de solo gerados manualmente e via autoRA foram comparados com 100 iterações de modelagem Random Forest usando a abordagem MDS convencional, onde os conjuntos de dados foram divididos aleatoriamente (70% de treinamento, 30% de validação). Essa validação iterativa confirmou a robustez das previsões do autoRA. O terceiro cenário explorou diferentes proporções de pixels classificados como baixa e alta Dissimilaridade de Gower. A mesma abordagem de treinamento interno e validação externa foi aplicada. Os resultados demonstraram que o foco em regiões de alta dissimilaridade permitiu a redução das áreas amostradas, mantendo a precisão preditiva. A abordagem de Área Total (AT) também foi testada com tamanhos de amostra variando de 100 a 1.000. O modelo AT desenvolvido usando 100 iterações de divisões de 70% a 30% mostrou que a redução do tamanho da amostra resultou em uma melhoria de 20% na DE em comparação com o benchmark de 1.000 amostras. O conjunto de dados de 800 amostras foi identificado como a referência ideal para modelagem de AT. Para testar o efeito do mosaico de áreas de alta e baixa dissimilaridade, mantivemos o limite de melhoria de 20% no DE, usando 800 como uma nova referência. Os resultados demonstraram que um conjunto de dados de 600 amostras focado no RA de 40% delineado pelo autoRA produziu métricas de ED comparáveis ao modelo previsto do AT- STS. A análise de sensibilidade usando simulações STS permitiu testes extensivos de configurações de parâmetros, confirmando que as configurações de autoRA mais eficazes priorizam regiões de alta dissimilaridade. Tão importante quanto determinar o número de pontos para uma previsão precisa é decidir onde colocá-los. A abordagem autoRA responde a essa pergunta simulando várias configurações, fornecendo expectativas de precisão e custo, honrando o conhecimento da dissimilaridade da paisagem e evitando amostragem redundante. |
| Abstract: | The autoRA algorithm is a data-driven methodology designed to delineate Reference Areas (RAs) that capture critical soil-forming factors, enhancing digital soil mapping (DSM) workflows. By leveraging Gower’s Dissimilarity Index, autoRA systematically determines optimal target area size and spatial resolution configurations, balancing predictive performance and cost-effectiveness. To evaluate its efficacy, autoRA was tested in three distinct scenarios. In the first scenario, conducted in Rio de Janeiro and Florida, we examined the effect of spatial resolution in calculating Gower’s Index and the impact of target area size on model performance. The predictive model was developed to estimate a Simulated Theoretical Surface (STS) using a single iteration. The optimal Reference Area Model (RAM) with a 50% target area and a 10-pixel block size achieved Euclidean Distance (ED) values (0.15 in Rio de Janeiro and 0.38 in Florida), closely approximating results from exhaustive sampling while reducing costs by approximately 61% and 63%, respectively. In the second scenario, autoRA was applied to an already mapped soil unit classification in Sátiro Dias, Bahia, Brazil. As this study had an RA manually delineated by a specialist and soil samples collected according to a complete soil profile framework, autoRA was applied using the same covariates as the specialist. We tested RAs at 10%, 20%, 30%, 40%, and 50%, intersecting the proposed RAs with the actual sample locations. The inner samples were used for model training, while the outer samples validated the extrapolation of predictions. At 40% RA coverage, the prediction error using autoRA was lower than that of manually delineated RA. Additionally, manual and autoRA-generated RA soil class maps were compared against 100 iterations of Random Forest modeling using the conventional DSM approach, where datasets were randomly split (70% training, 30% validation). This iterative validation confirmed the robustness of autoRA’s predictions. The third scenario explored different proportions of pixels classified as low or high Gower’s Dissimilarity. The same inner-training, outer-validation approach was applied. The results demonstrated that focusing on high-dissimilarity regions allowed for the reduction of sampled areas while maintaining predictive accuracy. The Total Area (TA) approach was also tested with sample sizes ranging from 100 to 1,000. The TA model developed using 100 iterations of 70%-30% splits showed that reducing the sample size resulted in a 20% ED improvement compared to the 1,000-sample benchmark. The 800-sample dataset was identified as the optimal benchmark for TA modeling. To test the effect of mosaicking high- and low-dissimilarity areas, we maintained the 20% ED improvement threshold, using 800 as a new benchmark. The results demonstrated that a 600-sample dataset focused within the 40% RA delineated by autoRA produced ED metrics comparable to the TA-STS predicted model. Sensitivity analysis using STS simulations allowed for extensive testing of parameter configurations, ultimately confirming that the most effective autoRA settings prioritize high-dissimilarity regions. As important as determining the number of points for an accurate prediction is deciding where to place them. The autoRA approach answers this question by simulating multiple configurations, providing expectations of accuracy and cost while honoring the knowledge of landscape dissimilarity and avoiding redundant sampling. |
| URI: | https://rima.ufrrj.br/jspui/handle/20.500.14407/21232 |
| Aparece en las colecciones: | Doutorado em Agronomia - Ciência do Solo |
Se for cadastrado no RIMA, poderá receber informações por email.
Se ainda não tem uma conta, cadastre-se aqui!
Ficheros en este ítem:
| Fichero | Descripción | Tamaño | Formato | |
|---|---|---|---|---|
| 2025 - Hugo Machado Rodrigues.pdf | 5.97 MB | Adobe PDF | ![]() Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.
