Please use this identifier to cite or link to this item:
https://rima.ufrrj.br/jspui/handle/20.500.14407/14321
Tipo do documento: | Dissertação |
Title: | Tratamento de grandes volumes de dados hidrometeorológicos apoiados por validação cruzada em Workflows científicos |
Other Titles: | Treatment of large volumes of hydrometeorological data supported by cross-validation in scientific workflows |
Authors: | Tomaz, Ulisses Roque |
Orientador(a): | Cruz, Sérgio Manuel Serra da |
Primeiro coorientador: | Gregório, Ronaldo Malheiros |
Primeiro membro da banca: | Santos, Ednaldo Oliveira dos |
Segundo membro da banca: | Manhães, Laci Mari Barbosa |
Keywords: | Workflow científico;validação cruzada;proveniência;Scientific workflow;cross-validation;provenance |
Área(s) do CNPq: | Matemática |
Idioma: | por |
Issue Date: | 19-Sep-2016 |
Publisher: | Universidade Federal Rural do Rio de Janeiro |
Sigla da instituição: | UFRRJ |
Departamento: | Instituto de Ciências Exatas |
Programa: | Programa de Pós-Graduação em Modelagem Matemática e Computacional |
Citation: | TOMAZ, Ulisses Roque. Tratamento de grandes volumes de dados hidrometeorológicos apoiados por validação cruzada em Workflows científicos. 2016. 117 f. Dissertação (Mestrado em Modelagem Matemática e Computacional) - Instituto de Ciências Exatas, Universidade Federal Rural do Rio de Janeiro, Seropédica - RJ, 2016. |
Abstract: | Obtergrandes volumes de dados meteorológicos de qualidade e livre de falhas são grandes desafios para estudos climáticos ambientais.O estudo de dados pluviométricos é de grande importância no dia a dia, pois viabiliza o entendimento da variabilidade espacial da precipitação em uma região ou bacia hidrográfica o que possibilita determinar o período e avaliar a probabilidade da ocorrência de eventos extremos, sendo de suma importância para as ações associadas ao planejamento urbano, industrial e agropecuário, além do uso racional dos recursos hídricos.No Brasil, eles são obtidos a partir de estações meteorológicas, geograficamente distribuídasem todo território e fornecidos por vários órgãos, principalmente, peloInstituto Nacional de Meteorologia (INMET)e pela Agência Nacional de Águas (ANA).No entanto, obter dados estruturados curados de qualidade e livre de falhas é um problema que ainda é estudado por diversos autores. Assim, detectar e preencher as falhas encontradas nos dados é um passo importante para o controle de qualidade. Neste sentido, este trabalho estuda e aplica o método de validação cruzada para a seleção dos métodos de interpolação (regressão linear, ponderação regional, inverso do quadrado da distância e ponderação regional com base em regressões lineares) no preenchimento de falhasde longas séries de dados pelo uso em workflows científicos. Para controlar, integrar e produzir essa massa de dados curados, as tarefas de computação se apoiaram na execução de experimentos científicosin silico voltados para a área da Meteorologia baseadas no paradigma dos workflows científicos, que capturaram descritores de proveniência, que auxiliam na rastreabilidade dos dados e processos, e assim, revelam como foram produzidos, e, ainda, asseguram a qualidade da metodologia aplicada. Esta pesquisa propôs, modelou e avaliou umworkflow científico com base em experimentos computacionais capazes de manipular grandes volumes de dados meteorológicos brutos, transformando-os em curados e estabelecendo sua proveniência. Além disso, a proposta consiste em armazená-los na base de dados compatível com o sistema Meteoro desenvolvido previamente pelo nosso grupo de pesquisas.Neste processo foram analisados os dados hidrológicos de 34 estações pluviométricas (séries com no mínimo 10 anos), de 77 inicialmente selecionadas e,dentre os métodos avaliados o que apresentou melhores resultados foi o da ponderação regional (PR). |
Abstract: | Researchers face several challenges in order to handle large volumes of high-quality meteorological data, free of missing (or gaps). The detailed comprehension of rainfall temporal data is important in daily activities such as in the evaluation of the distribution of rain in a given area. The proper study of such dataset may aid administrators in planning cities, industries and farmlands. In Brazil, meteorological dataset is collect by meteorological rainfall stations that are spread in the geographic space. Part of such dataset are maintained Agência Nacional de Águas (ANA) by means of HidroWeb system. Activities like detect and fill temporal series gaps are crucial to control the quality of meteorological data. This dissertation presents a computational approach based on scientific workflows and crossvalidation and interpolation methods to face the above-mentioned challenges. The interpolation methods we have used in this dissertation are linear regression,regional weighting, inverse square distance, regional weighting with linear regression. The scientific workflows we have developed are able to use the four methods to generate large volumes of high meteorological data; they are also able to collect retrospective provenance from the in silico experiments. Our experiments evaluated dataset from 34 (from 77) meteorological rainfall stations which the temporal serial has at least ten years of data. Our experimental results showed that the best results were achieved with PR method |
URI: | https://rima.ufrrj.br/jspui/handle/20.500.14407/14321 |
Appears in Collections: | Mestrado em Modelagem Matemática e Computacional |
Se for cadastrado no RIMA, poderá receber informações por email.
Se ainda não tem uma conta, cadastre-se aqui!
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
2016 - Ulisses Roque Tomaz.pdf | Ulisses Roque Tomaz | 20.48 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.