Use este identificador para citar ou linkar para este item: https://repositorio.uema.br/jspui/handle/123456789/2471
Registro completo de metadados
Campo DCValorIdioma
dc.creatorPimentel, Cláudia Patrícia Silva-
dc.date.accessioned2024-03-27T20:59:24Z-
dc.date.available2024-03-26-
dc.date.available2024-03-27T20:59:24Z-
dc.date.issued2023-02-10-
dc.identifier.citationPIMENTEL, Cláudia Patrícia Silva. Aplicação de técnicas de aprendizagem de máquina com seleção de variáveis na previsão de receitas públicas de capitais brasileiras: estudo de caso das receitas transferidas de São Luís. 2023. 148f. (Dissertação).Mestrado Profissional em Engenharia da Computação e Sistemas, Centro de Ciências e Tecnológicas, Universidade Estadual do Maranhão, São Luís, 2023. Disponível em: https://repositorio.uema.br/handle/123456789/2471pt_BR
dc.identifier.urihttps://repositorio.uema.br/jspui/handle/123456789/2471-
dc.description.abstractRevenue forecasting is considered of great relevance for decision makers, as well as for planning. When it comes to the field of practical application, aimed at the Public Sector, regarding the municipal sphere, distortions are observed between the budgeted and predicted values, even applying the rules provided for in current legislation. The issue has been investigated by researchers with a history of advances in statistical regression methods and the application of machine learning techniques, but the problem of forecast divergences continues and legislation requires justification. In this context, it is necessary to investigate whether the price and quantity effects can be identified by machine learning techniques and whether revenue forecasting errors could be mitigated if the variables were used on an accrual basis for the inflow of resources. In this sense, this research aims to carry out a case study, with data from São Luís, to choose the variables that meet the legal prerogatives, adopting the CRISP- DM methodology, by comparing the list of importance of ensembles algorithms , Random Forests, Gradient Boosting and XGBoost, with a combined model of the wrapper filter approaches, submitting them to the same algorithms to choose the variables with the lowest evaluation metrics within a sequence of lowest errors of the transferred recipes. The document reports, as an execution comparison, the steps and tasks of the CRISP-DM in its first iteration, using data from the Transparency Portals, in the period from 2010 to 2021. In the results, two sets of data were compared, one with all transfers, including extraordinary amounts and another with only official quotas. The Combined Model obtained, in most of the results, the best metrics, especially in the extraordinary transfers, corroborating with the state of the art that already enshrines this approach, but the application of the Friedman test did not discard the null hypothesis, since the metrics of the two sets showed no significant differences. In the modeling, the RNN was complex and obtained the best metric, however, with the exception of the Mining resources, the difference in values was better in other algorithms and the Fridman test also did not have significant differences. As an answer to the research question, it was possible to clearly identify the quantity effect in both sets of data, but the price effect was not so evident in the results, appearing more when only the official quotas were tested.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Estadual do Maranhãopt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectPrevisão de receitas públicaspt_BR
dc.subjectTransferências constitucionais e legaispt_BR
dc.subjectAprendizagem de máquinapt_BR
dc.subjectSeleção de variáveispt_BR
dc.subjectCRISP-DMpt_BR
dc.subjectReceitas públicaspt_BR
dc.subjectEstudo de casopt_BR
dc.subjectSão Luís - MA - transferências de receitaspt_BR
dc.subjectMétodos de previsão de receitaspt_BR
dc.subjectPublic revenuept_BR
dc.subjectConstitutional and legal transferspt_BR
dc.subjectMachine learningpt_BR
dc.subjectDeep learningpt_BR
dc.subjectMetodologia CRISP-DMpt_BR
dc.subjectLista de importância de algoritmospt_BR
dc.subjectModelagem RNNpt_BR
dc.subjectAlgoritmo ensemblespt_BR
dc.subjectAlgoritmo Random Forestspt_BR
dc.subjectAlgoritmo Gradient Boostingpt_BR
dc.subjectAlgoritmo XGBoostpt_BR
dc.subjectCase study – machine learningen
dc.titleAplicação de técnicas de aprendizagem de máquina com seleção de variáveis na previsão de receitas públicas de capitais brasileiras: estudo de caso das receitas transferidas de São Luís.pt_BR
dc.typeDissertaçãopt_BR
dc.creator.Latteshttp://lattes.cnpq.br/3924712247492273pt_BR
dc.contributor.advisor1Jacob Junior, Antônio Fernando Lavareda-
dc.contributor.advisor1IDJACOB JUNIOR, A. F. L.pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/4510520291728075pt_BR
dc.contributor.referee1Cortes, Omar Andres Carmona-
dc.contributor.referee1IDCORTES, A. A. C.pt_BR
dc.contributor.referee1Latteshttp://lattes.cnpq.br/5523293886612004pt_BR
dc.contributor.referee2Lobato, Fábio Manoel França-
dc.contributor.referee2IDLOBATO, F. M. F.pt_BR
dc.contributor.referee2Latteshttp://lattes.cnpq.br/8320014491229434pt_BR
dc.contributor.referee3Marcacini, Ricardo Marcondes-
dc.contributor.referee3IDMARCACINI, R. M.pt_BR
dc.contributor.referee3Latteshttp://lattes.cnpq.br/3272611282260295pt_BR
dc.description.resumoConsidera-se a previsão de receitas de grande relevância para os tomadores de decisão, bem como para o planejamento. Quando se trata do campo de aplicação prática, voltado para o Setor Público, no que tange a esfera municipal, observam-se distorções entre os valores orçados e previsto, mesmo aplicando as regras previstas na legislação vigente. A questão tem sido investigada por pesquisadores com uma trajetória de avanços de métodos de regressão estatísticos e as aplicações de técnicas de aprendizagem de máquina, mas a problemática das divergências das previsões continua e a legislação exige justificativas. Neste contexto, faz-se necessário investigar se os efeitos preço e quantidade podem ser identificados por técnicas de aprendizagem de máquina e os erros de previsão das receitas poderiam ser mitigados se as variáveis fossem usadas pelo regime de competência do ingresso de recursos. Neste sentido, esta pesquisa tem o objetivo de realizar um estudo de caso, com os dados de São Luís, para escolher as variáveis que atendam as prerrogativas legais, adotando a metodologia CRISP-DM, por meio da comparação da lista de importância de algoritmos ensembles, Random Forests, Gradient Boosting e XGBoost, com um modelo combinado das abordagens de filtro com wrapper, submetendo-os aos mesmos algoritmos para escolher as variáveis com menores métricas de avaliação dentro de uma sequência de menores erros das receitas transferidas. No documento foram relatadas, como um comparativo de execução, as etapas e tarefas do CRISPDM em sua primeira iteração, utilizando os dados dos Portais da Transparência, no período de 2010 a 2021. Nos resultados, comparou-se dois conjuntos de dados, um com todos os repasses, incluindo os valores extraordinários e outro com apena as cotas oficiais. O Modelo Combinado obteve, na maioria dos resultados, as melhores métricas, especialmente, nos repasses extraordinários, corroborando com o estado da arte que já consagra esta abordagem, mas a aplicação do teste de Friedman não descartou a hipótese nula, pois as métricas dos dois conjuntos não apresentaram diferenças significativas. Na modelagem a RNN foi complexa obteve a melhor métrica, todavia, com exceção dos recursos da Mineração, a diferença dos valores foi melhor em outros algoritmos e o teste de Fridman também não teve diferenças significativas. Como resposta a questão de pesquisa foi possível identificar com clareza o efeito quantidade nos dois conjuntos de dados, mas o do preço não foi tão evidente nos resultados, aparecendo mais quando se testou apenas as cotas oficiais.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentCampus São Luis Centro de Ciências Tecnológicas – CCTpt_BR
dc.publisher.programPPG1pt_BR
dc.publisher.initialsUEMApt_BR
dc.subject.cnpqCiência da Computaçãopt_BR
Aparece nas coleções:Mestrado Profissional em Engenharia da Computação e Sistemas - CCT - Dissertações

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
DISSERTAÇÃO - CLÁUDIA PATRÍCIA SILVA PIMENTEL - PDF A _1.pdf13.28 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.