Use este identificador para citar ou linkar para este item: https://repositorio.uema.br/jspui/handle/123456789/4521
Registro completo de metadados
Campo DCValorIdioma
dc.creatorNeto, Jonas Carvalho de Sousa-
dc.date.accessioned2025-03-31T17:16:20Z-
dc.date.available2025-03-31-
dc.date.available2025-03-31T17:16:20Z-
dc.date.issued2025-02-17-
dc.identifier.citationSOUSA NETO, Jonas Carvalho de. Similaridade Semântica entre Processos Judiciais: Uma Abordagem para Identificação de Litigância Predatória. 2025. 64 f. Monografia (Graduação em Engenharia de Computação) – Centro de Ciências Tecnológicas, Universidade Estadual do Maranhão, São Luís-MA, Brasil, 2025. Disponível em:https://repositorio.uema.br/jspui/handle/123456789/4521pt_BR
dc.identifier.urihttps://repositorio.uema.br/jspui/handle/123456789/4521-
dc.description.abstractAccording to the National Council of Justice, the Brazilian Judiciary receives more than 30 million court cases every year. This excessive volume of data highlights the need for automated solutions to increase the efficiency and productivity of the judicial system. In this scenario, one of the challenges faced is predatory litigation, characterized by the filing of lawsuits in bad faith, in which the same parties (plaintiff, defendant and lawyer) submit multiple claims on the same issue, generating exhaustion of judicial resources. In 2020, around 30% of civil and consumer law cases were classified as predatory litigation, generating a minimum cost of R$ 10.7 billion to the judiciary. In addition to the financial losses, this practice overloads judges and civil servants, increasing the time it takes to process legitimate cases and compromising the efficiency of the system. This paper investigates the use of embeddings based on Transformers, such as Bidirectional Encoder Representations from Transformers, to analyze predatory litigation patterns by means of semantic similarity. These models are capable of capturing the semantic meaning of words and phrases, considering the context in which they are inserted. Information Retrieval techniques were used to construct and evaluate the research, which allows the effectiveness of the models to be measured in identifying semantically similar cases. Four language models were evaluated (BERTikal, BERTimbau, BumbaBERT Small and RoBERTa ptBR), of which BERTimbau had the best performance (Recall@k of 69.23% and MAP of 35.58%), followed by BumbaBERT Small (Recall@k of 61.54% and MAP of 31.13%). Other models tested performed less well. These results demonstrate the viability of the proposal, contributing to the automation of tasks in the Judiciary and advances in Natural Language Processing techniquespt_BR
dc.languageporpt_BR
dc.publisherUniversidade Estadual do Maranhãopt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectSimilaridade semânticapt_BR
dc.subjectRepresentações vetoriaispt_BR
dc.subjectLitigância predatóriapt_BR
dc.subjectRecuperação da informaçãopt_BR
dc.subjectSemantic similaritypt_BR
dc.subjectPredatory litigationpt_BR
dc.subjectVector representationspt_BR
dc.subjectInformation retrievalpt_BR
dc.titleSimilaridade Semântica entre Processos Judiciais: Uma Abordagem para Identificação de Litigância Predatóriapt_BR
dc.title.alternativeSemantic Similarity between Legal Proceedings: An Approach to Identifying Predatory Litigationpt_BR
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.creator.Latteshttp://lattes.cnpq.br/2972328786689274pt_BR
dc.contributor.advisor1Justino, Adrielson Ferreira-
dc.contributor.advisor1IDhttps://orcid.org/0000-0002-0760-1947pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0668222305492603pt_BR
dc.contributor.referee1Lavareda, Antônio Fernando-
dc.contributor.referee1IDhttps://orcid.org/0000-0002-9415-7265pt_BR
dc.contributor.referee1Latteshttp://lattes.cnpq.br/4510520291728075pt_BR
dc.contributor.referee2Carmo, Fabrício Almeida do-
dc.contributor.referee2IDhttps://orcid.org/0000-0003-3163-1094pt_BR
dc.contributor.referee2Latteshttp://lattes.cnpq.br/5415578583738595pt_BR
dc.description.resumoSegundo o Conselho Nacional de Justiça, o Poder Judiciário Brasileiro recebe anualmente mais de 30 milhões de processos judiciais. Esse volume excessivo de dados evidencia a necessidade de soluções automatizadas para aumentar a eficiência e a produtividade do sistema judiciário. Nesse cenário, um dos desafios enfrentados é a litigância predatória, caracterizada pela protocolação de ações judiciais de má-fé, nas quais as mesmas partes (autor, réu e advogado) submetem múltiplas demandas da mesma problemática, gerando esgotamento dos recursos do judiciário. Em 2020, cerca de 30% dos processos de Direito Civil e do Consumidor foram classificados como litigância predatória, gerando um custo mínimo de R$ 10,7 bilhões ao Judiciário. Além dos prejuízos financeiros, essa prática sobrecarrega magistrados e servidores, aumentando o tempo de tramitação de processos legítimos e comprometendo a eficiência do sistema. Este trabalho investiga a utilização de embeddings baseados em Transformers, como o Bidirectional Encoder Representations from Transformers, para análise de padrões de litigância predatória por meio de similaridade semântica. Esses modelos são capazes de capturar o significado semântico de palavras e frases, considerando o contexto em que estão inseridas. Para a construção e avaliação da pesquisa, foram utilizadas técnicas de Recuperação de Informação, que permite medir a eficácia dos modelos na identificação de casos semanticamente semelhantes. Foram avaliados quatro modelos de linguagem (BERTikal, BERTimbau, BumbaBERT Small e o RoBERTa ptBR), dentre os quais o BERTimbau obteve o melhor desempenho (Recall@k de 69,23% e MAP de 35,58%), seguido pelo BumbaBERT Small (Recall@k de 61,54% e MAP de 31,13%). Outros modelos testados apresentaram desempenho inferior. Estes resultados demonstram a viabilidade da proposta, contribuindo para a automação de tarefas no Judiciário e avanços nas técnicas de Processamento de Linguagem Naturalpt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentCampus São Luis Centro de Ciências Tecnológicas – CCTpt_BR
dc.publisher.initialsUEMApt_BR
dc.subject.cnpqCiência da Computaçãopt_BR
Aparece nas coleções:Curso de Bacharelado em Engenharia da Computação - CCT UEMA - Monografias

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TCC - JONAS CARVALHO DE SOUSA NETO - ENGENHARIA DA COMPUTAÇÃO CCT UEMA 2025.pdfPDF A1.54 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.