Use este identificador para citar ou linkar para este item:
https://repositorio.uema.br/jspui/handle/123456789/4521
Título: | Similaridade Semântica entre Processos Judiciais: Uma Abordagem para Identificação de Litigância Predatória |
Título(s) alternativo(s): | Semantic Similarity between Legal Proceedings: An Approach to Identifying Predatory Litigation |
Autor(es): | Neto, Jonas Carvalho de Sousa |
Orientador: | Justino, Adrielson Ferreira |
Membro da Banca: | Lavareda, Antônio Fernando |
Membro da Banca: | Carmo, Fabrício Almeida do |
Data do documento: | 2025-02-17 |
Editor: | Universidade Estadual do Maranhão |
Resumo: | Segundo o Conselho Nacional de Justiça, o Poder Judiciário Brasileiro recebe anualmente mais de 30 milhões de processos judiciais. Esse volume excessivo de dados evidencia a necessidade de soluções automatizadas para aumentar a eficiência e a produtividade do sistema judiciário. Nesse cenário, um dos desafios enfrentados é a litigância predatória, caracterizada pela protocolação de ações judiciais de má-fé, nas quais as mesmas partes (autor, réu e advogado) submetem múltiplas demandas da mesma problemática, gerando esgotamento dos recursos do judiciário. Em 2020, cerca de 30% dos processos de Direito Civil e do Consumidor foram classificados como litigância predatória, gerando um custo mínimo de R$ 10,7 bilhões ao Judiciário. Além dos prejuízos financeiros, essa prática sobrecarrega magistrados e servidores, aumentando o tempo de tramitação de processos legítimos e comprometendo a eficiência do sistema. Este trabalho investiga a utilização de embeddings baseados em Transformers, como o Bidirectional Encoder Representations from Transformers, para análise de padrões de litigância predatória por meio de similaridade semântica. Esses modelos são capazes de capturar o significado semântico de palavras e frases, considerando o contexto em que estão inseridas. Para a construção e avaliação da pesquisa, foram utilizadas técnicas de Recuperação de Informação, que permite medir a eficácia dos modelos na identificação de casos semanticamente semelhantes. Foram avaliados quatro modelos de linguagem (BERTikal, BERTimbau, BumbaBERT Small e o RoBERTa ptBR), dentre os quais o BERTimbau obteve o melhor desempenho (Recall@k de 69,23% e MAP de 35,58%), seguido pelo BumbaBERT Small (Recall@k de 61,54% e MAP de 31,13%). Outros modelos testados apresentaram desempenho inferior. Estes resultados demonstram a viabilidade da proposta, contribuindo para a automação de tarefas no Judiciário e avanços nas técnicas de Processamento de Linguagem Natural |
Resumo: | According to the National Council of Justice, the Brazilian Judiciary receives more than 30 million court cases every year. This excessive volume of data highlights the need for automated solutions to increase the efficiency and productivity of the judicial system. In this scenario, one of the challenges faced is predatory litigation, characterized by the filing of lawsuits in bad faith, in which the same parties (plaintiff, defendant and lawyer) submit multiple claims on the same issue, generating exhaustion of judicial resources. In 2020, around 30% of civil and consumer law cases were classified as predatory litigation, generating a minimum cost of R$ 10.7 billion to the judiciary. In addition to the financial losses, this practice overloads judges and civil servants, increasing the time it takes to process legitimate cases and compromising the efficiency of the system. This paper investigates the use of embeddings based on Transformers, such as Bidirectional Encoder Representations from Transformers, to analyze predatory litigation patterns by means of semantic similarity. These models are capable of capturing the semantic meaning of words and phrases, considering the context in which they are inserted. Information Retrieval techniques were used to construct and evaluate the research, which allows the effectiveness of the models to be measured in identifying semantically similar cases. Four language models were evaluated (BERTikal, BERTimbau, BumbaBERT Small and RoBERTa ptBR), of which BERTimbau had the best performance (Recall@k of 69.23% and MAP of 35.58%), followed by BumbaBERT Small (Recall@k of 61.54% and MAP of 31.13%). Other models tested performed less well. These results demonstrate the viability of the proposal, contributing to the automation of tasks in the Judiciary and advances in Natural Language Processing techniques |
Palavras-chave: | Similaridade semântica Representações vetoriais Litigância predatória Recuperação da informação Semantic similarity Predatory litigation Vector representations Information retrieval |
Aparece nas coleções: | Curso de Bacharelado em Engenharia da Computação - CCT UEMA - Monografias |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
TCC - JONAS CARVALHO DE SOUSA NETO - ENGENHARIA DA COMPUTAÇÃO CCT UEMA 2025.pdf | PDF A | 1.54 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.