Use este identificador para citar ou linkar para este item: https://repositorio.uema.br/jspui/handle/123456789/4586
Registro completo de metadados
Campo DCValorIdioma
dc.creatorNeto, Jonas Carvalho de Sousa-
dc.date.accessioned2025-04-02T17:46:47Z-
dc.date.available2025-03-02-
dc.date.available2025-04-02T17:46:47Z-
dc.date.issued2025-02-17-
dc.identifier.citationSOUSA NETO, Jonas Carvalho de. Similaridade Semântica entre Processos Judiciais: Uma Abordagem para Identificação de Litigância Predatória. 2025. 64 f. Monografia (Graduação em Engenharia de Computação) – Centro de Ciências Tecnológicas, Universidade Estadual do Maranhão, São Luís-MA, Brasil, 2025. Disponível em:https://repositorio.uema.br/jspui/handle/123456789/4586pt_BR
dc.identifier.urihttps://repositorio.uema.br/jspui/handle/123456789/4586-
dc.description.abstractAccordingtotheNationalCouncilofJustice,theBrazilianJudiciaryreceivesmorethan 30 millioncourtcaseseveryyear.Thisexcessivevolumeofdatahighlightstheneedfor automated solutionstoincreasetheefficiencyandproductivityofthejudicialsystem. In thisscenario,oneofthechallengesfacedispredatorylitigation,characterizedbythe filing oflawsuitsinbadfaith,inwhichthesameparties(plaintiff,defendantandlawyer) submit multipleclaimsonthesameissue,generatingexhaustionofjudicialresources.In 2020, around30%ofcivilandconsumerlawcaseswereclassifiedaspredatorylitigation, generating aminimumcostofR$10.7billiontothejudiciary.Inadditiontothefinancial losses, thispracticeoverloadsjudgesandcivilservants,increasingthetimeittakes to processlegitimatecasesandcompromisingtheefficiencyofthesystem.Thispaper investigatestheuseof embeddings based on Transformers, suchas BidirectionalEncoder RepresentationsfromTransformers, toanalyzepredatorylitigationpatternsbymeans of semanticsimilarity.Thesemodelsarecapableofcapturingthesemanticmeaning of wordsandphrases,consideringthecontextinwhichtheyareinserted.Information Retrievaltechniqueswereusedtoconstructandevaluatetheresearch,whichallows the effectivenessofthemodelstobemeasuredinidentifyingsemanticallysimilarcases. Fourlanguagemodelswereevaluated(BERTikal, BERTimbau, BumbaBERTSmall and RoBERTaptBR), ofwhich BERTimbau had thebestperformance(Recall@k of 69.23% and MAP of 35.58%),followedby BumbaBERTSmall (Recall@k of 61.54%and MAP of 31.13%). Othermodelstestedperformedlesswell.Theseresultsdemonstratetheviability of theproposal,contributingtotheautomationoftasksintheJudiciaryandadvancesin Natural LanguageProcessingtechniquespt_BR
dc.languageporpt_BR
dc.publisherUniversidade Estadual do Maranhãopt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectSimilaridade semânticapt_BR
dc.subjectRepresentações vetoriaispt_BR
dc.subjectLitigância predatóriapt_BR
dc.subjectRecuperação da informaçãopt_BR
dc.subjectSemantic similaritypt_BR
dc.subjectPredatory litigationpt_BR
dc.subjectVector representationspt_BR
dc.subjectInformation retrievalpt_BR
dc.titleSimilaridade Semântica entre Processos Judiciais: Uma Abordagem para Identificação de Litigância Predatóriapt_BR
dc.title.alternativeSemantic Similarity between Legal Proceedings: An Approach to Identifying Predatory Litigationpt_BR
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.contributor.advisor1Justino, Adrielson Ferreira-
dc.contributor.advisor1IDhttps://orcid.org/0000-0002-0760-1947pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0668222305492603pt_BR
dc.contributor.referee1Jacob Júnior, AntônioFernandoLavareda-
dc.contributor.referee2Carmo, Fabrício Almeida do-
dc.contributor.referee2IDhttps://orcid.org/0000-0003-3163-1094pt_BR
dc.contributor.referee2Latteshttp://lattes.cnpq.br/5415578583738595pt_BR
dc.description.resumoSegundo o Conselho Nacional de Justiça, o Poder Judiciário Brasileiro recebe anualmente mais de 30milhões de processos judiciais .Esse volume excessivo dedados evidencia a necessidade de soluções automatizadas para aumentar a eficiência e a produtividade do sistema judiciário. Nesse cenário, um dos desafios enfrentados é alitigância predatória, caracterizada pela protocolação de ações judiciais de má-fé, nas quais as mesmas partes (autor, réu e advogado) submetem múltiplas demandas da mesma problemática, gerando esgotamento dos recursos do judiciário. Em 2020, cerca de 30% dos processos de Direito Civil e do Consumidor foram classificados como litigância predatória, gerando um custo mínimo de R$10,7 bilhões ao Judiciário. Além dos prejuízos financeiros, essa prática sobrecarrega magistrados e servidores, aumentando tempo de tramitação de processos legítimos e comprometendo a eficiência do sistema. Este trabalho investiga a utilização de embeddings baseados em Transformers, como o Bidirectional Encoder Representations from Transformers, para análise de padrões delitigância predatória por meio de similaridade semântica. Esses modelos são capazes de capturar o significado semântico de palavras e frases, considerando o contexto em que estão inseridas. Para a construção e avaliação da pesquisa, foram utilizadas técnicas de Recuperação de Informação, que permite medir a eficácia dos modelos na identificação de casos semanticamente semelhantes. Foram avaliados quatro modelos de linguagem(BERTikal, BERTimbau, BumbaBERTSmall e o RoBERTaptBR), dentre os quais o BERTimbau obteve o melhor desempenho(Recall@k de 69,23%e MAP de 35,58%),seguido pelo BumbaBERTSmall (Recall@k de 61,54% e MAP de 31,13%). Outros modelos testados apresentaram desempenho inferior. Estes resultados demonstram a viabilidade da proposta, contribuindo para a automação de tarefas no Judiciário e avanços nas técnicas de Processamento de Linguagem Naturalpt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentCampus São Luis Centro de Ciências Tecnológicas – CCTpt_BR
dc.publisher.initialsUEMApt_BR
dc.subject.cnpqCiência da computaçãopt_BR
Aparece nas coleções:Curso de Bacharelado em Engenharia da Computação - CCT UEMA - Monografias

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TCC - JONAS CARVALHO DE SOUSA NETO - CCT UEMA 2025.pdfPDF A2.1 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.