Use este identificador para citar ou linkar para este item: https://repositorio.uema.br/jspui/handle/123456789/3399
Registro completo de metadados
Campo DCValorIdioma
dc.creatorCarmo, Fabrício Almeida do-
dc.date.accessioned2024-10-25T17:02:24Z-
dc.date.available2024-10-25-
dc.date.available2024-10-25T17:02:24Z-
dc.date.issued2024-02-26-
dc.identifier.citationCARMO, Fabrício Almeida do. Representações Embeddings Orientadas à Linguagem jurídica Brasileira. 2024. 84f. Dissertação (Mestrado em Engenharia da Computação e Sistemas) – Centro de Ciências Tecnológicas, Universidade Estadual do Maranhão, São Luís - MA, 2024. Disponível em: https://repositorio.uema.br/jspui/handle/123456789/3399pt_BR
dc.identifier.urihttps://repositorio.uema.br/jspui/handle/123456789/3399-
dc.description.abstractThe automatic processing of legal texts arranged in natural language makes it possible to build a range of applications based on artificial intelligence, such as classification and grouping of processes by subject, document summarization, and translation into citizen language. In this sense, the Brazilian judiciary launched the Justice 4.0 program, looking to encourage the development of solutions that offer speed in procedural activities. Notably, technical language is predominant in this application domain, requiring specialized models for the segment. Bearing in mind this context, this work aims to build models embeddings oriented to the legal sphere with a view to feeding applications in the area. In this sense, approximately 5.3 million documents were extracted from Brazilian justice institutions from the most varied spheres, such as civil, criminal, and labor. The models were evaluated by classifying initial petitions, and the results obtained were promising when compared to generalist models of the Portuguese language. Such research findings demonstrate that models trained with legal documents better understand the segment’s language’s specificities and can potentially promote new applications for the sectorpt_BR
dc.description.sponsorshipCNPQpt_BR
dc.languageporpt_BR
dc.publisherUniversidade Estadual do Maranhãopt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectJustiça 4.0pt_BR
dc.subjectProcessamento de Linguagem Naturalpt_BR
dc.subjectWord embeddingspt_BR
dc.subjectCiência de dadospt_BR
dc.subjectPetições Iniciaispt_BR
dc.subjectModelos Word2Vecpt_BR
dc.subjectModelo FastTextpt_BR
dc.subjectBERTpt_BR
dc.subjectAcordo de Cooperação Técnicapt_BR
dc.subjectJustice 4.0pt_BR
dc.subjectNatural Language Processingpt_BR
dc.subjectWord embeddingspt_BR
dc.subjectData Sciencept_BR
dc.subjectLegal Domainpt_BR
dc.subjectWord2Vec Modelspt_BR
dc.subjectFastText Modelpt_BR
dc.subjectBERTpt_BR
dc.subjectTechnical Cooperation Agreementpt_BR
dc.titleRepresentações Embeddings Orientadas à Linguagem jurídica Brasileirapt_BR
dc.title.alternativeEmbedding Representations Oriented to Brazilian Legal Languagept_BR
dc.typeDissertaçãopt_BR
dc.creator.IDhttps://orcid.org/0000-0003-3163-1094pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/5415578583738595pt_BR
dc.contributor.advisor1Lobato, Fábio Manoel França-
dc.contributor.advisor1IDhttps://orcid.org/0000-0002-6282-0368pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/8320014491229434pt_BR
dc.contributor.advisor-co1Santana, Ewaldo Eder Carvalho-
dc.contributor.advisor-co1IDhttps://orcid.org/0000-0002-8894-5353pt_BR
dc.contributor.advisor-co1Latteshttp://lattes.cnpq.br/0660692009750374pt_BR
dc.contributor.referee1Jacob Junior, Antonio Fernando Lavareda-
dc.contributor.referee1IDhttps://orcid.org/0000-0002-9415-7265pt_BR
dc.contributor.referee1Latteshttp://lattes.cnpq.br/4510520291728075pt_BR
dc.contributor.referee2Sampaio, Cláuldio Henrique Carneiro-
dc.contributor.referee2IDSAMPAIO, C. H. C.pt_BR
dc.contributor.referee2Latteshttp://lattes.cnpq.br/3864243560902242pt_BR
dc.contributor.referee3Marcacini, Ricardo Marcondes-
dc.contributor.referee3IDhttps://orcid.org/0000-0002-2309-3487pt_BR
dc.contributor.referee3Latteshttp://lattes.cnpq.br/3272611282260295pt_BR
dc.description.resumoO processamento automático de textos jurídicos dispostos em linguagem natural viabiliza a construção de uma gama de aplicações baseadas em inteligência artificial para o setor, tais como: a classificação e agrupamento de processos por assunto, sumarização de documentos, tradução para linguagem cidadã, entre outros. Nesse sentido, o judiciário brasileiro lançou o programa Justiça 4.0 buscando incentivar o desenvolvimento de soluções que ofereçam celeridade nas atividades processuais. Destaca-se que a linguagem técnica é predominante nesse domínio de aplicação, exigindo modelos especializados para o segmento. Frente ao exposto, esse trabalho tem como objetivo a construção de modelos embeddings orientados ao âmbito jurídico visando alimentar aplicações na área. Para isso, foram extraídos aproximadamente 5,3 milhões de documentos de instituições de justiça do Brasil das mais variadas esferas como civil, criminal e trabalhista. Os modelos foram avaliados por meio da classificação de petições iniciais e os resultados obtidos se mostraram promissores quando comparados a modelos generalistas da língua portuguesa. Tais achados de pesquisa demostram que modelos treinados com documentos jurídicos compreendem melhor as especificidades da linguagem do segmento e têm o potencial de fomentar novas aplicações para o setorpt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentCampus São Luis Centro de Ciências Tecnológicas – CCTpt_BR
dc.publisher.programPROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DA COMPUTAÇÃO E SISTEMAS - PECSpt_BR
dc.publisher.initialsUEMApt_BR
dc.subject.cnpqCiência da Computaçãopt_BR
Aparece nas coleções:Mestrado Profissional em Engenharia da Computação e Sistemas - CCT - Dissertações

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
DISSERTAÇÃO - FABRÍCIO ALMEIDA DO CARMO - PECS CCT UEMA 2024.pdfPDF A1.8 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.