Use este identificador para citar ou linkar para este item: https://repositorio.uema.br/jspui/handle/123456789/4667
Título: São João do Maranhão: análise de tópicos e sentimentos em tweets e notícias
Título(s) alternativo(s): São João do Maranhão: analysis of topics and sentiments in tweets and news
Autor(es): Ferreira, João Gabriel Pereira
Orientador: Jacob Junior, Antonio Fernando Lavareda
Membro da Banca: Silva, Gustavo Soares
Membro da Banca: Brandão Neto, Pedro
Data do documento: 2025-02-14
Editor: Universidade Estadual do Maranhão
Resumo: O crescente percentual da população com acesso à internet no Brasil configura uma maior utilização das mídias sociais como o X e, consequentemente, uma maior disponibilidade de dados textuais gerados por seus usuários. Dessa forma, faz-se interessante colher amostras de texto dos utilizadores e analisar opiniões acerca de determinado tema. Neste trabalho, foi realizada uma análise de sentimentos e modelagem de tópicos utilizando dados do X e do G1 sobre o São João do Maranhão durante os festejos de 2023 e 2024. O objetivo foi identificar a impressão deixada pelo evento na população maranhense. Para isso, foram aplicadas técnicas de web scraping para coletar os dados. Ao todo foram coletados 1756 tweets e 125 notícias. Após a coleta, os textos passaram por métodos de pré-processamento para permitir a realização da classificação de sentimentos e a modelagem de tópicos. Para identificar os temas abordados nas mídias sociais, utilizou-se o BERTopic, que obteve êxito em identificar os principais temas abordados pelos internautas, tais como: São João da Thay, Bumba Meu Boi, arte e folclore. Quanto à análise de sentimentos, verificou-se que a grande maioria dos tweets e artigos publicados pelo G1 foram de caráter positivo, confirmando a ampla satisfação dos usuários em relação ao São João do Maranhão.
Resumo: The growing percentage of the population with internet access in Brazil means that social media such as X is being used more frequently and, consequently, text data generated by its users is becoming more available. Therefore, it is interesting to collect text samples from users and analyze opinions on a given topic. In this study, sentiment analysis and topic modeling were performed using data from X and G1 about São João do Maranhão during the 2023 and 2024 festivities. The objective was to identify the impression left by the event on the population of Maranhão. To this end, web scraping techniques were applied to collect data. In total, 1,756 tweets and 125 news items were collected. After collection, the texts underwent pre-processing methods to allow sentiment classification and topic modeling. To identify the topics covered in social media, BERTopic was used, which was successful in identifying the main topics covered by Internet users, such as: São João da Thay, Bumba Meu Boi, art and folklore. Regarding sentiment analysis, it was found that the vast majority of tweets and articles published by G1 were positive, confirming the broad satisfaction of users in relation to São João do Maranhão.
Palavras-chave: São João do Maranhão
Análise de sentimentos - twitter
Twitter
Modelagem de tópicos
Processamento de linguagem natural
BERTopic
Mídia social - X
X - mídia social
Rede social - X
Festival of São João do Maranhão
Sentiment analysis - twitter
Twitter
Topic modeling
Natural language processing
Social media - X
X - social media
Social network - X
Aparece nas coleções:Curso de Bacharelado em Engenharia de Computação - CCT UEMA - Monografias

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TCC JOÃO GABRIEL PEREIRA FERREIRA - ENG. DE COMPUTACAO CCT UEMA 2025.pdfPDF A1.25 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.