Do tweet à ameaça:

dc.contributor.advisorFerreira, Charles Henrique Porto
dc.contributor.advisorLatteshttp://lattes.cnpq.br/9346953261085205
dc.contributor.authorOliveira, Hugo Linhares
dc.contributor.authorCezarino, João Pedro Rosa
dc.contributor.authorLacerda, Thales de Oliveira
dc.contributor.authorOliveira, Vitor Martins
dc.date.accessioned2024-02-28T12:00:17Z
dc.date.available2024-02-28T12:00:17Z
dc.date.issued2023-12-05
dc.description.abstractCom o aumento dos ataques cibernéticos, a segurança digital torna-se crucial. Redes sociais, especialmente o Twitter, são plataformas onde hackers expressam intenções. Este trabalho propõe um método de extração e análise de dados dessas redes usando técnicas de Machine Learning e pré-processamento de textos para identificar padrões indicativos de ameaças cibernéticas. Diante desse desafio, são apresentadas duas abordagens: na primeira, há a combinação de sentimentos, entidades e similaridade com palavras-chave de segurança da informação em uma única representação vetorial, juntamente com os resultados de um algoritmo de classificação. Já na segunda abordagem, é utilizado um score ponderado para cada atributo do mecanismo de análise, visando uma abordagem mais refinada na detecção de possíveis ameaças. Os resultados destacam a importância da análise de entidades na melhoria da precisão do modelo, onde identificou-se que datas e números são mais prevalentes em comunicações que contêm ameaças. Além disso, os resultados obtidos questionam a eficácia da análise de sentimentos como indicador confiável, desafiando a premissa de que a polaridade do sentimento é um sinal seguro de conteúdo mal-intencionado na identificação de tweets potencialmente perigosos. Neste cenário, o algoritmo Random Forest se destacou, alcançando uma acurácia de até 79,59% na classificação de tweets como ameaças, contra 79,25% de baseline.pt_BR
dc.description.abstractWith the increase in cyber attacks, digital security becomes crucial. Social networks, especially Twitter, are platforms where hackers express their intentions. This work proposes a method for extracting and analyzing data from these networks using Machine Learning techniques and text preprocessing to identify patterns indicative of cyber threats. In the face of this challenge, two approaches are presented: the first combines sentiment analysis, entity recognition, and similarity with information security keywords into a single vector representation, along with the results of a classification algorithm. The second approach uses a weighted score for each attribute of the analysis mechanism, aiming for a more refined approach in detecting potential threats. The results highlight the importance of entity analysis in improving the model's accuracy, where it was found that dates and numbers are more prevalent in communications containing threats. Moreover, the obtained results challenge the effectiveness of sentiment analysis as a reliable indicator, defying the premise that sentiment polarity is a sure sign of malicious content in the identification of potentially dangerous tweets. In this scenario, the Random Forest algorithm stood out, achieving an accuracy of up to 79.59% in classifying tweets as threats, compared to a 79.25% baseline.en
dc.format.extent49
dc.identifier.urihttps://repositorio.fei.edu.br/handle/FEI/5284
dc.language.isopt_BR
dc.rightsAberto
dc.subjectsegurança cibernética
dc.subjectataques cibernéticos
dc.subjectredes sociais
dc.subjectmachine learning
dc.subjectprocessamento de texto
dc.subjectrastreamento de dados
dc.subjectanálise de sentimentos
dc.subjectcybersecurity
dc.subjectcyber attacks
dc.subjectsocial networks
dc.subjectmachine learning
dc.subjecttext processing
dc.subjectdata tracking
dc.subjectsentiment analysis
dc.titleDo tweet à ameaça:
dc.title.alternativeum estudo sobre padrões de detecção de ameaças cibernéticas através de processamento de linguagem natural
dc.typeTrabalho de Conclusão de Curso
fei.date.entrega2024
Arquivos
Pacote Original
Agora exibindo 1 - 2 de 2
Nenhuma Miniatura disponível
Nome:
autorizacao_tcc.pdf
Tamanho:
240.31 KB
Formato:
Adobe Portable Document Format
Carregando...
Imagem de Miniatura
Nome:
TCC_Do_Tweet_a_Ameaça.pdf
Tamanho:
499.89 KB
Formato:
Adobe Portable Document Format
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.75 KB
Formato:
Item-specific license agreed upon to submission
Descrição: