DETECÇÃO AUTOMÁTICA DE DISCURSO HOMOFÓBICO UTILIZANDO APRENDIZADO DE MÁQUINA
DOI:
https://doi.org/10.56238/arev7n5-029Palavras-chave:
Aprendizado de Máquina, Discurso de Ódio, Redes Sociais, Mineração de dados, Processamento de Linguagem NaturalResumo
Esta pesquisa explora modelos de aprendizado de máquina para detectar discursos de ódio com contexto homofóbicos em redes sociais, um problema relevante na era digital devido ao impacto negativo sobre a comunidade LGBTQIA+. O objetivo geral é treinar modelos preditivos capazes de identificar discursos homofóbicos de forma eficiente, contribuindo para o combate ao discurso de ódio e promovendo um ambiente virtual mais seguro. A metodologia CRISP-DM foi utilizada, aplicando cinco fases: entendimento do negócio, entendimento e preparação dos dados, modelagem e avaliação. Foram treinados seis modelos: Decision Tree, Random Forest, Extra Trees, Passive Aggressive, eXtreme Gradient Boosting e Support Vector Machine. A avaliação dos modelos utilizou métricas como acurácia, precisão, recall e F1-Score, além de análise da matriz de confusão e da curva Receiver Operating Characteristic para medir o desempenho de cada modelo. O modelo SVM obteve o melhor desempenho geral, com acurácia de 87,10%, precisão de 79,15% e área sob a curva de 0,9227, destacando sua eficácia em minimizar falsos positivos. Os resultados evidenciam o potencial dos modelos de aprendizado na identificação de discurso de ódio e contribuem para a construção de ambientes digitais mais seguros e inclusivos.