MINERAÇÃO DE TEXTO: A CLUSTERIZAÇÃO APLICADA EM ARTIGOS CIENTÍFICOS DE QUÍMICA, POR MEIO DO MODELO CASSIOPEIA

Authors

  • Diego Sampaio Amariz Author
  • Marcus Vinícius Carvalho Guelpeli Author

DOI:

https://doi.org/10.56238/levv15n42-070

Keywords:

Mineração de Texto, Corpus, Química, Clusterização, Modelo Cassiopeia

Abstract

A química ao se dedicar à compreensão da natureza submicroscópica da matéria e suas transformações, desenvolve uma linguagem própria e produz um conhecimento fundamental sobre a natureza. Sua natureza como conhecimento básico a levou, junto com outras ciências da natureza, a compor o conhecimento de qualquer cidadão, quer seja para ler e compreender o mundo natural ou transformado pela mão do homem, quer seja para se continuar os estudos em nível superior ou técnico em outras áreas ou profissões. No entanto, assimilar e lidar com o grande volume de informação disponível, localizando-as de forma rápida e precisa, tornou-se um grande desafio, dentro da diversa gama documental existente. Com isso, Técnicas de Mineração de Texto podem auxiliar nesse processo, por meio da extração de dados textuais. Dessa forma, o objetivo dessa pesquisa é relacionar conceitos de Química encontrando palavras similares em artigos científicos de área, que possam demonstrar uma ligação entre alguns conceitos abordados no Ensino Médio. Por meio da técnica de clusterização com a utilização do modelo Cassiopeia, em um corpus de textos acadêmicos relacionados a Química. A pesquisa foi desenvolvida segundo as seguintes ações: levantamento bibliográfico; construção do corpus; coleta do corpus; análise estatística do corpus; mineração de texto; a clusterização; e, por fim, a análise dos dados a partir dos clusters gerados. Os resultados obtidos mostraram  que a clusterização, efetuada no corpus proporcionou a relação entre conceitos químicos, encontrando palavras similares nos artigos científicos que compõem o corpus desenvolvido nessa pesquisa, que demonstram a ligação de conteúdos de Química do Ensino Medio.

Published

2024-11-26

How to Cite

AMARIZ, Diego Sampaio; GUELPELI, Marcus Vinícius Carvalho. MINERAÇÃO DE TEXTO: A CLUSTERIZAÇÃO APLICADA EM ARTIGOS CIENTÍFICOS DE QUÍMICA, POR MEIO DO MODELO CASSIOPEIA. LUMEN ET VIRTUS, [S. l.], v. 15, n. 42, p. 7482–7505, 2024. DOI: 10.56238/levv15n42-070. Disponível em: https://periodicos.newsciencepubl.com/LEV/article/view/1712. Acesso em: 18 jan. 2025.