PREVISÃO DE CONECTIVIDADE ESCOLAR NO BRASIL: UMA ABORDAGEM COM RANDOM FOREST E VALIDAÇÃO TEMPORAL NOS DADOS DO CENSO ESCOLAR
DOI:
https://doi.org/10.56238/levv17n60-053Palavras-chave:
Aprendizado de Máquina, Conectividade Escolar, Random Forest, Censo Escolar, Inclusão DigitalResumo
A conectividade à internet em escolas públicas brasileiras é indicador crítico de equidade educacional e inclusão digital. Prever quais escolas da educação básica possuem banda larga utilizando aprendizado de máquina. Random Forest treinado com microdados do Censo Escolar 2023 (217.625 registros) e validado temporalmente com dados de 2024 (215.545 registros). Acurácia de 85,38% e ROC-AUC de 0,8909. Principais preditores: recursos pedagógicos, infraestrutura básica, número de turmas e localização rural. Validação temporal em dados educacionais longitudinais, viabilizando planejamento de políticas públicas. Escolas com mais recursos tendem a ter banda larga, revelando desigualdades estruturais concentradas.
Downloads
Referências
ARROYO, M. G. Educação e desigualdades: tempos, espaços e políticas. Petrópolis: Vozes, 2011.
BAKER, R. S.; INVENTADO, P. S. Educational data mining and learning analytics. In: PIETY, P. J.; KRUMM, J. (org.). Learning Analytics at Work. New York: Teachers College Press, 2014. p. 61–75.
BATISTA NETO, G. M. Análise e previsão da evasão escolar no ensino médio em instituições federais brasileiras. Repositório IFPB, 2024.
BIAU, G.; SCORNET, E. A random forest guided tour. TEST, v. 25, n. 2, p. 197–227, 2016.
BREIMAN, L. Random forests. Machine Learning, v. 45, n. 1, p. 5–32, 2001.
CAMPELO, A. K.; FERREIRA, D. L.; LIMA, R. B. Predição de evasão escolar no ensino fundamental com técnicas de aprendizado de máquina. Revista Brasileira de Informática na Educação, v. 31, n. 1, p. 112–134, 2023.
CENTRO REGIONAL DE ESTUDOS PARA O DESENVOLVIMENTO DA SOCIEDADE DA INFORMAÇÃO (CETIC.BR). TIC Educação 2022: pesquisa sobre o uso das tecnologias de informação e comunicação nas escolas brasileiras. São Paulo: Comitê Gestor da Internet no Brasil, 2023.
HASTIE, T.; TIBSHIRANI, R.; FRIEDMAN, J. The Elements of Statistical Learning: data mining, inference, and prediction. 2. ed. New York: Springer, 2009.
INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO TEIXEIRA (INEP). Microdados do Censo Escolar da Educação Básica 2023. Brasília: INEP, 2024. Disponível em: https://www.gov.br/inep/pt-br/acesso-a-informacao/dados-abertos/microdados/censo-escolar. Acesso em: 12 abr. 2025.
INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO TEIXEIRA (INEP). Microdados do Censo Escolar da Educação Básica 2024. Brasília: INEP, 2024. Disponível em: https://www.gov.br/inep/pt-br/acesso-a-informacao/dados-abertos/microdados/censo-escolar. Acesso em: 12 abr. 2025.
LIMA, P. A.; COSTA, F. R.; SOUZA, M. E. Modelos preditivos para oferta de educação em tempo integral em escolas públicas brasileiras. Revista Científica de Educação, v. 6, n. 1, p. 45–62, 2024.
LIRA, R. A. S.; ALENCAR, F. M. R. Análise de Fatores de Risco para a Evasão Escolar na Educação Básica usando Modelos Preditivos de Machine Learning. In: Anais do Simpósio Brasileiro de Informática na Educação (SBIE), 2025.
MELO, C. S.; SILVA, R. O. Infraestrutura escolar e desigualdade digital: um estudo com escolas públicas do Nordeste brasileiro. Educação & Sociedade, v. 42, e240058, 2021.
NEVES, T. M.; ALMEIDA, F. C.; BARBOSA, J. P. Recursos pedagógicos e acesso à internet em escolas municipais: evidências do Censo Escolar. Cadernos de Pesquisa, v. 52, n. 185, p. 98–117, 2022.
RODRIGUES, A. P.; MENDONÇA, R. T.; XAVIER, G. F. Classificação de desempenho escolar no SAEB com Random Forest: análise de variáveis socioeconômicas e infraestruturais. Informática na Educação: Teoria & Prática, v. 25, n. 2, p. 71–89, 2022.
SANTOS, L. B.; CARVALHO, M. R. Índice de vulnerabilidade socioeducacional: uma aplicação de Random Forest aos dados do Censo Escolar. Ensaio: Avaliação e Políticas Públicas em Educação, v. 31, n. 119, p. 303–324, 2023.