SCHOOL CONNECTIVITY PREDICTION IN BRAZIL: A RANDOM FOREST APPROACH WITH TEMPORAL VALIDATION ON SCHOOL CENSUS DATA

Authors

  • Gustavo Lima Mendes Author
  • Marcos Albino do Carmo Carvalho Ferreira Author
  • Dadilton Bastos Melo Author

DOI:

https://doi.org/10.56238/levv17n60-053

Keywords:

Machine Learning, School Connectivity, Random Forest, School Census, Digital Inclusion

Abstract

Internet connectivity in Brazilian public schools is a critical indicator of educational equity and digital inclusion. To predict which basic education schools have broadband using machine learning. Random Forest trained on 2023 School Census microdata (217,625 records) and temporally validated on 2024 data (215,545 records). Accuracy of 85.38% and ROC-AUC of 0.8909. Main predictors: pedagogical resources, basic infrastructure, number of classes, and rural location.Temporal validation on longitudinal educational data, enabling public policy planning. Schools with more resources tend to have broadband, revealing concentrated structural inequalities.

Downloads

Download data is not yet available.

References

ARROYO, M. G. Educação e desigualdades: tempos, espaços e políticas. Petrópolis: Vozes, 2011.

BAKER, R. S.; INVENTADO, P. S. Educational data mining and learning analytics. In: PIETY, P. J.; KRUMM, J. (org.). Learning Analytics at Work. New York: Teachers College Press, 2014. p. 61–75.

BATISTA NETO, G. M. Análise e previsão da evasão escolar no ensino médio em instituições federais brasileiras. Repositório IFPB, 2024.

BIAU, G.; SCORNET, E. A random forest guided tour. TEST, v. 25, n. 2, p. 197–227, 2016.

BREIMAN, L. Random forests. Machine Learning, v. 45, n. 1, p. 5–32, 2001.

CAMPELO, A. K.; FERREIRA, D. L.; LIMA, R. B. Predição de evasão escolar no ensino fundamental com técnicas de aprendizado de máquina. Revista Brasileira de Informática na Educação, v. 31, n. 1, p. 112–134, 2023.

CENTRO REGIONAL DE ESTUDOS PARA O DESENVOLVIMENTO DA SOCIEDADE DA INFORMAÇÃO (CETIC.BR). TIC Educação 2022: pesquisa sobre o uso das tecnologias de informação e comunicação nas escolas brasileiras. São Paulo: Comitê Gestor da Internet no Brasil, 2023.

HASTIE, T.; TIBSHIRANI, R.; FRIEDMAN, J. The Elements of Statistical Learning: data mining, inference, and prediction. 2. ed. New York: Springer, 2009.

INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO TEIXEIRA (INEP). Microdados do Censo Escolar da Educação Básica 2023. Brasília: INEP, 2024. Disponível em: https://www.gov.br/inep/pt-br/acesso-a-informacao/dados-abertos/microdados/censo-escolar. Acesso em: 12 abr. 2025.

INSTITUTO NACIONAL DE ESTUDOS E PESQUISAS EDUCACIONAIS ANÍSIO TEIXEIRA (INEP). Microdados do Censo Escolar da Educação Básica 2024. Brasília: INEP, 2024. Disponível em: https://www.gov.br/inep/pt-br/acesso-a-informacao/dados-abertos/microdados/censo-escolar. Acesso em: 12 abr. 2025.

LIMA, P. A.; COSTA, F. R.; SOUZA, M. E. Modelos preditivos para oferta de educação em tempo integral em escolas públicas brasileiras. Revista Científica de Educação, v. 6, n. 1, p. 45–62, 2024.

LIRA, R. A. S.; ALENCAR, F. M. R. Análise de Fatores de Risco para a Evasão Escolar na Educação Básica usando Modelos Preditivos de Machine Learning. In: Anais do Simpósio Brasileiro de Informática na Educação (SBIE), 2025.

MELO, C. S.; SILVA, R. O. Infraestrutura escolar e desigualdade digital: um estudo com escolas públicas do Nordeste brasileiro. Educação & Sociedade, v. 42, e240058, 2021.

NEVES, T. M.; ALMEIDA, F. C.; BARBOSA, J. P. Recursos pedagógicos e acesso à internet em escolas municipais: evidências do Censo Escolar. Cadernos de Pesquisa, v. 52, n. 185, p. 98–117, 2022.

RODRIGUES, A. P.; MENDONÇA, R. T.; XAVIER, G. F. Classificação de desempenho escolar no SAEB com Random Forest: análise de variáveis socioeconômicas e infraestruturais. Informática na Educação: Teoria & Prática, v. 25, n. 2, p. 71–89, 2022.

SANTOS, L. B.; CARVALHO, M. R. Índice de vulnerabilidade socioeducacional: uma aplicação de Random Forest aos dados do Censo Escolar. Ensaio: Avaliação e Políticas Públicas em Educação, v. 31, n. 119, p. 303–324, 2023.

Published

2026-05-23

How to Cite

MENDES, Gustavo Lima; FERREIRA, Marcos Albino do Carmo Carvalho; MELO, Dadilton Bastos. SCHOOL CONNECTIVITY PREDICTION IN BRAZIL: A RANDOM FOREST APPROACH WITH TEMPORAL VALIDATION ON SCHOOL CENSUS DATA. LUMEN ET VIRTUS, [S. l.], v. 17, n. 60, p. e13210, 2026. DOI: 10.56238/levv17n60-053. Disponível em: https://periodicos.newsciencepubl.com/LEV/article/view/13210. Acesso em: 29 may. 2026.