Abstract:
Resumo
A evasão escolar e os diversos fatores relacionados a esse comportamento despontam
como um dos grandes desaĄos ao pleno desenvolvimento da educação em muitos países.
No Brasil, estima-se que 27% do total de alunos matriculados não concluem o percurso
formativo previsto nas respectivas ofertas. Delimitando-se na proposta da Rede Federal de
Educação ProĄssional, CientíĄca e Tecnológica (RFEPCT), especiĄcamente na Educação
ProĄssional Técnica de Nível Médio (EPTNM), esse estudo identiĄcou um decréscimo no
número de concluintes nos últimos cinco anos, conforme estatísticas oĄciais da Plataforma
Nilo Peçanha (PNP), sistema do Ministério da Educação alimentado pelas instituições
integrantes da RFEPCT. Assim, a identiĄcação de forma prévia da tendência à evasão
certamente contribui como subsídio para o direcionamento de estratégias proativas visando
a permanência e êxito discente. Nesse sentido, o uso da inteligência artiĄcial, especiĄcamente
na subárea aprendizagem de máquina, apresenta-se como importante recurso de apoio à
gestão educacional. É nessa perspectiva que se deĄne a proposta deste trabalho em avaliar
classiĄcadores quanto a ocorrência da evasão no âmbito do ensino técnico multicampi.
Para tanto, foram aplicados os algoritmos de Decision Tree (DT), Random Forest (RF),
Gradient Boost (GB), Multi-Layer Perceptron (MLP) e Support Vector Machine (SVM).
Os modelos utilizados foram submetidos a análises comparativas a partir de estudos
de casos com dados extraídos unicamente da PNP. Os resultados dos modelos melhor
avaliados (DT e RF) apresentam médias superiores a 90% quando consideradas todas
as unidades da instituição em testes segmentados e agrupados, destacando ainda uma
tendência de evolução nas performances que favorece o potencial escalável da proposta.
Os resultados apresentados expressam a sensibilidade (recall ) e a precisão (precision) com
suas relevâncias equiparadas e resumidas pela métrica F-score.
Abstract
School dropout and the various factors related to this behavior emerge as one of the greatest
challenges to the full development of education in many countries. In Brazil, it is estimated
that 27% of the total number of students enrolled do not complete the training path
provided for in the respective ofers. Delimited by the proposal of the Federal Network for
Professional, ScientiĄc and Technological Education (RFEPCT), speciĄcally in Secondary
Technical Professional Education (EPTNM), this study identiĄed a decrease in the number
of graduates in the last Ąve years, according to oicial statistics from the Platform Nilo
Peçanha (PNP), a system from the Ministry of Education fed by the institutions that
are members of the RFEPCT. Thus, the prior identiĄcation of the tendency to drop
out certainly contributes to support proactive strategies aimed at student retention and
success. In this sense, the use of artiĄcial intelligence, speciĄcally in the machine learning
subarea, presents itself as an important resource to support educational management. It
is from this perspective that the proposal of this work is deĄned to evaluate classiĄers
regarding the occurrence of dropout in the context of multicampi technical education. To
this end, the Decision Tree (DT), Random Forest (RF), Gradient Boost (GB), Multi-Layer
Perceptron (MLP) and Support Vector Machine (SVM). The models used were subjected
to comparative analyzes based on case studies with data extracted solely from the PNP.
The results of the best evaluated models (DT and RF) present averages above 90% when
considering all units of the institution in segmented and grouped tests, also highlighting a
trend of evolution in performances that favors the scalable potential of the proposal. The
results presented express sensitivity (recall ) and precision (precision ) with their relevance
equated and summarized by the F-score metric.