Abstract:
RESUMO: Os cursos superiores na modalidade a distância tiveram um grande crescimento quantitativo na última década. Frente a esse crescimento, surge a preocupação com a qualidade do ensino e consequentemente com a performance acadêmica dos alunos. Com o intuito de identificar os perfis dos estudantes dessa modalidade educacional, especialmente dos cursos de Licenciatura em Computação, Sistemas de Informação e História, o presente trabalho propõe um processo de descoberta de conhecimento através de métodos de Aprendizagem de Máquina (AM) supervisionados aplicados ao ensino superior a distância, mais especificamente à base de dados do Sistema Integrado de Gestão de Atividades Acadêmicas (SIGAA) da Universidade Federal do Piauí (UFPI), cujos registros foram coletados nas duas últimas entradas do vestibular da Universidade Aberta do Brasil, as quais ocorreram em meados de 2014 e no início de 2017, respectivamente. Neste processo de descoberta de conhecimento, realizou-se a identificação de perfis a partir de uma correlação entre o Índice de Rendimento Acadêmico (IRA) e os aspectos sociais desses alunos. Foram utilizados três algoritmos de Aprendizagem de Máquina supervisionados com o paradigma simbólico: J48, RandomTree e SimpleCart. Observou-se que o J48 obteve
a melhor performance dentre os algoritmos aplicados, exibindo regras de produção bastante concisas que melhor representam a correlação do IRA com os demais atributos. Os perfis descobertos tendem a auxiliar os gestores do sistema de educação a distância na tomada de decisões em relação a melhorias no processo de ensino-aprendizagem já que, através da mineração de dados, teve-se uma ideia do desempenho do aluno, ao mostrar que a deficiência acadêmica possui correlações com aspectos sociais. A partir dessas informações é possível definir-se estratégias diferenciadas em relação a esses alunos. ABSTRACT: Distance learning higher education has experienced a great deal of quantitative growth in the last decade. Facing this growth, arises the concern with the quality of teaching and consequently with the academic performance of the students. In order to identify students’ profiles of this educational modality, especially the courses of Degree in Computing, Information Systems and History, the present work proposes a process of knowledge discovery through supervised Machine Learning (ML) methods applied to distance higher education, more specifically to the SIGAA/UFPI database, whose records were collected in the last two entrance exams of the Open University of Brazil, which occurred in mid-2014 and early 2017, respectively. In this process of knowledge discovery, profiles were identified based on a correlation between the Academic Performance Index (API) and the social aspects of these students. Three supervised Machine Learning algorithms with symbolic paradigm were used: J48, RandomTree e SimpleCart. It was observed that J48 obtained the best performance among the algorithms applied, showing very concise production rules that best represent the correlation between the API with the further attributes. The discovered profiles tend to assist managers of the distance education system in decisions making regarding improvements in the teaching learning process since, through the data mining, an
idea of student performance was shown, showing that the deficiency has correlations with
social aspects. Based on this information, it is possible to define differentiated strategies
in relation to these students.