Abstract:
RESUMO:
O rápido avanço da tecnologia, sobretudo nas instituições de ensino, tem dado o rigema
vastosvolumesdedadosque,pormeiodoprocessodeDescobertadeConhecimentoem
Bancos deDados,têmopotencialdeproporcionarconsideráveisbenefíciosainstituições,
estudantes,professoresecolaboradores.Esteestudoseconcentranaaplicaçãodesseprocesso
para aprevisãodaevasãoescolar,enfocandoumasituaçãoemqueosconjuntosdedados
podemnãosertãoextensosquandoconsideradosemumcontextodecursosindividuais.No
entanto,quandoessesconjuntossãoagrupadoscomoutrosquecompartilhamcaracterísticas
semelhantes,podemaprimorarsignificativamenteacapacidadepreditiva.Paraatingir
esse objetivo,adotou-seumaabordagemdeduasetapasemcascata.Naprimeiraetapa,
uma abordagemnãosupervisionadadeclusterizaçãofoiempregada,visandoagrupar
cursos comcaracterísticasafins.Asegundaetapa,porsuavez,empregouumatécnica
supervisionadadeclassificaçãoparacriarmodelosdeprediçãodeevasão.Essesmodelos
foram criadostantodeformaindividualizadaparacadacursocomoapartirdedadosde
cursos agrupados,seguindoaestruturadefinidapeloalgoritmodeclusterizaçãodaetapa
anterior.Essaabordagempermitiuumacomparaçãodiretaentreosmodelos.Alémdisso,a
temporalidadedosdadosfoilevadaemconsideração,comadivisãodosdadosemperíodos,
do 1º ao 8º, sendooúltimo,namaioriadoscursos,osemestredeconclusãoesperado.Os
resultados obtidosdestacamaeficáciadautilizaçãodeagrupamentosdecursospormeio
da clusterizaçãoparaotimizaracapacidadepreditivadosmodelosdeevasãoescolar.