dc.description.abstract |
Resumo
A classificação de rachaduras e fissuras em superfícies de concreto é uma tarefa essencial para a manutenção preventiva de estruturas civis, pois quando não detectadas a tempo,podem comprometer a integridade estrutural e resultar em custos elevados de reparo.Neste contexto, esta proposta de pesquisa apresenta a WellNet, uma rede neural híbrida que se propõe como uma alternativa entre as abordagens para classificação de rachaduras e fissuras em imagens de estruturas de concretos. A WellNet combina as capacidadesdas Redes Neurais Convolucionais (CNN), conhecidas por sua eficiência na extração de características locais, com a abordagem dos Vision Transformers (ViT), que captura informações contextuais globais. O modelo foi validado utilizando o conjunto de (Özgenel,2019), com diferentes configurações de hiperparâmetros e técnicas de aumento de dados.Foram realizados experimentos com e sem aumento de dados, evidenciando que a WellNet apresenta resultados comparáveis a arquiteturas CNN e híbridas em métricas como acurácia de 99,70%, precisão de 99,50%, recall de 99,90% e F1-score de 99,70%. Além disso, o modelo se destaca pelo seu espaço em memória de (26.4 MB), tornando-o viável para uso em sistemas embarcados e dispositivos móveis, facilitando inspeções automatizadas em fachadas de edificações e locais de difícil acesso.
Palavras-chave: classificação de rachaduras e fissuras ; redes neurais convolucionais;
transformadores de visão; aprendizado por transferência; CNN; ViT.
Abstract
The classification of cracks and fissures in concrete surfaces is an essential task for preventivemaintenance of civil structures, since, when not detected in time, they can compromise structural integrity and result in high repair costs. In this context, this research proposal presents WellNet, a hybrid neural network that proposes itself as an alternative among approaches for crack and fissure classification in images of concrete structures. WellNet combines the capabilities of Convolutional Neural Networks (CNN), known for their efficiency in local feature extraction, with the approach of Vision Transformers (ViT),
which captures global contextual information. The model was validated using the dataset
from (Özgenel, 2019), with different hyperparameter configurations and data augmentation
techniques. Experiments were conducted with and without data augmentation, showing
that WellNet presents results comparable to CNN and hybrid architectures in metrics
such as accuracy of 99.70%, precision of 99.50%, recall of 99.90%, and F1-score of 99.70%.Furthermore, the model stands out for its memory space of 26.4 MB, making it viable for use in embedded systems and mobile devices, facilitating automated inspections in building facades and hard-to-reach locations.
Keywords: crack and fissure classification; convolutional neural networks; vision transformers;transfer learning; CNN; ViT. |
pt_BR |