Mestrado em Engenharia Elétrica
http://hdl.handle.net/123456789/1751
Nesta coleção serão publicadas todas Dissertações do Programa de Pós-Graduação em Engenharia Elétrica do Centro de Tecnologia.2024-02-23T02:32:45ZUMA ABORDAGEM PREDITIVA PARA A PRODUÇÃO DE MEL COM BASE EM DADOS CLIMÁTICOS
http://hdl.handle.net/123456789/3488
UMA ABORDAGEM PREDITIVA PARA A PRODUÇÃO DE MEL COM BASE EM DADOS CLIMÁTICOS
MEIRELES FILHO, Mário Rodrigues Gomes
RESUMO O Estado do Piauí é um dos maiores produtores de mel do Brasil, tendo a apicultura uma grande importância socioeconômica para vários municípios do Estado. Conhecer os fatores que permitam o desenvolvimento da produção melífera, são essenciais para o crescimento econômico, principalmente para a apicultura ligada à agricultura familiar. As mudanças climáticas de uma região são uma das características que interferem diretamente na produção do mel. Desta forma, buscar conhecer como essas alterações podem interferir no resultado do desenvolvimento da apicultura é de fundamental importância para o setor produtivo. O uso de tecnologias de Inteligência Artificial permite a execução de atividades como reconhecimento de padrões e predições de valores a partir de séries temporais. Neste trabalho foram investigadas combinações de modelos de Redes Neurais (CNN-Dense; GRU-Dense e LSTM-Dense), com o intuito de determinar qual apresenta melhor desempenho na predição do quantitativo de mel produzido com base nos dados climáticos diários. Neste trabalho, usamos como estudo de casos, dados da região de Piracuruca. As redes estudadas obtiveram resultados nos índices de erro médio quadrático – RMSE (Root Mean Squared Error) e desvio padrão da produção inferiores a 3% do valor da produção para um período estudado. Dos modelos propostos no estudo, pode-
se destacar o modelo LSTM-Dense, do qual se obteve os melhores resultados nos índices estudados, principalmente no índice R2, que representa o coeficiente de determinação, obtendo uma precisão de 99,999% quando comparado aos resultados encontrados da produção pela rede neural com os dados conhecidos da base de teste. Demonstrou-se assim a eficiência no uso dos modelos de Redes Neurais para o reconhecimento de padrões climáticos na predição da produção de mel.
ABSTRACT The State of Piauí is one of the largest producers of honey in Brazil, with beekeeping having a great socioeconomic importance for several municipalities in the State. Knowing the factors that allow the development of honey production are essential for economic growth, especially for beekeeping linked to family farming. The climatic changes in a region are one of the characteristics that directly interfere in the production of honey. In this way, seeking to know how these changes can interfere with the result of the development of beekeeping is of fundamental importance for the productive sector. The use of Artificial Intelligence technologies allows the execution of activities such as pattern recognition and value predictions from time series. In this work, combinations of Neural Networks models (CNN-Dense; GRU-
Dense and LSTM-Dense) were investigated, in order to determine which, one has the best performance in predicting the quantity of honey produced based on daily climate data. In this work, we used data from the Piracuruca region as a case study. The studied networks obtained results in the root mean squared error – RMSE (Root Mean Squared Error) and production standard deviation lower than 3% of the production value for a studied period. Of the models proposed in the study, the LSTM-Dense model can be highlighted, from which the best results were obtained in the studied indices, mainly in the R2 index, which represents the coefficient of determination, obtaining a precision of 99.999% when compared to the results found output by the neural network with the known data from the test base. Thus, it was demonstrated the efficiency in the use of Neural Network models for the recognition of climatic patterns in the prediction of honey production.
Orientador: Prof. Dr. Aldir Silva Sousa
Examinador interno: Prof. Dr. José Medeiros de Araújo Junior
Examinador interno: Prof. Dr. Antônio Helson Mineiro Soares
2023-11-13T00:00:00ZUMA ABORDAGEM BASEADA EM COEFICIENTES DE FREQUÊNCIA MEL CEPSTRAIS E MODELOS DE APRENDIZADO DE MÁQUINA PARA LOCALIZAÇÃO DE FALTAS EM LINHA DE TRANSMISSÃO DE ALTA TENSÃO
http://hdl.handle.net/123456789/3481
UMA ABORDAGEM BASEADA EM COEFICIENTES DE FREQUÊNCIA MEL CEPSTRAIS E MODELOS DE APRENDIZADO DE MÁQUINA PARA LOCALIZAÇÃO DE FALTAS EM LINHA DE TRANSMISSÃO DE ALTA TENSÃO
MARQUES, José de Anchieta Araújo
Resumo
Faltas nas Linhas de Transmissão (LTs) podem causar grandes prejuízos aos usuários e aos
gestores de Sistemas Elétricos de Potência (SEP). Dessa forma, é de suma importância tornar o
processo de localização de tais faltas cada vez mais eficiente, para que estas possam ser reparadas
o mais rápido possível. No presente estudo, foram aplicados os Coeficientes de Frequência Mel
Cepstrais (MFCC) como ferramenta de pré-processamento dos sinais de tensão coletados nos
dois terminais da linha de transmissão durante a falta, além de um modelo de Aprendizado de
Máquina (AM), responsável pela localização das faltas na prática. Foram testados diferentes
modelos de AM, quais sejam: Rede Neural Artificial (RNA), Regressão de Vetores de Suporte
(SVR) e Regressão de Vetores de Suporte com Mínimos Quadrados (LS-SVR), dentre os quais se
percebeu que a RNA teve o melhor resultado geral, sendo capaz de processar todas as simulações.
Utilizou-se uma linha de transmissão modelada com base em parâmetros de uma linha real. No
MATLAB, vários cenários foram simulados com a RNA, que apresentou os melhores resultados
iniciais, e o método proposto forneceu resultados com alta precisão na localização de faltas em
ambientes não ruidosos, com Erro Médio Relativo (EMR) geral de 0,00004 % e Erro Médio
Absoluto (EMA) geral de 0,13 m. Posteriormente, foram verificadas as influências do tipo de
falta, das resistências de faltas, dos ângulos de faltas e das distâncias de faltas no método de
localização, utilizando-se os resultados da melhor arquitetura da RNA. O método proposto
demonstrou ainda ser capaz de realizar a detecção rápida e precisa de faltas, mesmo quando
considerados percentuais pequenos da base de dados ou/e a partir da adição de várias relações
sinais-ruídos aos sinais de tensão. Esses resultados apontam que o procedimento metodológico
proposto é uma boa alternativa para localização de faltas em LT.
Abstract
Faults in transmission lines (TLs) may cause great loss to users and to managers of Electric
Power Systems (EPS). Thus, it is important to make the process of locating these faults more
efficient, in order to repair them as quickly as possible. In the present study, Mel Frequency
Cepstral Coefficients (MFCC) were used as a tool for processing voltage signals collected on
both of the trasmission line terminals during faults, in addition to an Machine Learning (AM)
model, responsible for locating faults in practice. Different AM models were tested, namely:
an Artificial Neural Network (ANN), a Support Vector Regression (SVR) and a Least Squares
Support Vector Regression (LS-SVR), among which it was noticed that the ANN had the best
overall result, being able to process all simulations. A modeled line based on parameters of a
real line was used as well. Several scenarios were performed on MATLAB and the proposed
method provided results with high precision in locating faults in enviroments without noise, with
a Mean Relative Error (MRE) of 0.00004 % and a Mean Absolute Error (MAE) of 0.13 meters.
Subsequently, the influences of fault’s types, of fault’s resistances, of fault’s angles and of fault’s
distances in the location method were evaluated, through the results of the best ANN architecture.
The proposed method was still able to detect the falts quickly and precisely, even with small
percenteges of the data base and/or different signal to noise ratio. These results indicate that the
proposed methodological procedure is a good alternative for fault location in LT.
Orientador: Prof. Dr. Hermes Manoel Galvão C. Branco
Prof. Dr. Ricardo de Andrade Lira Rabelo
Examinador: Prof. Dr. Aryfrance Rocha Almeida
Examinador: Prof. Dr. Vinicius Ponte Machado
2023-11-10T00:00:00ZROTULAÇÃO E RECONHECIMENTO DE ENTIDADES CLÍNICAS EM PORTUGUÊS ATRAVÉS DE MODELOS DE APRENDIZADO PROFUNDO
http://hdl.handle.net/123456789/3292
ROTULAÇÃO E RECONHECIMENTO DE ENTIDADES CLÍNICAS EM PORTUGUÊS ATRAVÉS DE MODELOS DE APRENDIZADO PROFUNDO
SOUSA, Orrana Lhaynher Veloso de
RESUMO: Os sistemas de registro eletrônico de saúde (EHR) têm sido amplamente utilizados na prática
médica, o que gerou um grande volume de dados não estruturados contendo abreviaturas, termos
ambíguos e erros de digitação. Assim, a classificação automática de dados médicos em categorias
clínicas informativas pode reduzir substancialmente o custo dessa tarefa. Além disso, tarefas de
Processamento de Linguagem Natural (NLP) e Aprendizado de Máquina (ML), como o Reconhecimento
de Entidade Nomeada (NER), têm sido usadas para processar esses dados. Em receitas
médicas, por exemplo, é possível a extração de informações úteis para a farmacovigilância e
o desenvolvimento de sistemas de apoio a tomada de decisão. Nesse contexto, este trabalho
emprega uma metodologia que engloba desde a construção da base de dados até o processamento
dos textos clínicos em português. Essa metodologia é dividida em duas etapas. Na etapa inicial,
é investigada a utilização de uma ensemble de classificação para categorizar textos clínicos
nas classes receitas, notas clínicas e solicitações de exames. Para isso, utilizamos diferentes
combinações de métodos de vetorização para representar o texto. Em uma das combinações,
analisamos o uso do framework Snorkel para supervisão fraca. Em seguida, a ensemble formada
pelos algoritmos Máquina de Vetores de Suporte, Floresta Aleatória e Perceptron Multicamadas
realiza a classificação. Na segunda etapa, técnicas de ML e aprendizado profundo (DL) são
avaliadas para a extração de entidade clínicas nomeadas de receitas médicas. Cinco combinações
de métodos de extração de características com classificadores foram avaliadas: características
customizadas com os modelos Perceptron, Multinomial Naive Bayes e Campos Aleatórios
Condicionais, as embeddings Glove com a rede neural BiLSTM, e uma versão com ajuste fino
do BERTimbau. Os resultados alcançados com esta metodologia foram promissores, atingindo
uma precisão de 1,00, kappa de 0,99 e F1-score de 1,00 na etapa de classificação, enquanto os
modelos de DL obtiveram F1-score de 0,99 na extração das entidades. Assim, concluímos que
nossa abordagem permite a classificação automática e precisa do conteúdo de textos clínicos,
alcançando melhores resultados de categorização do que as abordagens únicas avaliadas; e o uso
de embeddings de palavras e modelos de aprendizado profundo produzem melhores resultados
no reconhecimento de entidades clínicas em português do que abordagens de ML.
ABSTRACT: The medical practice widely uses Electronic Health Record (EHR) systems, which has generated
a large volume of unstructured data containing abbreviations, ambiguous terms, and typing
errors. Thus, the automatic classification of medical data into informative clinical categories
can substantially reduce the cost of this task. Furthermore, researchers use Natural Language
Processing (NLP) and Machine Learning (ML) tasks such as Named Entity Recognition (NER)
to process this data, for example, the useful information extraction for pharmacovigilance and
the development of decision-making support systems from medical prescriptions. This work
employs a methodology from database construction to processing clinical texts in Portuguese.
This methodology has two stages. In the initial stage, we adopt a classification ensemble to
categorize clinical texts in the following classes: prescriptions, clinical notes, and exam requests.
To this end, we use different vectorization methods to represent the text, supported by the
framework Snorkel for weak supervision. Then, the ensemble formed by the Support Vector
Machine, Random Forest, and Multilayer Perceptron algorithms performs the classification. In
the second stage, we evaluate ML and Deep learning (DL) techniques for extracting named
clinical entities from medical prescriptions. We also evaluate five combinations of feature
extraction methods with classifiers: custom features with the Perceptron, Multinomial Naive
Bayes, and Conditional Random Fields models, the embeddings Glove with the BiLSTM
neural network, and a fine-tuned version of BERTimbau. The results are promising, reaching a
precision of 1.00, kappa of 0.99, and F1-score of 1.00 in the classification stage, while the DL
models obtained an F1-score of 0.99 for entity extraction. Thus, we conclude that our approach
allows the automatic and accurate classification of the content of clinical texts, achieving better
categorization results than the single evaluated approaches; and the use of word embeddings and
deep learning models produce better results for clinical entity recognition in Portuguese than ML
approaches.
Orientadora: Profa. Dra. Deborah Maria Vieira Magalhães
Coorientador: Prof. Dr. Victor Eulalio Sousa
Examinador interno: Prof. Dr. Romuere Rodrigues Veloso e Silva
Examinador interno: Prof. Dr. Rafael Torres Anchieta
2023-05-17T00:00:00ZEMPREGO DE TÉCNICA DE MODELAGEM LOCAL MÚLTIPLA INVERSA PARA IDENTIFICAÇÃO DE SISTEMAS DINÂMICOS COM OUTLIERS
http://hdl.handle.net/123456789/3263
EMPREGO DE TÉCNICA DE MODELAGEM LOCAL MÚLTIPLA INVERSA PARA IDENTIFICAÇÃO DE SISTEMAS DINÂMICOS COM OUTLIERS
PEREIRA NETO, Antonio Galeno
RESUMO: Com o crescimento de sistemas e processos não lineares, principalmente em ambientes industriais,
os estudos por novas e mais precisas técnicas de Identificação de Sistemas Dinâmicos têm
aumentado nas pesquisas. Dentre essas técnicas, as que permitem a geração de modelos locais
apresentaram grande avanço, permitindo a geração de diversos modelos lineares locais para
representar sistemas mais complexos. Também é preciso se preocupar com a inserção de ruídos
nos dados, dependendo da fonte os processos podem acabar absorvendo informações que não
são relevantes para a geração do modelo (outliers), o que pode interferir significativamente no
processo de identificação. Neste trabalho, os modelos locais múltiplos D-MKSOM e P-MKSOM
foram modificados para tratar dados discrepantes através da técnica de estimação M, passando
assim a realizar uma estimação mais robusta, originando os algoritmos RD-MKSOM e RPMKSOM,
sendo então aplicados em bases de dados com fortes não linearidades. Os dados
utilizados foram contaminados com ruído para avaliar quantitativa e qualitativamente a robustez
dos algoritmos e o comportamento do erro obtido nos testes. Para fins de comparação, a rede
neural global ELM também foi aplicada aos dados com a aplicação da técnica de estimação
M. A partir dos resultados foi observado que os algoritmos propostos levam a uma melhor
generalização a partir da análise de resíduos e robustez para inserção de outliers nos dados de
teste.
ABSTRACT: With the growth of non-linear systems and processes, especially in industrial environments,
studies for new and more accurate techniques for Dynamical Systems Identification have increased
in research. Among these techniques, the ones that allow the generation of local models
showed great progress, allowing the generation of several local linear models to represent more
complex systems. It is also necessary to be concerned with the insertion of noise in the data,
depending on the source, the processes may end up absorbing information that is not relevant
to the generation of the model (outliers), which can significantly interfere in the identification
process. In this work, the multiple local models D-MKSOM and P-MKSOM were modified
in order to handle outlier data through the M estimation technique, thus starting to perform a
more robust estimation, generating the RD-MKSOM and RP-MKSOM algorithms then they
were applied to databases with strong non-linearities. The data used were contaminated with
noise in order to quantitatively and qualitatively evaluate the robustness of the algorithms and
the behavior of the error obtained in the tests. For comparison purposes, the ELM global neural
network was also applied to the data with the application of M estimation. In the results was
observed that the proposed algorithms leads to better generalization from the residual analysis
and robustness to outliers insertion in test data.
Orientador: Prof. Dr. Luis Gustavo Mota Souza
Co-Orientador: Prof. Dr. Francisco de Assis da Silva
Examinador interno: Prof. Dr. José Maria Pires de Menezes Júnior
Examinador interno: Prof. Dr. Otacílio da Mota Almeida
Examinador externo: Prof. Dr. Amauri Holanda de Souza Júnior (IFCE)
2023-04-17T00:00:00Z