Abstract:
RESUMO: No contexto do constante crescimento da Web,diversos serviços foram virtualizados, incluindo o surgimento do comércio eletrônico (e-commerce)T. anto tradicionalmente quanto por meio de e-commerce, as pessoas necessitam comparar produtos e serviços para nortear suas decisões por meio da análise das características desejadas. A mudança que a Web ocasionou foi a exposição de suas opiniões em sites de compra e venda, fóruns na Web, redes sociais ou ainda grupos de discussão, permitindo sua visualização por qualquer pessoa que necessite. Porém, com o crescimento explosivo da Web e da quantidade de dados gerada diariamente, uma análise manual dessas informações tornou-se impossível, tendo promovido o surgimento da área de Mineração de Opiniões. Um sistema de Mineração de Opiniões consiste em identificar, classificar e sumarizar as opiniões em descrições textuais de consumidores sobre produtos ou serviços. Na literatura, existem algumas abordagens utilizadas na identificação de opiniões para extrair a entidade alvo e seus aspectosa, saber: i) extração baseada em frequência; ii) extração baseada nas relações sintáticas; iii) extração usando aprendizado supervisionado; e iv) extração usando modelos de tópicos. Este trabalho apresenta uma análise comparativa entre as principais abordagens usadas na tarefa de extração de aspectos em relatos sobre produtos e serviços em sites Web. Nessa
Dissertação foram implementadas adaptações de quatro métodos de extração de aspectos e avaliados em dois Corpora distintos,sendo um em português e outro em inglês.Nos experimentos realizados observou-se que o método usando aprendizado supervisionado (redes neurais convolucionais) obteve melhores resultados sobre os demais. ABSTRACT: In the context of the constant growth of the Web, several services have been virtualized, including the emergence of e-commerce. Both traditionally and through e-commerce, people need to compare products and services to guide their decisions using the analysis of the desired features. The change that the Web caused was the exposure of their opinions on websites of buy and sell, Web forums, social networks or even discussion groups, allowing their visualization by anyone who needs. However, with the explosive growth of the Web and the amount of data generated daily, a manual analysis of this information became impossible, having promoted the emergence ofthe Opinion Mining field.An Opinion Mining system consists of identifying,classifying and summarizing opinions in textual descriptions of consumers about products or services. In the literature, there are some approaches used at the identification ofopinions to extract the target entity and its aspects, namely: i) frequency-based extraction; ii) extraction based on syntactic relations; iii) extraction using supervised learning; and iv) extraction using topic models. This work presents a comparative analysis between the main approaches used at the task of Extraction of Aspects in reports about products and services on web sites. On this dissertation were implemented adaptations of four methods of extraction of aspects and evaluated in two distinct Corpora, one in Portuguese and another in English. On the experiments performed it was observed that the method using supervised learning (convolutional neural networks) obtained better results on the others.