Abstract:
RESUMO: No contexto do constante crescimento da Web, diversos serviços foram virtualizados,
incluindo o surgimento do comércio eletrônico (e-commerce). Tanto tradicionalmente
quanto através de e-commerce, as pessoas necessitam comparar produtos e serviços para
nortear suas decisões por meio da análise das características desejadas. A mudança que
a Web ocasionou foi a exposição de suas opiniões em sites de compra e venda, fóruns
na Web, redes sociais ou ainda grupos de discussão, permitindo sua visualização por
qualquer pessoa que necessite. Porém, com o grande crescimento da Web, a quantidade
de dados também aumentou, impossibilitando a coleta manual dessas opiniões. Logo, a
busca automática de opiniões, promoveu o crescimento da área de Análise de Sentimentos,
a qual é responsável por criar técnicas automáticas para coletar, analisar e sumarizar as
opiniões encontradas em diversos locais na Web. Este trabalho apresenta a abordagem
TOP(X) para estimar a importância de comentários disponibilizados por clientes na Web,
por meio do uso de um sistema Fuzzy. O sistema Fuzzy possui três variáveis de entrada:
reputação do autor, número de tuplas (característica, palavra opinativa) e a porcentagem
de palavras escritas corretamente; e uma variável de saída: grau de importância do
comentário. Realizou-se também um experimento para comparar os resultados de um
método de orientação semântica executado sobre todos os comentários e sobre uma seleção
dos melhores comentários de um corpus. O experimento foi conduzido com 1620 comentários
sobre smartphones (982 positivos, 594 negativos e 44 negativos) e nossa abordagem
melhorou os resultados do método de orientação semântica em aproximadamente 10% na
medida F-measure para comentários positivos e 20% para comentários negativos. ABSTRACT: In the context of the constant growth of the Web, several services have been virtualized,
including the emergence of the e-commerce. Both traditionally and through e-commerce,
people need to compare products and services to guide their decisions using the analysis
of the desired features. The web allowed a major exposition of one’s views through sales
websites, web forums, social networks, and discussion groups, allowing their visualization
by anyone who needs it. However, with the explosive growth of the Web, the amount of
data has also increased, precluding the manual collection of these opinions. Thus, the
automatic search for reviews, promoted the growth of the Sentiment Analysis field, which
is responsible for creating automated techniques to collect, analyze and summarize the
opinions gathered in several places on the web. This work presents the TOP(X) approach
to estimate the importance of reviews provided by customers on the Web, using a fuzzy
system. The Fuzzy system has three input variables: author reputation, number of tuples
(feature, opinionative word), and percentage of correctly spelled words; and one output
variable: reviews importance. Also, an experiment was conducted in order to compare the
results of a semantic orientation method performed over all the reviews and over a selection
of the best reviews in a corpus. This experiment was conducted with 1620 reviews about
smartphones (982 positives, 594 negatives and 44 neutral) and our approach improved
the results of the semantic orientation method up to approximately 10% in f-measure for
positive reviews and 20% in f-measure for negative reviews.