Artigo Acesso aberto Produção Nacional

PROCESSO DE CLASSIFICAÇÃO DE TEXTO

2020; Linguagem: Português

10.48090/ciki.v1i1.867

ISSN

2318-5376

Autores

Márcio Crescêncio, Alexandre Leopoldo Gonçalves, José Leomar Todesco,

Tópico(s)

Media and Communication Studies

Resumo

O objetivo desse artigo foi desenvolver um experimento com a análise de sentimento das opiniões no TripAdvisor® sobre a atração Oktoberfest Blumenau utilizando a Mineração de Dados e Aprendizado de Máquina através de um processo de Descoberta de Conhecimento em Dados. Duas abordagens de classificação supervisionada de sentimento foram implementadas em Python®, o modelo probabilístico baseado no algoritmo Multinomial Naïve Bayes e o modelo de representação vetorial de palavras usando o Word2Vec. O desempenho dos modelos foi avaliado e comparado usando as métricas: Acurácia, Precisão, Recall e F-score. O modelo probabilístico alcançou acurácia de 90%, enquanto o modelo de rede neural recorrente LSTM foi de 92%. O sentimento nas opiniões é positivo para as características da festa típica alemã, a variedade e quantidade de bebidas, as músicas e a animação. O sentimento é negativo para filas nos banheiros e a superlotação aos sábados à noite.

Referência(s)