Artigo Acesso aberto Produção Nacional

AVALIAÇÃO DE PLATAFORMA DE SISTEMA DE ARQUIVOS DISTRIBUÍDOS EM CLUSTER

2019; UNIVERSIDADE ESTADUAL DE FEIRA DE SANTANA; Issue: 22 Linguagem: Português

10.13102/semic.v0i22.4185

ISSN

2595-0339

Autores

Gledson De Oliveira,

Tópico(s)

Big Data and Business Intelligence

Resumo

Análise de sentimentos (Ou também, opinion mining, ) é um campo da ciência queestuda a opinião, o comportamento, o sentimento dentre outros aspectos que as pessoasutilizam na comunicação, por exemplo (BARBOSA, 2012). Estudo de sentimentossobre as informações publicadas no twitter tem sido amplamente explorados e aplicadosna detecção de características, como determinar se um comentario foi positivo ounegativo e podem ser utilizadas para fins estratégicos em áreas comerciais, políticas,dentre outras (BARBOSA, 2012).Entretanto, esta única rede social tem gerado diariamente uma maciçaquantidade de dados, o que torna o trabalho dos engenheiros e cientistas de criar formaseficientes de armazenar, processar e recuperar informação, um grande desafio.Ainda que um sistema de cluster demonstre ser uma boa alternativa para darsuporte ao processamento de grandes quantidades de informação, os tradicionaismodelos de armazenamento de arquivos, baseados em um sistema Cliente-Servidor,demonstra ser eficiente apenas em clusters de baixa escala, já que a medida que onúmero de computadores acoplados ao sistema aumenta, é criado uma vazão derequisições para acesso a informações grande o suficiente para comprometer odesempenho do sistema (KUSZERA, 2010) . Ou seja, aplicações paralelas intensivas emdados, sob um sistema de clusters de grande porte apresentam limitações dedesempenho, ao mesmo tempo que geram baixa escalabilidade e throughput.Uma alternativa que surgiu para tratar os problemas citados acima foi autilização de sistemas de arquivos distribuídos. Neste modelo, os arquivos quearmazenam os dados são divididos entre os nós do cluster, possibilitando o acesso emparalelo de diferentes partes de um mesmo arquivo. Esta estratégia permite aumentar avazão de dados ao mesmo tempo que promove ampliação da escalabilidade do sistema(KUSZERA, 2010) . Entretanto, a complexidade desta arquitetura gera um maior grau dedificuldade para instalação, configuração e gerenciamento do sistema como um todo,dificultando a produção neste ambiente de trabalho (KUSZERA, 2010) .Nesse sentido, este trabalho objetiva investigar sistemas de arquivos distribuídosque permitam da suporte ao a trabalhos que demandam uso de uma quantidade maciçade dados, como o de análise de sentimentos, visando compreender melhor seufuncionamento e arquitetura.

Referência(s)