
AVALIAÇÃO DE PLATAFORMA DE SISTEMA DE ARQUIVOS DISTRIBUÍDOS EM CLUSTER
2019; UNIVERSIDADE ESTADUAL DE FEIRA DE SANTANA; Issue: 22 Linguagem: Português
10.13102/semic.v0i22.4185
ISSN2595-0339
Autores Tópico(s)Big Data and Business Intelligence
ResumoAnálise de sentimentos (Ou também, opinion mining, ) é um campo da ciência queestuda a opinião, o comportamento, o sentimento dentre outros aspectos que as pessoasutilizam na comunicação, por exemplo (BARBOSA, 2012). Estudo de sentimentossobre as informações publicadas no twitter tem sido amplamente explorados e aplicadosna detecção de características, como determinar se um comentario foi positivo ounegativo e podem ser utilizadas para fins estratégicos em áreas comerciais, políticas,dentre outras (BARBOSA, 2012).Entretanto, esta única rede social tem gerado diariamente uma maciçaquantidade de dados, o que torna o trabalho dos engenheiros e cientistas de criar formaseficientes de armazenar, processar e recuperar informação, um grande desafio.Ainda que um sistema de cluster demonstre ser uma boa alternativa para darsuporte ao processamento de grandes quantidades de informação, os tradicionaismodelos de armazenamento de arquivos, baseados em um sistema Cliente-Servidor,demonstra ser eficiente apenas em clusters de baixa escala, já que a medida que onúmero de computadores acoplados ao sistema aumenta, é criado uma vazão derequisições para acesso a informações grande o suficiente para comprometer odesempenho do sistema (KUSZERA, 2010) . Ou seja, aplicações paralelas intensivas emdados, sob um sistema de clusters de grande porte apresentam limitações dedesempenho, ao mesmo tempo que geram baixa escalabilidade e throughput.Uma alternativa que surgiu para tratar os problemas citados acima foi autilização de sistemas de arquivos distribuídos. Neste modelo, os arquivos quearmazenam os dados são divididos entre os nós do cluster, possibilitando o acesso emparalelo de diferentes partes de um mesmo arquivo. Esta estratégia permite aumentar avazão de dados ao mesmo tempo que promove ampliação da escalabilidade do sistema(KUSZERA, 2010) . Entretanto, a complexidade desta arquitetura gera um maior grau dedificuldade para instalação, configuração e gerenciamento do sistema como um todo,dificultando a produção neste ambiente de trabalho (KUSZERA, 2010) .Nesse sentido, este trabalho objetiva investigar sistemas de arquivos distribuídosque permitam da suporte ao a trabalhos que demandam uso de uma quantidade maciçade dados, como o de análise de sentimentos, visando compreender melhor seufuncionamento e arquitetura.
Referência(s)