Artigo Acesso aberto Produção Nacional

Utilização do Caminhamento Aleatório na Identificação de Características de Documentos na Língua Portuguesa

2012; Volume: 19; Issue: 1 Linguagem: Português

10.22456/2175-2745.20816

ISSN

2175-2745

Autores

Vagner Francisco Le Roy, Ana Paula Ladeira,

Tópico(s)

Advanced Text Analysis Techniques

Resumo

Devido ao grande volume de textos armazenados, a área de mineração de textos vem sendo foco de inúmeras pesquisas que visam a classificação automática de documentos. O presente trabalho tem como objetivo avaliar o método do caminhamento aleatório na definição dos pesos dos termos de textos da língua portuguesa. Esta técnica utiliza a co-ocorrência dos termos como medida de dependência entre as características das palavras. Um grafo não direcionado é utilizado, sendo que a pontuação de cada vértice é calculada em função da probabilidade de ser encontrado. Os resultados obtidos com o caminhamento aleatório foram comparados com os apresentados por técnicas tradicionais, e demonstraram que o método de caminhamento aleatório se mostrou bastante eficaz no processo de classificação de documentos.

Referência(s)