
Utilização do Caminhamento Aleatório na Identificação de Características de Documentos na Língua Portuguesa
2012; Volume: 19; Issue: 1 Linguagem: Português
10.22456/2175-2745.20816
ISSN2175-2745
AutoresVagner Francisco Le Roy, Ana Paula Ladeira,
Tópico(s)Advanced Text Analysis Techniques
ResumoDevido ao grande volume de textos armazenados, a área de mineração de textos vem sendo foco de inúmeras pesquisas que visam a classificação automática de documentos. O presente trabalho tem como objetivo avaliar o método do caminhamento aleatório na definição dos pesos dos termos de textos da língua portuguesa. Esta técnica utiliza a co-ocorrência dos termos como medida de dependência entre as características das palavras. Um grafo não direcionado é utilizado, sendo que a pontuação de cada vértice é calculada em função da probabilidade de ser encontrado. Os resultados obtidos com o caminhamento aleatório foram comparados com os apresentados por técnicas tradicionais, e demonstraram que o método de caminhamento aleatório se mostrou bastante eficaz no processo de classificação de documentos.
Referência(s)