Artigo Produção Nacional

Avaliação da anotação semântica do PALAVRAS e sua pós-edição manual para o Corpus Summ-it

2010; University of Minho; Volume: 2; Issue: 3 Linguagem: Português

10.21814/lm.2.3.74

ISSN

1647-0818

Autores

Élen Cátia Tomazela, Cláudia Dias de Barros, Lúcia Helena Machado Rino,

Tópico(s)

Linguistics and Discourse Analysis

Resumo

Este artigo apresenta uma avaliacao da anotacao semântica automatica do parser PALAVRAS e sua pos-edicao manual para um corpus de textos em portugues – o Corpus Summ-it. Essa pos-edicao visou ao aprimoramento de um modelo linguistico para a sumarizacao automatica de textos e buscou atribuir etiquetas semânticas mais adequadas aos itens lexicais, comparadas as empregadas pelo parser. Essa tarefa foi realizada por linguistas e os casos problematicos sao apresentados neste artigo, os quais levam a consideracoes sobre o proprio modelo de etiquetagem do PALAVRAS. O corpus revisado estara disponivel para a comunidade e podera ser util para varias aplicacoes de Processamento de Linguas Naturais.

Referência(s)
Altmetric
PlumX