Bifid: un alineador de corpus paralelo a nivel de documento, oración y vocabulario

2012; University of Minho; Volume: 4; Issue: 2 Linguagem: Espanhol

10.21814/lm.4.2.142

ISSN

1647-0818

Autores

Rogelio Nazar,

Tópico(s)

Semantic Web and Ontologies

Resumo

Este articulo presenta un algoritmo que integra distintos aspectos del procesamiento de corpus paralelo y que ha sido implementado como una aplicacion web. El trabajo se enmarca en la linguistica computacional pero puede interesar a terminologos, traductores y estudiantes de lenguas extranjeras. El sistema esta disenado para operar con cualquier par de lenguas ya que es exclusivamente estadistico. Acepta como entrada un corpus paralelo definido como un conjunto de documentos en una lengua A y sus traducciones en una lengua B. Sin requerir mas especificaciones, el sistema puede separar el conjunto de documentos en las dos lenguas, alinear cada documento con su traduccion y luego alinear los segmentos dentro de cada par de documentos para producir finalmente un vocabulario bilingue que incluye unidades polilexicas.

Referência(s)
Altmetric
PlumX