Artigo Acesso aberto Produção Nacional

O banco de dados do CRITT para a pesquisa do processo tradutório

2018; Linguagem: Português

10.22478/ufpb.1516-1536.2018v0n0.40080

ISSN

2763-9355

Autores

Michaël Carl, Moritz Schaeffer, Srinivas Bangalore, Traduzido por Leonardo Penha MESQUITA, Leonardo Lima Beschizza dos SANTOS,

Tópico(s)

Natural Language Processing Techniques

Resumo

Desde sua criação, há dez anos, o Center for Research and Innovation in Translation and Translation Technology (CRITT), da Copenhagen Business School (CBS), Dinamarca, está envolvido em pesquisas do processo tradutório. Os dados dessas pesquisas foram coletados inicialmente pela ferramenta Translog e publicados em 2012 como um banco de dados das pesquisas do processo tradutório (em inglês, Translation Process Research Database, ou TPR-DB). Desde 2012, outros experimentos foram realizados, e mais dados foram adicionados ao TPR-DB. Em particular, dentro do projeto CASMACAT – do inglês, Cognitive Analysis and Statistical Methods for Advanced Computer Aided Translation (SANCHIS-TRILLES et al., 2014) –, foi gravada uma grande quantidade de dados do processo de pós-edição de tradução automática, e o TPR-DB foi disponibilizado sob uma licença Creative Commons. No momento da redação deste artigo, o TPR-DB contém quase 30 estudos com tarefas de tradução, pós-edição, escrita (autoral) e/ou cópia, todas gravadas com o Translog e/ou com a ferramenta CASMACAT. Cada estudo é constituído por cerca de oito a mais de 100 sessões de gravação, envolvendo mais de 300 tradutores. Atualmente, os dados somam mais de 500 horas de produção textual reunidas em mais de 1.400 sessões, com mais de 600.000 palavras traduzidas para mais de dez línguas-alvo diferentes. Este artigo descreve os recursos e as opções de visualização do TPR-DB. Esse banco de dados contém registros do processo, bem como informações derivadas e anotadas organizadas em sete tipos de unidades simples e compostas do processo e do produto, adequadas para investigar os processos de tradução humana e assistida por computador, bem como para realizar modelagem avançada dos usuários. Palavras-chave: pesquisa empírica do processo tradutório, banco de dados de pesquisas do processo tradutório.

Referência(s)