Artigo Acesso aberto Produção Nacional

Corpus-amostra português do século XVIII: textos antigos de Medicina em atividades de ensino e pesquisa

2018; UNIVERSIDADE FEDERAL DE UBERLÂNDIA; Volume: 12; Issue: 1 Linguagem: Português

10.14393/dl33-v12n1a2018-15

ISSN

1980-5799

Autores

María José Bocorny Finatto,

Tópico(s)

Natural Language Processing Techniques

Resumo

De acordo com os princípios da Linguística de Corpus, este artigo apresenta um conjunto de procedimentos iniciais para o desenho de um corpus composto por uma amostra de textos médicos antigos impressos em português do século XVIII sobre o tema "doenças e seus tratamentos". Este corpus-amostra será parte de um ambiente virtual dedicado ao estudo de temas históricos de Lexicologia e de Terminologia. Um estudo piloto foi conduzido para verificar as vantagens e desvantagens do tratamento de um conjunto de textos com a ortografia original e com a ortografia atualizada com o uso de duas ferramentas computacionais para processamento de corpora, AntConc e TermoStat. Os resultados iniciais indicam vantagens de se trabalhar com as formas ortográficas antigas. Finalmente, o artigo destaca a importância dos acervos históricos - especialmente em português - para diferentes tipos de pesquisas em Lexicologia e áreas afins, além de indicar a importância dos estudos diacrônicos de vocabulário e terminologias médicas em documentos antigos.

Referência(s)