
A terminologia na era da informática
2006; Brazilian Society for the Advancement of Science; Volume: 58; Issue: 2 Linguagem: Português
ISSN
2317-6660
AutoresGladis Maria de Barcellos Almeida, Leandro Henrique Mendonça de Oliveira, Sandra Maria Aluísio,
Tópico(s)Web Applications and Data Management
ResumoA terminologia e a informatica nao sao independentes uma da outra. Desde 1960, em paises desenvolvidos e com grande tradicao em pesquisa terminologica, os dois campos de estudo estao ligados de forma a facilitar o armazenamento e a difusao de dados terminologicos na elaboracao de grandes bases de dados especializados, denominados bancos de terminologia (1). A integracao entre as duas areas e tal que se cunhou o termo terminotica, dando origem a um novo conceito e inaugurando um n ovo paradigma metodologico nas pesquisas terminologicas. A contribuicao advinda da informatica comeca de fato a aparecer nas pesquisas terminologicas no Brasil nos ultimos dez anos. O crescimento de estudos e pesquisas na area de linguistica computacional e linguistica de corp u s e o consequente aprimoramento e desenvolvimento de ferramentas computacionais voltadas para o processamento de lingua natural (PLN) do portugues passam a interferir diretamente na pratica terminografica. Nesse sentido, a terminologia descritiva de vies linguistico comeca a ter um amplo desenvolvimento, ja que a possibilidade de lidar com grandes corpora permite a observacao e descricao de fenomenos linguisticos re c o r re n t e s antes impossivel de perceber, dado que os procedimentos de observacao e descricao contavam apenas com recursos manuais. Entendemos que fazer terminologia na era da informatica significa criar um conjunto de procedimento automatizados ou semi-automatizados que deem suporte as tarefas envolvidas no trabalho terminologico, quais sejam: 1. criacao de c o rp o ra d e sc a rt aveis; 2. extracao automatica de candidatos a termos desses corpora; 3. insercao dos termos numa ontologia (mapa conceitual); 4. elaboracao e edicao de fichas terminologicas; 5. elaboracao e constante atualizacao da base definicional (2); 6. elaboracao de definicoes; 7. edicao de verbetes, 8. difusao dos dados para intercâmbio com outras aplicacoes ou usuarios. Nosso objetivo aqui e apresentar ambientes e/ou ferramentas que dao suporte as tarefas citadas acima, se nao a todas, pelo menos a algumas delas e, sempre que possivel, apontaremos os trabalhos referentes ao portugues. Desenvolvido pela Faculdade de Letras da Universidade do Porto (FLUP), o Corpografo (3, 4, 5) e um gestor de corpus que se encontra, atualmente, na versao 3.0 e e otimizado para pesquisas terminologicas, isto e, para a extracao de termos e sua organizacao em bases de dados. Fornece um ambiente web integrado para o manejo de corpus, disponibilizando ferramentas para processamento de corpus. Dentre as ferramentas que possui, estao concordanciadores, contadores de frequencia e, tambem, ferramentas de pre-processamento de corpus, como as de limpeza e sentenciadores. Toda funcionalidade do corpografo esta associada a um dos quatro ambientes de trabalho ou modulos: gestor de arquivos e de corpus, pesquisa em corpus, centro de conhecimento, centro de documentacao, o que diminui a sobrecarga ao se
Referência(s)