Artigo Acesso aberto Produção Nacional Revisado por pares

WORD SKETCH COMO FERRAMENTA PARA EXTRAÇÃO DE COLOCAÇÕES

2020; Grupo de Estudos Linguísticos do Estado de São Paulo; Volume: 17; Issue: 2 Linguagem: Português

10.21165/gel.v17i2.2771

ISSN

1984-591X

Autores

Manuela Arcos, Marine Laísa Matte,

Tópico(s)

Natural Language Processing Techniques

Resumo

Neste trabalho, descrevemos métodos de identificação e extração de colocações em corpora textuais de língua geral, produzidas por aprendizes de língua inglesa em textos acadêmicos, e de colocações especializadas da área da Conservação e Restauração de Patrimônio Cultural por meio da ferramenta Word Sketch (WS), do software Sketch Engine. Ao entendermos colocações como palavras que frequentemente ocorrem juntas em função do seu grau de atração semântica, o objetivo deste trabalho é demonstrar como a ferramenta WS permite a identificação e extração de colocações de uma forma semiautomática, uma vez que, após a extração, é papel do pesquisador levar em conta os demais critérios constituintes de uma colocação. Sejam de língua geral ou de língua de especialidade, as colocações são unidades constituídas por critérios sintático-semânticos, pragmáticos e discursivos. Como aporte teórico-metodológico, apoiamo-nos na Linguística de Corpus e buscamos estabelecer critérios para a extração de colocações através da ferramenta WS. Nossos resultados indicam que a ferramenta WS é eficaz para a tarefa de extração de colocações tanto de escrita acadêmica como de linguagem especializada, pois permite que a identificação das unidades parta de seus critérios de constituição.

Referência(s)
Altmetric
PlumX